Questa sezione del portale contiene i riferimenti e, in alcuni casi, i collegamenti ai diversi tipi di corpora utilizzati dai membri delle diverse unità.

I corpora indicati sono stati utilizzati per le ricerche sui tipi di comunità analizzati nell’ambito del progetto PRIN La pratica della scrittura come forza sociolinguistica dinamica.

I corpora raccolgono dunque diversi tipi di testi raccolti e ordinati come indicato nella tabella sottostante.

La tabella contiene informazioni relativamente a

riferimenti bibliografici ed edizioni critiche dei testi, se presenti,
tipologia di testi,
lingua di redazione,
area geografica di produzione,
datazione,
eventuali link di collegamento ai corpora per la consultazione
unità di ricerca che ha condotto l’analisi sui diversi testi.

Glossario bergamasco medievale	Descrizione del corpus: il corpus contiene l'edizione digitale del Glossario Bergamasco Medioevale di Antonio Tiraboschi, attualmente conservato presso la Biblioteca Civica Angelo Mai di Bergamo, e costituito da quattro quaderni manoscritti, all’interno dei quali sono registrati oltre 1500 lemmi organizzati alfabeticamente. Tipologia di testi: lemmi. Lingua: italiano. Area di produzione: Bergamo e provincia Datazione dei lemmi: XII-XV secolo. Autore: Antonio Tiraboschi. Numero documenti/lemmi: 2500. Riferimenti bibliografici: inedito. Unità di ricerca: Bergamo. Link al corpus: https://www.mediling.eu/glossariobergamascomedievale
Pergamene degli archivi di Bergamo. Anni 746-1000	Descrizione: il corpus contiene le pergamene degli archivi di Bergamo, una serie di documenti notarili redatti tra il 740 e il 1000. Tipologia di testi: atti notarili. Lingua: latino. Area di produzione: Bergamo e provincia Datazione: XVII-X secolo. Autore: vari. Numero documenti:212. Riferimenti bibliografici: Cortesi, Maria Rosa (a c. di). Edizione di Maria Luisa Bosco, Patrizia Cancian, Donatella Frioli, Gilda Mantovani.1988. Pergamene degli Archivi di Bergamo. 740-1000. Bergamo, Bolis. Unità di ricerca: Bergamo.
Pergamene degli archivi di Bergamo. Anni 1002-1058	Descrizione: il corpus contiene le pergamene degli archivi di Bergamo, una serie di documenti notarili redatti tra il 1002e il 1058. Tipologia di testi: atti notarili. Lingua: latino. Area di produzione: Bergamo e provincia Datazione: XI secolo. Autore: vari. Numero documenti:288. Riferimenti bibliografici: Cortesi, Maria Rosa e Alessandro Pratesi (a c. di). Edizione critica di Cristina Carbonetti Vendittelli, Rita Cosma, Marco Vendittelli. 1995. Pergamene degli Archivi di Bergamo. 1002-1058. Bergamo, Provincia di Bergamo. Unità di ricerca: Bergamo. Link al corpus: https://www.lombardiabeniculturali.it/cdlm/edizioni/bg/bergamo-pergamene2-1/
Pergamene degli archivi di Bergamo. Anni 1059-1110	Descrizione: il corpus contiene le pergamene degli archivi di Bergamo, una serie di atti notarili redatti tra il 1059 e il 1100. Tipologia di testi: atti notarili. Lingua: latino. Area di produzione: Bergamo e provincia Datazione: XI secolo. Autore: vari. Numero documenti:287. Riferimenti bibliografici: Cortesi, Maria Rosa e Alessandro Pratesi.(a c. di). Edizione critica di Giuliana Ancidei, Cristina Carbonetti Vendittelli, Rita Cosma.2000, Pergamene degli Archivi di Bergamo, 1059-1110. Bergamo, Provincia di Bergamo. Unità di ricerca: Bergamo. Link al corpus: https://www.lombardiabeniculturali.it/cdlm/edizioni/bg/bergamo-pergamene2-2/
ASMi, Carteggio visconteo-sforzesco, Carteggio interno, Cremona	Descrizione: il corpus contiene la corrispondenza tra monache cremonesi e personaggi a vario titolo rappresentanti del ducato di Milano. Tipologia di testi: corrispondenza. Lingua:italiano. Area di produzione: Cremona e area relativa al ducato di Milano. Datazione: XV secolo. Autore: vari. Numero documenti: 109. Riferimenti bibliografici: Inedito. Unità di ricerca: Bergamo.
Atti notarili rogati a Chio. Raffaele De Casanova. XIV secolo	Descrizione: una serie di atti notarili rogati a Chio nel XIV secolo dal notaio Raffaele De Casanova. Lingua: latino. Area di produzione: Genova e Chio. Datazione: XIV secolo. Autore: Raffaele De Casanova. Numero documenti: 30. Riferimenti bibliografici: L. Balletto (a c. di), 2015, Notai genovesi in oltremare. Atti rogati a Chio nel XIV secolo dal notaio Raffaele De Casanova, Bordighera, Istituto Internazionale di Studi Liguri. Unità di ricerca: Bergamo.
Atti notarili rogati a Chio.Giuliano De Canella. XIV secolo	Descrizione: una serie di atti notarili rogati a Chio nel XIV secolo dal notaio Giuliano De Canella. Lingua: latino. Area di produzione: Genova e Chio. Datazione: XIV secolo. Autore: Giuliano De Canella. Numero documenti: 15. Riferimenti bibliografici: E. Basso (ed.), 1993, Notai genovesi in oltremare. Atti rogati a Chio da Giuliano de Canella, Atene, Accademia Ligure di Scienze e Lettere. Unità di ricerca: Bergamo.
Atti notarili rogati a Cipro. Lamberto di Sambuceto. XIV secolo	Descrizione: una serie di atti notarili rogati a Cipro nel XIV secolo dal notaio Lamberto di Sambuceto. Lingua: latino. Area di produzione: Genova e Cipro. Datazione: XIV secolo. Autore: Lamberto di Sambuceto. Numero documenti: 45. Riferimenti bibliografici: R. Pavoni (ed.), 1982, Notai genovesi in oltremare. Atti rogati a Cipro da Lamberto di Sambuceto, Genova, Istituto di paleografia e storia medievale. Unità di ricerca: Bergamo.

CLaSSES: Corpus for Latin Sociolinguistic Studies on Epigraphic textS

CLaSSES è un database specificamente progettato per ottenere informazioni sull’analisi sistematica delle variazioni ortografiche attestate nelle iscrizioni latine. Questo corpus va inteso come una risorsa per gli studi linguistici che mirano a indagare le possibili correlazioni tra la gamma di variazioni ortografiche di fonti epigrafiche latine e la complessità del contesto sociolinguistico di riferimento. Il corpus contiene iscrizioni latine risalenti al periodo che va dal 350 a.C. a circa il 50 d.C., documentate soprattutto a Roma e nell’Italia centrale. Al fine di effettuare analisi quantitative e qualitative, tutti i testi epigrafici sono stati riccamente annotati con una serie di informazioni sia linguistiche che extra-linguistiche. Il sistema di interrogazione del corpus permette di ottenere informazioni in merito ai fenomeni di variazione linguistica attestati nelle iscrizioni in relazione a diversi parametri, tra cui la tipologia di testi, la loro origine e la collocazione cronologica. Questa risorsa permette inoltre l’esportazione di diversi dati rilevanti per l’analisi linguistica.

Il corpus è accessibile all’indirizzo http://CLaSSES-Latin-Linguistics.fileli.unipi.it

DiSCIS: DIachronic Sociopragmatic Corpus of Imaginary Speech

DiSCIS è un corpus socio-pragmaticamente annotato che attualmente comprende una selezione di commedie plautine (per il latino) e di Goldoni (per l’italiano del XVIII secolo), ossia testi letterari che contengono però dati mimetici dell’oralità – ciò che Culpeper & Kytö (2000) chiamano constructed imaginary speech.

Oltre alla lematizzazione e all’annotazione per parti del discorso (PoS tagging), è stato predisposto un tagset che fornisca informazioni relative allo status sociolinguistico dei personaggi (genere, età, ceto sociale); al tipo di atto linguistico; alle funzioni pragmatiche di elementi non proposizionali, che possono avere funzioni testuali, modali e interpersonali; alla presenza di fenomeni di contatto con il greco (in Plauto) o con il francese o il dialetto veneziano (in Goldoni). Inoltre, gli elementi che rivestono una funzione discorsivo-pragmatica sono stati annotati anche in base alla posizione che occupano nella frase, in modo da rendere possibile la ricerca di possibili associazioni nella periferia destra o sinistra e le loro funzioni a livello discorsivo e/o pragmatico.

Il corpus è accessibile qui: www.mediling.eu/corpusdiscis

Sardinian Medieval Corpus

Il Sardinian Medieval Corpus è in via di sviluppo. Attualmente è consultabile per forme la Carta de Logu, edita sulla base dell’incunabolo BUC, Inc, 230. Il documento è stato etichettato secondo le specifiche TEI/XML che consentono di preservare l’informazione filologica rilevante. Il sistema di interrogazione è basato su XQuery, e il database è stato creato tramite eXistDB. Etichettatura, sistema di interrogazione e di gestione del database sono su base open source e consentono un’implementazione successiva dell’etichettatura ai vari livelli di analisi linguistica. Tra i testi analizzati e digitalizzati, il primo ad essere pubblicato sarà per l'appunto la Carta de Logu. La pubblicazione avverrà nel corso del 2016, non appena si avrà il permesso dell’editore presso il quale l'edizione critica è in corso di pubblicazione. Sono attualmente consultabili alcune immagini (screenshot) che mostrano rispettivamente

PARVA

Il corpus PARVA (Partigiani Valcamonica) è un corpus che raccoglie dati di parlato e comprende circa 15 ore di interviste semi-guidate a 24 ex partigiani che vivono in Valle Camonica (Brescia). Questo strumento raccoglie dati che costituiscono un interessante banco di prova per esplorare code-switching e altri fenomeni di contatto tra l’italiano e il dialetto bresciano.

L'accesso al corpus è riservato agli utenti abilitati che hanno compilato e inviato a federica.guerini@unibg.it il modulo di richiesta in formato pdf o in formato word.