Questa sezione del portale contiene i riferimenti e, in alcuni casi, i collegamenti ai diversi tipi di corpora utilizzati dai membri delle diverse unità.
I corpora indicati sono stati utilizzati per le ricerche sui tipi di comunità analizzati nell’ambito del progetto PRIN La pratica della scrittura come forza sociolinguistica dinamica.
I corpora raccolgono dunque diversi tipi di testi raccolti e ordinati come indicato nella tabella sottostante.
La tabella contiene informazioni relativamente a
Glossario bergamasco medievale |
Descrizione del corpus: il corpus contiene l'edizione digitale del Glossario Bergamasco Medioevale di Antonio Tiraboschi, attualmente conservato presso la Biblioteca Civica Angelo Mai di Bergamo, e costituito da quattro quaderni manoscritti, all’interno dei quali sono registrati oltre 1500 lemmi organizzati alfabeticamente. Tipologia di testi: lemmi. Lingua: italiano. Area di produzione: Bergamo e provincia Datazione dei lemmi: XII-XV secolo. Autore: Antonio Tiraboschi. Numero documenti/lemmi: 2500. Riferimenti bibliografici: inedito. Unità di ricerca: Bergamo. Link al corpus: https://www.mediling.eu/glossariobergamascomedievale |
Pergamene degli archivi di Bergamo. Anni 746-1000 |
Descrizione: il corpus contiene le pergamene degli archivi di Bergamo, una serie di documenti notarili redatti tra il 740 e il 1000. Tipologia di testi: atti notarili. Lingua: latino. Area di produzione: Bergamo e provincia Datazione: XVII-X secolo. Autore: vari. Numero documenti:212. Riferimenti bibliografici: Cortesi, Maria Rosa (a c. di). Edizione di Maria Luisa Bosco, Patrizia Cancian, Donatella Frioli, Gilda Mantovani.1988. Pergamene degli Archivi di Bergamo. 740-1000. Bergamo, Bolis. Unità di ricerca: Bergamo. |
Pergamene degli archivi di Bergamo. Anni 1002-1058 |
Descrizione: il corpus contiene le pergamene degli archivi di Bergamo, una serie di documenti notarili redatti tra il 1002e il 1058. Tipologia di testi: atti notarili. Lingua: latino. Area di produzione: Bergamo e provincia Datazione: XI secolo. Autore: vari. Numero documenti:288. Riferimenti bibliografici: Cortesi, Maria Rosa e Alessandro Pratesi (a c. di). Edizione critica di Cristina Carbonetti Vendittelli, Rita Cosma, Marco Vendittelli. 1995. Pergamene degli Archivi di Bergamo. 1002-1058. Bergamo, Provincia di Bergamo. Unità di ricerca: Bergamo. Link al corpus: https://www.lombardiabeniculturali.it/cdlm/edizioni/bg/bergamo-pergamene2-1/ |
Pergamene degli archivi di Bergamo. Anni 1059-1110 |
Descrizione: il corpus contiene le pergamene degli archivi di Bergamo, una serie di atti notarili redatti tra il 1059 e il 1100. Tipologia di testi: atti notarili. Lingua: latino. Area di produzione: Bergamo e provincia Datazione: XI secolo. Autore: vari. Numero documenti:287. Riferimenti bibliografici: Cortesi, Maria Rosa e Alessandro Pratesi.(a c. di). Edizione critica di Giuliana Ancidei, Cristina Carbonetti Vendittelli, Rita Cosma.2000, Pergamene degli Archivi di Bergamo, 1059-1110. Bergamo, Provincia di Bergamo. Unità di ricerca: Bergamo. Link al corpus: https://www.lombardiabeniculturali.it/cdlm/edizioni/bg/bergamo-pergamene2-2/ |
ASMi, Carteggio visconteo-sforzesco, Carteggio interno, Cremona |
Descrizione: il corpus contiene la corrispondenza tra monache cremonesi e personaggi a vario titolo rappresentanti del ducato di Milano. Tipologia di testi: corrispondenza. Lingua:italiano. Area di produzione: Cremona e area relativa al ducato di Milano. Datazione: XV secolo. Autore: vari. Numero documenti: 109. Riferimenti bibliografici: Inedito. Unità di ricerca: Bergamo. |
Atti notarili rogati a Chio. Raffaele De Casanova. XIV secolo |
Descrizione: una serie di atti notarili rogati a Chio nel XIV secolo dal notaio Raffaele De Casanova. Lingua: latino. Area di produzione: Genova e Chio. Datazione: XIV secolo. Autore: Raffaele De Casanova. Numero documenti: 30. Riferimenti bibliografici: L. Balletto (a c. di), 2015, Notai genovesi in oltremare. Atti rogati a Chio nel XIV secolo dal notaio Raffaele De Casanova, Bordighera, Istituto Internazionale di Studi Liguri. Unità di ricerca: Bergamo. |
Atti notarili rogati a Chio.Giuliano De Canella. XIV secolo |
Descrizione: una serie di atti notarili rogati a Chio nel XIV secolo dal notaio Giuliano De Canella. Lingua: latino. Area di produzione: Genova e Chio. Datazione: XIV secolo. Autore: Giuliano De Canella. Numero documenti: 15. Riferimenti bibliografici: E. Basso (ed.), 1993, Notai genovesi in oltremare. Atti rogati a Chio da Giuliano de Canella, Atene, Accademia Ligure di Scienze e Lettere. Unità di ricerca: Bergamo. |
Atti notarili rogati a Cipro. Lamberto di Sambuceto. XIV secolo |
Descrizione: una serie di atti notarili rogati a Cipro nel XIV secolo dal notaio Lamberto di Sambuceto. Lingua: latino. Area di produzione: Genova e Cipro. Datazione: XIV secolo. Autore: Lamberto di Sambuceto. Numero documenti: 45. Riferimenti bibliografici: R. Pavoni (ed.), 1982, Notai genovesi in oltremare. Atti rogati a Cipro da Lamberto di Sambuceto, Genova, Istituto di paleografia e storia medievale. Unità di ricerca: Bergamo. |
CLaSSES: Corpus for Latin Sociolinguistic Studies on Epigraphic textS
CLaSSES è un database specificamente progettato per ottenere informazioni sull’analisi sistematica delle variazioni ortografiche attestate nelle iscrizioni latine. Questo corpus va inteso come una risorsa per gli studi linguistici che mirano a indagare le possibili correlazioni tra la gamma di variazioni ortografiche di fonti epigrafiche latine e la complessità del contesto sociolinguistico di riferimento. Il corpus contiene iscrizioni latine risalenti al periodo che va dal 350 a.C. a circa il 50 d.C., documentate soprattutto a Roma e nell’Italia centrale. Al fine di effettuare analisi quantitative e qualitative, tutti i testi epigrafici sono stati riccamente annotati con una serie di informazioni sia linguistiche che extra-linguistiche. Il sistema di interrogazione del corpus permette di ottenere informazioni in merito ai fenomeni di variazione linguistica attestati nelle iscrizioni in relazione a diversi parametri, tra cui la tipologia di testi, la loro origine e la collocazione cronologica. Questa risorsa permette inoltre l’esportazione di diversi dati rilevanti per l’analisi linguistica.
Il corpus è accessibile all’indirizzo http://CLaSSES-Latin-Linguistics.fileli.unipi.it
DiSCIS: DIachronic Sociopragmatic Corpus of Imaginary Speech
DiSCIS è un corpus socio-pragmaticamente annotato che attualmente comprende una selezione di commedie plautine (per il latino) e di Goldoni (per l’italiano del XVIII secolo), ossia testi letterari che contengono però dati mimetici dell’oralità – ciò che Culpeper & Kytö (2000) chiamano constructed imaginary speech.
Oltre alla lematizzazione e all’annotazione per parti del discorso (PoS tagging), è stato predisposto un tagset che fornisca informazioni relative allo status sociolinguistico dei personaggi (genere, età, ceto sociale); al tipo di atto linguistico; alle funzioni pragmatiche di elementi non proposizionali, che possono avere funzioni testuali, modali e interpersonali; alla presenza di fenomeni di contatto con il greco (in Plauto) o con il francese o il dialetto veneziano (in Goldoni). Inoltre, gli elementi che rivestono una funzione discorsivo-pragmatica sono stati annotati anche in base alla posizione che occupano nella frase, in modo da rendere possibile la ricerca di possibili associazioni nella periferia destra o sinistra e le loro funzioni a livello discorsivo e/o pragmatico.
Il corpus è accessibile qui: www.mediling.eu/corpusdiscis
Sardinian Medieval Corpus
Il Sardinian Medieval Corpus è in via di sviluppo. Attualmente è consultabile per forme la Carta de Logu, edita sulla base dell’incunabolo BUC, Inc, 230. Il documento è stato etichettato secondo le specifiche TEI/XML che consentono di preservare l’informazione filologica rilevante. Il sistema di interrogazione è basato su XQuery, e il database è stato creato tramite eXistDB. Etichettatura, sistema di interrogazione e di gestione del database sono su base open source e consentono un’implementazione successiva dell’etichettatura ai vari livelli di analisi linguistica. Tra i testi analizzati e digitalizzati, il primo ad essere pubblicato sarà per l'appunto la Carta de Logu. La pubblicazione avverrà nel corso del 2016, non appena si avrà il permesso dell’editore presso il quale l'edizione critica è in corso di pubblicazione. Sono attualmente consultabili alcune immagini (screenshot) che mostrano rispettivamente
PARVA
Il corpus PARVA (Partigiani Valcamonica) è un corpus che raccoglie dati di parlato e comprende circa 15 ore di interviste semi-guidate a 24 ex partigiani che vivono in Valle Camonica (Brescia). Questo strumento raccoglie dati che costituiscono un interessante banco di prova per esplorare code-switching e altri fenomeni di contatto tra l’italiano e il dialetto bresciano.
L'accesso al corpus è riservato agli utenti abilitati che hanno compilato e inviato a federica.guerini@unibg.it il modulo di richiesta in formato pdf o in formato word.