Centre interrégional de développement de l'occitan - Mediathèque interrégionale occitane

PATRIMOINE & CONNAISSANCE DE LA CIVILISATION OCCITANE

Projet Éditions électroniques Imprimer Envoyer

visuel teiConstitution et exploitation d’un corpus textuel structuré occitan pour la formation permanente et l’accès à la culture (2016-2019)


La plate-forme Occitanica.eu, met déjà à la disposition du public certaines œuvres numérisées, dans une logique de diffusion de la langue et de la littérature occitanes. Avec ce nouveau projet, elle vise à aller plus loin et offrir une application spécifique pour un accès aux œuvres plus approfondi.

De quoi s'agit-il ?

Le corpus textuel constitué et traité a vocation à se présenter sous la forme de livres numériques à télécharger dans différents formats (Epub, pdf, tei), et d'éditions scientifiques avec un apparat critique et des liens vers d'autres ressources (biographie des auteurs dans l'application Vidas d'Occitanica.eu par exemple) valorisant la connaissance produite autour des œuvres présentées.
Le projet bénéficiera notamment du programme interrégional de numérisation du patrimoine occitan.
Il s'inscrit dans une volonté de fournir des supports et applications innovants, adaptés aux besoins des chercheurs, étudiants et enseignants ainsi qu'aux nouvelles pratiques de lecture (tablettes et liseuses).

Un partenariat avec la communauté universitaire

Pour réaliser cette application innovante en domaine occitan, le CIRDÒC a signé un contrat CIFRE avec une doctorante du laboratoire RedÒc-Llacs de l'Université Paul-Valéry, renforçant ainsi ses partenariats avec la communauté universitaire et assurant une expertise scientifique à ses productions.
La CIFRE (Convention Industrielle de Formation par la Recherche) est un dispositif d'application de la recherche dans un environnement professionnel : elle se fait en partenariat entre un doctorant, son laboratoire de recherche et une structure professionnelle.

La TEI

L'utilisation du protocole de la TEI P5 pour l'édition scientifique des ouvrages offre l'opportunité d'une exploitation de qualité de l'écrit occitan. L'XML/TEI est un langage informatique qui assure plusieurs niveaux de description du texte :
- l'encodage de la structure logique isole les différentes parties du texte : on peut alors présenter les différentes parties de l'ouvrage indépendamment les unes des autres, ou bien générer un index ou une table des matières en lien vers les parties concernées par exemple.
- l'encodage sémantique identifie des données contenues dans le texte (noms de lieux, de personnes, dates, lexique, etc.) et permet l'ajout d'information dans le flux du texte (l'établissement d'un apparat critique par exemple, et notamment l'identification des variantes linguistiques).
Les données ainsi structurées et ouvertes constituent une contribution à l'établissement d'un Big Data occitan, envisageable dans une structure comme le CIRDÒC et souhaitable pour le développement de la langue occitane.

Constitucion e esplecha d'un còrpus textual estructurat occitan per la formacion permanenta e l'accès a la cultura (2016-2019)


La plata-forma Occitanica.eu, met ja a disposicion del public d'unas òbras numerizadas, dins una logica de difusion de la lenga e de la literatura occitanas. Amb aquel projècte novèl, visa mai luènh e ofrís una aplicacion especifica per un accès a las òbras mai aprigondit.

De qué s'agís ?

Lo còrpus textual constituit e tractat a vocacion a se presentar jos la forma de libres numerics telecargables dins diferents formats (Epub, pdf, tei), e d'edicions scientificas en linha amb un aparat critic e de ligams vèrs d'autras ressorsas (biografias dels autors dins l'aplicacion Vidas d'Occitanica.eu per exemple) valorizant atal la coneissença produch a l'entorn de las òbras presentadas.
Lo projècte benefícia del programa interregional de numerizacion del patrimòni occitan.
S'inscriu dins una volontat de porgir de supòrts e d'aplicacions innovants, adaptats als besonhs dels cercaires, estudiants e ensenhaires tal coma a las novèlas practicas de lectura (tauletas e legidoiras).

Un partenariat amb la comunautat universitària

Per realizar aquela aplicacion innovanta en domeni occitan, lo CIRDÒC a signat un contracte CIFRE amb una doctoranta del laboratòri RedÒc-Llacs de l'Universitat Paul-Valéry, renforçant atal sos partenariats amb la comunautat universitària e assegurant una expertesa scientifica a sas produccions.
La CIFRE (Convencion Industriala de Formacion per la Recèrca) es un dispositiu d'aplicacion de la recèrca dins un environament professional : se fa en partenariat entre un doctorant, son laboratòri de recèrca e una estructura professionala.

La TEI

L'utilizacion del protocòl de la TEI P5 per l'edicion scientifica dels obratges ofrís l'oportunitat d'una esplecha de qualitat de l'escrich occitan. L'XML/TEI es un lengatge informatic qu'assegura mai d'un nivèl de descripcion del tèxt :
- l'encodatge de l'estructura logica isola las diferentas partidas del tèxt : se pòdon alara presentar independentament las unas de las autras, o generar un indèx o un ensenhador amb los ligams vèrs las partidas concernidas per exemple.
- l'encodatge semantic identifica de donadas contengudas dins lo tèxte (noms de luòcs, de personas, datas, lexic, etc.) e permet l'apondon d'informacion dins lo flus del tèxt (l'establiment d'un aparat critic per exemple, e en particular l'identificacion de las variantas linguisticas).
Las donadas estructuradas e dobèrtas constituisson una contribucion a l'establiment d'un Big Data occitan, envisatjable dins una estructura coma lo CIRDÒC e profechable al desvolopament de la lenga occitana.



 
: