Descripció i objectius del projecte

NEL

VIVES forma part d’un projecte comú i coordinat entre les diferents llengües de l’estat que anomenem NEL (Nova Economia de la Llengua). La duració de NEL és de 36 mesos i es coordina entre quatre projectes propis amb metodologia, objectius i tècniques compartides: NEL-AINA, NEL-GAITU, NEL-NÓS i NEL-VIVES. La coordinació general la realitza el Consorci Barcelona Supercomputing Center – Centre Nacional de Supercomputació (BCS-CNS). L’últim objectiu de NEL és la generació de recursos multilingües que incloguen, almenys, totes les llengües d’Espanya i que permeten desenvolupar aplicacions multilingües.

El projecte NEL aborda totes les llengües que es parlen a la península ibèrica, incloent l’espanyol, català, basc i gallec. A més, els recursos generats al projecte, incloent els models, prototips i, en la mesura que siga possible, els corpus recopilats, seran accessibles de manera pública per a investigadors i empreses del sector. Aquesta visió ibèrica, multilingüe i oberta ajudarà a establir les bases d’un ecosistema sòlid de TL en tota la península que facilite la participació d’investigadors especialitzats i que posicione les empreses del sector als mercats nacionals i internacionals, permetent així un avanç qualitatiu en termes de competitivitat.

NEL vol desenvolupar la infraestructura necessària perquè la inclusió de les llengües ibèriques a les aplicacions de IA siga prou atractiva i viable, tant per a les grans companyies tecnològiques com per a la indústria nacional. Per tant, el projecte té com a objectiu el desenvolupament de recursos per a la Intel·ligència Artificial i les Tecnologies del Llenguatge per a:

  • Proveir a les llengües ibèriques amb la infraestructura necessària per al desenvolupament d’aplicacions basades en TL (assistents de veu, traductors automàtics, agents conversacionals, etc)
  • Garantir que la inclusió de les llengües ibèriques en aplicacions de TL siga rendible i atractiva per a les empreses del sector, tant a escala local com global.
  • Impulsar el sector de la IA a l’estat espanyol, millorant la seua competitivitat, i aconseguir que el ciutadà de l’estat puga participar al món digital utilitzant qualsevol de les llengües co-oficials, al mateix nivell que els parlants d’una llengua global.
  • Fomentar la investigació líder en TL i IA perquè l’estat espanyol estiga prou preparat per a respondre al repte digital i de la societat basada en coneixement.

VIVES

VIVES, “VIVES, Pla de Tecnologies de la Llengua per al valencià”, s’emmarca dins del Projecte Estratègic per a la Recuperació i Transformació Econòmica (PERTE) de la Nova Economia de la Llengua que té per objectiu impulsar a Espanya la nova economia digital basada en el llenguatge natural, aprofitant el potencial de l’espanyol i de les llengües cooficials com a factor de creixement econòmic i de competitivitat internacional en àrees com ara la intel·ligència artificial, la traducció, l’ensenyament, la producció i divulgació cultural, la investigació i la ciència.

El primer eix del PERTE, <<Base de coneixement en espanyol i llengües cooficials>>, té com a objectiu la creació i ampliació de corpus i de models de llenguatge associats que permeten el desenvolupament de projectes d’intel·ligència artificial i altres tecnologies del llenguatge. D’altra banda, l’eix 2 del PERTE, <<Intel·ligència Artificial en espanyol>>, recull entre les seues actuacions previstes el desenvolupament de la intel·ligència artificial en espanyol i llengües cooficials. Així doncs, d’acord amb els objectius del PERTE, aquest projecte desenvoluparà els recursos lingüístics necessaris (corpus i models) per a facilitar la incorporació de les llengües oficials d’Espanya en les més avançades aplicacions d’intel·ligència artificial.

Els objectius principals del projecte VIVES són:

  • Creació de corpus massius (en format text i veu) del valencià.
  • Impulsar campanyes d’adquisició de dades de veu i textos a partir de la participació ciutadana i dels recursos existents en l’administració pública, Les Corts Valencianes, i la ràdio i televisió valenciana (A Punt). Estudi de les implicacions de privacitat per a les persones i garantia de preservació de la privacitat d’aquestes en la captura i anàlisi de les dades.
  • Generar models del llenguatge per a cadascuna de les varietats del valencià, i establir correlació i comparació entre ells. A més, generar models del llenguatge especialitzats en un àmbit concret (turisme i audiovisual) o en una tasca concreta (per exemple, resums i simplificació de textos).
  • Definir estratègies de qualitat de les dades.
  • Estudiar la interacció entre els sistemes que utilitzen els models del llenguatge i els seus usuaris, amb un focus especial en les consideracions ètiques d’aquesta interacció.
  • Fomentar la inclusió digital en l’administració pública, i proporcionar eines digitals per a persones amb discapacitat i diversitat cognitiva, per aconseguir llengües accessibles.