Marta Villegas, mestra de català de la IA
Lidera la Unitat de Tecnologies del Llenguatge al BSC, impulsant models de llenguatge en català i castellà
Marta Villegas, nascuda a Barcelona, és una de les figures més influents en el camp de les tecnologies del llenguatge. Amb més de 30 anys d’experiència, dirigeix la Unitat de Tecnologies del Llenguatge al Barcelona Supercomputing Center (BSC), una posició que l’ha situat com a referent en la recerca i desenvolupament del processament del llenguatge natural (NLP). Sota el seu lideratge, la unitat ha fet grans avenços en la creació de models de llenguatge massius i l’aprenentatge automàtic no supervisat, especialment per a llengües menys representades com el català, el gallec, l’euskera i el castellà.
Des de la seva incorporació al BSC, el 2017, ha treballat en projectes finançats per la Unió Europea, com OpenMinTeD i METANET4U, amb l’objectiu de millorar les infraestructures lingüístiques europees. Un dels projectes més destacats sota la seva direcció és el model de llenguatge anunciat pel govern espanyol al Mobile World Congress. Aquest model, concebut com un ChatGPT multilingüe, serà un recurs obert per facilitar la interacció amb màquines i aplicacions en llengües maternes. “El nostre objectiu és que totes les nostres llengües estiguin ben representades i, sobretot, que es respecti l’entorn cultural”, afirma Villegas, referint-se al paper essencial del català en el món digital.
La seva trajectòria acadèmica inclou posicions destacades a la Universitat Autònoma de Barcelona i la Universitat Pompeu Fabra, on va participar en la creació d’infraestructures lingüístiques pioneres a Europa. La seva experiència en la modelització de dades i la gestió d’infraestructures tecnològiques ha estat fonamental per als èxits dels projectes. El seu lideratge ha estat clau en el Projecte MarIA, guardonat amb el premi Archiletras 2022 a la innovació, i el Projecte AINA, que té com a objectiu avançar en el processament del llenguatge natural en català, generant recursos lingüístics i models preformats per desenvolupar aplicacions en català.
“És determinant que les nostres eines entenguin i reflecteixin les nostres pròpies cultures i llengües”, assegura Villegas, que ha impulsat models de llenguatge capaços de reconèixer i processar termes culturals específics. Aquest treball és clau per garantir que el català no es quedi enrere en l’evolució tecnològica global.