Cele mai recente articole

ReTeRom

ReTeRom, numit și Resurse și Tehnologii pentru Dezvoltarea Interfețelor Om-Mașină în Limba Română, este un proiect finanțat de Ministerul Cercetării și Inovării și dezvoltat de un grup de specialiști de la Academia Română, de la Institutul de Inteligență Artificială ”Mihai Drăgănescu”, Universitatea Tehnică din Cluj-Napoca, Universitatea Politehnică din București și Universitatea ” Alexandru Ioan Cuza” din Iași.

Scopul acestui proiect a fost dezvoltarea unor resurse pentru aplicațiile care procesează limbajul natural. ReTeRom este format din 4 proiecte individuale: COBILIRO, TEPROLIN, TADARAV și SINTERO. Fiecare proiect în parte s-a ocupat de o secvență necesară dezvoltării proiectului integral. Pe parcursul anilor de cercetare, specialiștii s-au ocupat de atât de aspectele tehnice, cât și de cele care asigurau buna funcționare a sistemului ReTeRom. În articolele viitoare, vom sublinia cele mai importante aspecte ale proiectelor independente, iar în articolele care urmează, vom detalia aspectele celor patru proiecte individuale.

COBILIRO este un corpus de texte scrise și audio care surprind rostirea nativă a cuvintelor în limba română. Început în 2018, proiectul a avut ca scop studierea sistemelor state-of-the-art pentru a avea un punct de plecare pentru corpusul bimodal. Ulterior, s-a făcut inventarul resurselor pe baza cărora se va începe alcătuirea corpusului. În cadrul aceluiași proiect, s-a realizat proiectarea infrastructurii care va găzdui instrumentele de procesare.

Derulat concomitent, TEPROLIN a avut ca scop dezvoltarea unui set de tehnologii pentru prelucrarea limbajului natural și pentru adnotarea textelor colectate în etapa COBILIRO. De asemenea, s-au definit modulele software și serviciile NLP stabilite în cadrul primului proiect. Tot în această etapă, specialiștii au realizat și modificările necesare în corpus pentru a putea fi preluat cu ușurintă de către tehnologiile NLP.

TADARAV este cel de-al treilea proiect derulat în cadrul ReTeRom și a avut ca scop dezvoltarea unui set de tehnologii pentru adnotarea fonetică a resurselor colectate în prima etapă a proiectului. Ulterior, aceste tehnologii vor fi utilizate pentru a recunoaște automat limba română și pentru a adnota automat semnalul vocal. Această funcționalitate va fi dezvoltată în cel de-al patrulea proiect.

Obiectivul proiectului SINTERO este detectarea și analiza expresivității textelor prelucrate în primele trei etape: COBILIRO, TEPROLIN, TADARAV. Aceste tehnologii vor putea identifica tipurile de prozodie și expresivitatea sintezelor text-vorbire. De asemenea, se va dezvolta o metodă de adaptare a vocii sintetice utilizaând fișiere audio atipice. Aceste tehnologii vor putea fi folosite prin cadrul interfetei implementată de echipa de cercetare.

Echipa a declarat că proiectul a urmat cursul prestabilit, iar rezultatele sunt în concordanță cu obiectivele fiecărui proiect în parte. Pe această temă, va urma o serie de articole în care vom detalia fiecare proiect în parte.

Check Also

Egalitatea Lingvistică în Era Digitală

European Language Equality (ELE) este un proiect sprijinit de Parlamentul European și scopul său este  …

Leave a Reply

Your email address will not be published. Required fields are marked *