De vorbă cu domnul profesor Dan Cristea

Cariera domnului profesor universitar dr. Dan Cristea a fost si este încă strans legată de domeniul lingvisticii computationale. Domnul profesor a condus proiecte de creare a unor resurse lingvistice pentru limba română, ce au fost apoi folosite de informaticieni pentru dezvoltarea aplicațiilor care prelucrează limbajul natural, dar și pentru dezvoltarea unor tehnologii care oferă cititorilor informații din diverse cărți.

Profesorul Dan Cristea a publicat peste 200 de lucrări de specialitate, majoritatea fiind indexate în cele mai cunoscute baze de date destinate disciplinelor academice. Profesorul face parte din numeroase organizații de Inteligență Artificială din România, dar și din străinătate, și a contribuit la fondarea Asociației Române de Inteligență Artificială, dar și a Asociației Române de Lingvistică Computațională. Profesorul Dan Cristea a intrat la pensie în anul 2020, dar continuă să își dedice timpul cercetărilor în cadrul Institutului de Informatică Teoretică și continuă să sprijine membrii asociațiilor de lingvistică computațională, deoarece pasiunea sa pentru acest domeniu nu are limite. De aceea, i-am adresat domnului profesor câteva întrebări legate de această pasiune a domniei sale.

Pentru început, ne-am dorit să aflăm care a fost motivația domnului profesor de a înființa un program de masterat dedicat Lingvisticii Computaționale la Iași, iar răspunsul domniei sale este cât se poate de lămuritor:

„Era prin 2001, dacă nu greșesc. Domeniul progresa, făceam eforturi să intru în proiecte internaționale, uneori chiar reușeam, mă întâlneam cu mulți prieteni care făceau domeniul LC (n.n. Lingvistica Computațională) prin Europa sau pe alte continente și ei îmi vorbeau de studenții lor, dar, mai ales, vedeam atâtea figuri tinere prin conferințe, în general, doctoranzi sau proaspăt post-doctoranzi pasionați și buni cunoscători ai diferitelor zone ale domeniului, foarte mulți dintre ei având la bază studii umaniste și, desigur, dorința apare și ambiția și gândul…..de ce nu am putea forma și noi specialiști ai acestui domeniu?

De îndată ce s-a întipărit acest gând în mintea domnului profesor, acesta a început să pună bazele masteratului de Lingvistică Computațională. Profesorul Dan Cristea adaugă:

„(n.n. Înființarea acestui masterat) presupune nu numai a convinge un consiliu al unei facultăți de Informatică să înființeze un astfel de masterat, dar și de a găsi soluții pentru a forma specialiști, punând împreună, în aceeași clasă, studenți care vin cu pregătiri de bază atât de diferite: de la Informatică, dar și de la Litere (ori, mai rar, alt domeniu umanist). La fel de bine, el ar putea fi găzduit de Facultatea de Litere… Și chiar aceasta a fost intenția inițială: să facem un masterat cu dublă subordonare: Informatică și Litere. Iar la începutul acestui program, el chiar așa a funcționat: aveam un număr aproximativ egal de profesori de la Informatică și de la Litere, iar programa avea trei tipuri de module: unele dedicate celor care vin de la Litere, altele dedicate studenților informaticieni, și unele comune ambelor categorii de studenți.  Mulți ani, astfel a funcționat acest masterat. Între cele două facultăți din UAIC exista o convenție pentru un fel de „credite transferabile”: în statele de funcțiuni Facultatea de Informatică plătea niște ore Facultății de Litere (pentru că masteratul trebuia să aibă o unică subordonare), studenții informaticieni fiind trimiși să ia câteva cursuri care se făceau la Litere, iar cei care veneau de acolo luau niște cursuri de bază de la Informatică. Mai târziu, s-a adoptat o altă soluție, iar profesorii de la Litere lucrau la noi la „plata cu ora”. Numai că studenții informaticieni care făceau Lingvistică teoretică sau Morfologie și fonologie la Litere erau de-a dreptul înspăimântați de acele cursuri și același lucru se întâmpla cu studenții umaniști care trebuiau să facă Limbaje formale sau Algoritmică și programare la noi la Informatică. Toate, cursuri de bază, într-un domeniu sau în celălalt. Îmi amintesc de câteva eșecuri, pe care le-aș numi răsunătoare, dacă ele n-ar fi fost lamentabile…: umaniști cu care colaboram, scriind chiar lucrări împreună, obișnuiți numai cu note maxime în Facultatea de Litere, s-au trezit că iau câte un 7 (cu indulgență dat de profesorul Jucan la Limbaje formale), a doua zi spunându-mi că așa ceva nu e posibil și că ei renunță la masterat… Mi-am dat seama că ceva trebuie schimbat și că acea formație dublă pe care o visam eu, ca să fie realizabilă, ar trebui începută mult mai devreme, la nivelul studiilor de bază, dacă nu chiar din timpul liceului. Diferențele de pregătire aveau rădăcini mult mai profunde, datorate tipurilor diferite de gândire, care se formau la începutul pregătirii superioare, ulterior accentuându-se, iar puntea pe care doream eu să o construiesc nu avea console suficient de solide ca să suporte greutatea sarcinilor și… podul se prăbușea.”

Profesorul este de părere că elevii și studenții nu primesc suficientă îndrumare de la început. Tinerii consideră că tehnologia nu ar trebui îmbinată cu lingvistica, deoarece aceste două domenii nu au nimic în comun. Dimpotrivă, spune domnul profesor Dan Cristea. Dumnealui este de părere că:

„puntea dintre gândirea abstractă și bazată pe raționament, ce caracterizează domeniul informaticii, și cea imaginativă, bazată, în mare parte, pe memorie a umaniștilor, ar trebui creată mult mai devreme, într-o programă liceală în care cele două tipuri de formații să se îmbine mult mai strâns, iar nu să fie complet separate, cum se petrec astăzi lucrurile în liceele românești (probabil că și în alte părți). Și atunci societatea ar fi îmbogățită cu un tip uman capabil în egală măsură să inoveze prin imaginație și să pună în practică un proiect prin conceptualizare și rigoare. Iar părerea mea e că un astfel de individ este căutat în multe domenii, nu numai în lingvistica computațională…”

Pe parcursul masteratului, domnul profesor s-a asigurat că studenții de la Facultatea de Informatică din Iași se familiarizează cu domeniul PLN încă de la licență. Când a fost întrebat cum ar convinge tinerii să exploreze și domeniul Lingvisticii Computaționale, Profesorul Dan Cristea a răspuns:

„S-a înființat acel curs opțional din semestrul 6, Tehnologii de ingineria limbajului natural (TILN), în care studenții iau cunoștință cu domeniul, află multe lucruri despre metodele de lucru utilizate acolo, totul predat dintr-o perspectivă informatică, inginerească, foarte apropiată de realizarea de aplicații și fără a intra decât tangențial în modelele lingvistice care stau la baza metodelor. A fost ideea colegei mele Diana Trandabăț, acceptată de conducerea Facultății.  Apoi, ceva de acest gen am încercat să fac în acest ultim semestru de predare din cariera mea, în care am invitat un număr de 13 specialiști ai domeniului, prieteni de-ai mei ori foști studenți de-ai Facultății de Informatică, să predea în locul meu (mai puțin un curs introductiv pe care l-am predat eu însumi) la acest curs de TILN. Ei au venit din medii industriale, universitare, academice și au povestit propriile lor experiențe și realizări.”

De asemenea, domnul profesor a propus și câteva soluții pentru tinerii studenți care nu cunosc foarte multe lucruri despre Lingvistica Computațională. Profesorul Dan Cristea a observat faptul că tinerii informaticieni se tem de cuvântul „lingvistică”, deoarece „este circumspect față de științele umaniste, gramatică, literatură, lingvistică, pe care le consideră greu de abordat, aproape imposibil de formalizat.” Totodată, domnul profesor consideră că lingvistica și informatica lucrează împreună și că în ultima perioadă, științele umaniste s-au „lipit” și mai mult de domeniul Inteligenței Artificiale. Însă tinerii studenți nu cunosc profunzimea acestui domeniu și consideră că nu și-ar putea găsi un loc de muncă demn de calificările lor. De aceea, domnul profesor a propus mai multe soluții:

„mai multe teme de licență cu orientare spre aplicații ale domeniului, postări de știri despre realizări marcante ale domeniului, afișate pe canalele de diseminare ale Facultății, ale ARLC, ale UAIC, incluzând Facebook și Youtube, interviuri ale membrilor comunității ARLC sau membri ai FII ce predau la MLC cu linkuri promovate de Facultate, interviuri cu antreprenori, directori de firme de IT ieșeni sau din alte părți care să vorbească despre nevoia din ce în ce mai mare de specialiști ai acestui domeniu în industrie, dar poate și o serie de interacțiuni online inițiate de membrii comunității ARLC cu elevi ori studenți din Iași, dar și din alte centre universitare, în care să fie invitați cercetători români ori străini care fac domeniul în țară și în străinătate. În fine, cred că ar trebui reluată seria de workshop-uri BringITon!, care a derulat 4 sau 5 ediții până acum și a fost stopată din cauza pandemiei, care avea meritul de a implica studenții în proiecte cu aplicabilitate practică pronunțată, ce ar fi putut atrage și interesul unor investitori, multe dintre aceste proiecte fiind din domeniul PLN în care lucrează colegi cu care am colaborat la organizarea acestor evenimente. O emulație creativă de acest gen, la care să adere și studenți și cadre didactice din alte centre universitare, trebuie întreținută și promovată în Universitatea A.I.Cuza din Iași.”

Studenții din alte domenii sau studenții umaniști, cu precădere, nu au curaj să se înscrie la masteratul de Lingvistică Computațională, deoarece se tem de complexitatea acestui domeniu. Terminologia pare să fie greoaie pentru un tânăr umanist care își imaginează sute de linii de cod într-un limbaj nemaiauzit, iar programa pare să cuprindă materii alor căror nume nu pot fi deslușite. Necunoașterea vine tocmai de aici. Domnul profesor explică faptul că programul este accesibil atât informaticienilor, cât și umaniștilor. Cei doi pot lucra împreună la diverse proiecte, după cum afirmă și domnul Dan Cristea: „Cursurile sunt acum concepute pentru a fi „digerate” în egală măsură de informaticieni și de umaniști, iar temele de laborator au componente care exploatează atât competențe umaniste, cât și informatice. Apoi există proiecte comune în care conlucrează un student umanist cu unul informatician, studentul umanist preocupându-se, de exemplu, de propunerea unor standarde de adnotare și de realizarea unor resurse, în timp ce informaticianul ar concepe un cod și s-ar ocupa de implementare.” Așadar, soluții sunt pentru toți. Singurul lucru cu care trebuie să vină un student este pasiunea și ambiția. Odată intrat, studentul umanist vede frumusețea acestui domeniu și automat se va dedica în totalitate studiului, așa cum au făcut și alți umaniști care au avut curajul să îmbrățișeze domeniul PLN.

După cum am menționat și la începutul acestui material, domnul profesor Dan Cristea a contribuit la fondarea Asociației Române de Lingvistică Computațională. Profesorul speră ca asociația va putea influența sociatatea civilă și va putea oferi lumii o șansă să se implice în dezvoltarea viitoarelor tehnologii. Cu ajutorul domniei sale, voluntarii lucrează necontenit la dezvoltarea resurselor lingvistice pentru studiul limbii române și la aplicațiile care folosesc prelucrează limbajul natural, după cum afirmă și domnul profesor:

„ARLC se implică constant în organizarea activităților de colectare de resurse lingvistice românești, atât de necesare dezvoltării aplicațiilor de limbaj natural. Prin membrii ei, se duce o constantă campanie de lămurire a deținătorilor de resurse lingvistice (texte, înregistrări vocale, copii scanate după documente vechi românești) să le doneze pentru cercetare diferitelor proiecte cu finanțare românească. Astfel au fost achiziționate unele resurse pentru proiectele CoRoLa, ReTeRom, DeLORo și s-au semnat protocoale de colaborare care să asigure legalitatea deținerii acestor resurse în conformitate cu legea drepturilor de autor.”

Totodată, Profesorul Dan Cristea critică societatea pentru lipsa sa de înțelegere și implicare în acest domeniul. Prelucrarea Limbajului Natural (PLN) este un domeniu vast și oferă tinerilor șansa de a se remarca în țara lor, chiar dacă aceștia sunt reticenți când vine vorba de piața muncii din România:

„Dacă societatea civilă ar fi conștientă de dezvoltarea fără precedent a acestui domeniu, cu siguranță, și-ar trimite fiii să se înscrie în masterate de genul MLC, așa cum s-a întâmplat cu domeniul IT în general. De ce sunt atât de mulți elevi dornici să urmeze Informatica? Pentru că e o știință interesantă, se adresează celor isteți și pentru că există o masivă cerere de forță de muncă specializată pe acest domeniu. Mai puțină lume știe însă cât de interesant este domeniul LC sau al PLN, cât de isteț trebuie să fii ca să-ți faci o meserie din el și cât de ușor îți poți găsi un loc de muncă dacă ai o diplomă în MLC.”

Domnul profesor Dan Cristea este recunoscut și pentru faptul că este jovial și pentru că este mereu alături de colaboratorii dumnealui. Înțelege subtilitățile dintr-un discurs sau dintr-o întrebare, dovedind mereu că are trăsăturile unui umanist creativ, dar și organizarea unui informatician. A făcut public faptul că a intrat la pensie în toamna anului 2020, așa că ne-am gândit să îl întrebăm cum vede domnia sa lucrurile după atâția ani de carieră:

„NU mă supăram nici dacă mă întrebai… acum, la sfârșit de carieră. Vrei un rezumat al vieții mele academice. Pot să spun în câteva cuvinte, un lucru pe care sunt sigur că îl recunosc cei mai mulți profesori și cercetători: în fiecare zi, am fost preocupat de ceva care mi se părea extrem de interesant și în mai toate zilele aveam o senzație de neliniște. Că ceva nu merge bine, că m-a părăsit un colaborator apropiat, că se apropie un deadline, că am pierdut ceva de neprețuit… Apoi, relativ la lucrurile pe care le-am făcut: cred că au fost câteva lucruri bune, dar și mult mai multe regrete că nu am dus la capăt unele lucruri. Apoi sunt multe lucruri pe care doar le-am visat că le-aș face, fără să îndrăznesc vreodată să mă apuc de ele. Deci o cariera de profesor și cercetător adună în ea tot felul de lucruri: câteva satisfacții pentru unele lucruri duse la capăt, destule regrete pentru altele eșuate, un număr mare de neliniști și multe vise.”

Perseverența dumnealui continuă să ne inspire, iar sfaturile oferite de domnul profesor au ajutat sute de studenți să exceleze în domeniu. Creativitatea domniei sale a inspirat studenții să dezvolte aplicații uluitoare, iar ambiția domniei sale a unit lingviștii și informaticienii cu scopul de a dezvolta resurse și aplicații uluitoare.

La final, la fel ca întotdeauna, domnul profesor nu a ezitat să ofere sfaturi tânărului pasionat de PLN, îndrumându-l:

„Să citească mult în domeniu, atât de mult încât să se simtă mereu… cel mai tare din parcare. Dar să nu uite să trăiască, să facă sport, să iasă cu prieteni, să iubească, să citească literatură, să asculte muzică, să iasă la operă și teatru.”

 

 

 

Foto: conferencephss.com/

Check Also

Ziua doamnelor din domeniul NLP

În prezent, ziua femeii se sărbătorește în diferite perioade ale anului, iar în unele țări, …

Leave a Reply

Your email address will not be published. Required fields are marked *