Aplicații NLP: Chatbot

Aplicații NLP: Chatbot

În articolele precedente am vorbit despre ce înseamnă lingvistica computațională și am reliefat câteva dintre întrebuințările acestui domeniu. Am introdus noțiunea de NLP, care înglobează o gamă largă de algoritmi și aplicații pentru Procesarea Limbajului Natural. De aceea, începând cu acest articol, vom vorbi despre diferite aplicații dezvoltate de NLP și vom reliefa scopul pentru care au fost gândite, observând că folosim roadele acestui domeniu în fiecare zi fără să ne dăm seama.

Vom începe prin a reliefa câteva trăsături ale CHATBOȚILOR. Aceste sisteme cunoscute sub numele de chatbot sunt programați să analizeze Inteligența Artificială și să simuleze o conversație cu clienții. Chatbotul apare ca o persoană de contact sau ca un operator de la serviciul cu clienții și, totodată, pot lua parte la diferite întâlniri în grup.  Trecând Testul Turing, acești boți sunt capabili să ofere răspunsuri reale, fiindu-i greu utilizatorului să își dea seama dacă vorbește cu un robot sau cu un operator uman. De cele mai multe ori, aceste sisteme scanează cuvintele din mesajul utilizatorului și trece acele cuvinte prin baza sa de date, oferindu-i la final un răspuns deja formulat de către cei care l-au creat. Scopul acestor chatboți este de a interacționa cu oamenii și de a le oferi servicii rapide, făcând astfel companiile să își crească publicitatea sau să câștige mai mulți clienți.

Totodată, chatboții pot ajuta compania să economisească mulți bani și pot rezolva frustrările oamenilor mult mai rapid. De exemplu, mulți dintre noi am apelat la Djingo. Acesta este un chatbot programat de Orange să ne ajute să ne încărcăm telefonul, să ne ofere informații legate de valabilitatea serviciului Roaming sau să ne ajute să intrăm în legătură cu un reprezentant uman. De asemenea, mulți dintre noi ne-am gândit să învătăm o limbă nouă, dar era prea costisitor să mergem la cursuri sau să cumpărăm manuale, așa că am apelat la Duolingo. Acest serviciu ne oferă posibilitatea de a practica o limbă nouă, de a înregistra mesaje și de a ne corecta scrierea în spaniolă, franceză sau germană. Scopul noului chatbot oferit de Duolingo este simularea unei conversații reale sau simularea unui curs într-o limbă străină. TechCrunch ne oferă o demonstrație gratuită a acestui chatbot aici. În contrast, Elbot, cei de la Artificial Solutions au dezvoltat un chatbot cu care putem interacționa zilnic deoarece răspunde la foarte multe întrebări adresate de utilizatori. Ne putem distra cu Elbot apăsând pe acest link.

Concluzionând, am observat că scopul acestui serviciu este îmbunătățirea interacțiunii dintre computer și om. Astăzi, cele mai mari companii din lume apelează la aceste metode pentru a-și construi afacerile, iar oamenii de rând își dotează gadgeturile cu cele mai performante aplicații de traducere, dar și cu diferiți asistenți care să îi ajute să își îndeplinească sarcinile zilnice.

Referințe bibliografice

Demonstrație TechCrunch: https://www.youtube.com/watch?v=zWd8c2YnDok

Djingo: https://voicebot.ai/2020/10/07/orange-will-wind-down-djingo-smart-speaker-in-favor-of-smart-home-and-tv-services/

Testare Elbot: http://elbot-e.artificial-solutions.com/cgi-bin/elbot.cgi

Foto: elbot.com

Procesarea Limbajului Natural

Procesarea Limbajului Natural

De foarte multe decenii, ingineria limbajului a permis interacțiunea dintre computer și om. Aceasta a prezentat diverse metode prin care omul, folosind mijloace tehnice, a rezolvat nenumărate dificultăți lingvistice. De aceea, această știință interdisciplinară a dezvoltat un alt domeniu numit Natural Language Processing sau NLP.

Procesarea Limbajului Natural, cunoscut sub denumirea de Natural Language Processing sau NLP, se referă în prealabil la o tehnologie modernă al cărui scop este facilitarea legăturii dintre computere și oameni, ajutând mașinile să înțeleagă limbajul, sentimentele și nevoile oamenilor. Nu trebuie confundat cu Neuro-Linguistic Programming (Programarea Neuro-Lingvistică), deoarece acesta se ocupă cu dezvoltarea personală și psihoterapia. Mai mult, NLP este o ramură a Inteligenței Artificiale care ajută mașinile să înțeleagă, să interpreteze și să manipuleze limbajul uman. Procesarea Limbajului Natural este un domeniu interdisciplinar, deoarece îmbină știința cu lingvistica, două domenii care aparent sunt diametral opuse, dar care împreună pot schimba lumea. De aceea, în ultimii ani, procesarea limbajului natural a avut ca scop înțelegerea limbajului uman de bază și explorarea strategiilor care sprijină înțelegerea limbajului uman.

Pentru o înțelegere mai corectă, vom împărți acest procesul pe care îl implică procesarea limbajului în mici etape, observând tehnicile lingvistice prin care computerul analizează limbajul scris sau vorbit. De pildă, acest proces începe vorbirea directă cu un computer pentru a vedea dacă acesta înregistrează sunetele emise de către om. De îndată ce computerul stochează cuvintele rostite de către om, se vrea transformarea fișierelor audio în text. Cu alte cuvinte, computerul a dobândit abilitatea de a transpune o simplă voce înregistrată în text. Ulterior, computerul analizează textul pe baza regulilor învățate înainte și identifică unele cuvinte cheie pe baza cărora își va forma răspunsul. Acesta deosebește cuvintele cheie de cuvintele care nu transmit informații vitale, precum conjuncțiile, preopozițiile, și caută în baza sa de date informații care au legătură cu cuvintele rostite de către om. Acest proces ia sfârșit în momentul în care computerul răspunde și îi oferă informații omului în funcție de nevoile sale.

Așadar, procesarea limbajului a permis omului să comunice cu calculatorul și să analizeze multe fapte de limbă într-un mod echitabil. Computerul a reușit, astfel, să înregistreze limbajul natural, să îl proceseze, să îl interpreteze, să analizeze sentimentele din text și să ofere răspunsuri la întrebările oamenilor legate de text.

Referințe bibliografice

Garbade J., Michael. “A simple introduction to Natural Language Processing.” Becoming Human: Artificial Intelligence Magazine 2018. https://becominghuman.ai/a-simple-introduction-to-natural-language-processing-ea66a1747b32.

Grimley, Bruce. “academia.edu.” 15 Decembrie 2015. What is Neurolinguistic programming. https://www.academia.edu/31514906/What_is_Neurolinguistic_Programming_NLP.

Natural Language Processing (NLP). What it is and why it matters. n.d. https://www.sas.com/en_us/insights/analytics/what-is-natural-language-processing-nlp.html.

FOTO: usmsystems.com

Cum ne ajută tehnologia limbajului?

Cum ne ajută tehnologia limbajului?

 Lingvistica computațională a cunoscut o evoluție fantastică și este greu de imaginat că se va opri vreodată. Tehnologiile dezvoltate de lingvistica computațională nu intenționează să înlocuiască colosala muncă a lingviștilor din toate timpurile, ci să le vină în ajutor și să le ușureze munca. Aceste tehnologii sunt antrenate să surprindă detaliile care pot fi ușor omise de ochiul curios al cercetătorilor. În plus, aceste tehnologii ne ajută să ne creionăm activitățile zilnice, deoarece sunt accesibile și publicului larg. Fără rigurozitatea unui studiu exhaustiv, în rândurile care urmează vom sublinia rolul tehnologiei limbajului și vom încerca să răspundem la veșnica întrebare: cu ce ne ajută tehnologiile limbajului?

În primul rând, aceste tehnologii sunt la îndemâna tuturor, iar scopul lor este de a ne ușura viața. Chiar dacă nu ne dăm seama, folosim aceste caracteristici în fiecare zi, din momentul în care deschidem telefonul dimineața să programăm o nouă alarmă cu ajutorul asistenților Siri sau OK Google pentru că vrem să mai dormim puțin, până când deschidem e-mailul și observăm că în folderul Spam avem nenumărate mesaje pe același subiect. Asta înseamnă că un algoritm a analizat mesajele pe care nu le dorim în inbox și le transferă automat în folderul spam. De asemenea, observăm că în urma unei singure căutări pe internet ne apar sugestii de căutări noi pe aceeași temă. Acest lucru este oferit de capacitatea acestei tehnologii de a procesa limbajul, de a extrage entitățile și de a categoriza informațiile. În mod asemănător, computerul și-a dezvoltat abilitatea de a sintetiza informațiile dintr-un text. Există tehnologii care dezvoltă algoritmi pentru procesarea limbajului natural cu scopul de a rezuma informațiile din bibliotecile digitale făcând munca pasionaților de lectură mai ușoară, în sensul că nu trebuie să mai citească mii de pagini pentru a extrage ideile principale dintr-un text. Mai mult, folosirea exhaustivă a aplicațiilor pentru traducerea cuvintelor demonstrează din nou că acest domeniu este din ce în ce mai dezvoltat. Introducerea manuală a textelor sau înregistrarea audio a unor cuvinte pentru a fi traduse sugerează faptul că tehnologia ne ajută să ne integrăm într-o nouă comunitate. Acestea sunt cele mai simple exemple care demonstrează că mașina este capabilă să prezică noi reguli legate de procesarea limbajului și să găsească soluții pentru dificultățile avute de oameni în comunicare.

În al doilea rând, acest domeniu ajută companiile să își selecteze clienții și să analizele piața pentru a decoperi noile trenduri. Astfel, se identifică noi subiecte de explorat, categorii noi de oameni care interacționează cu produsele oferite de respectiva afacere sau se analizează sentimentele oamenilor pentru a afla dacă piața favorizează un produs sau îl desconsideră. De asemenea, se analizează postările de pe social media pentru a afla dacă o comunitate preferă o figură politică sau nu, sau dacă generația Alpha este dependentă de rețelele de socializare. Mai mult, această tehnologie poate lua locul operatorilor din centrele de informare sau agenților din serviciile pentru clienți. Mașinile sunt antrenate și programate să asculte limbajul natural, să îl înțeleagă și să îl proceseze în așa fel încât să ofere oamenilor răspunsuri la întrebările lor. Asistenții virtuali sau chatboții recunosc limbajul natural, devenind un nou tip de “cel mai bun prieten al omului”. Având în vedere faptul că omul are nevoie de baze de date pentru a conduce o cercetare, s-a dezvoltat supercumputerul Watson care analizează limbajul, procesează frazele, face legătura dintre bazele sale de date și cerințele oamenilor, indentifică cuvintele cheie și distinge sentimentele umane. Acest asistent este folosit astăzi de către cercetătorii din domeniul medical, deoarece este capabil să stocheze atât istoricul medical al pacienților, cât și informații despre boli și medicamente noi.

Și nu în ultimul rând, aceste tehnologii vin și în ajutorul lingviștilor. În ultimii ani, computerele au fost antrenate să ajute lingviștii în analiza textelor și în „curățarea” lor de orice greșeală gramaticală. Oferindu-i o bază de date suficient de mare, mașina poate fi antrenată să analizeze cuvintele și să menționeze perioada istorică în care a fost scris un document, facilitând, de pildă, analiza diacronică a unei limbi. De asemenea, unele programe pot „ghici” cu o acuratețe impresionantă autorul unui text, deoarece se analizează cuvintele folosite de acest autor în scrierile sale. Însă înainte de orice studiu, mașina este antrenată să recunoască caracteristicile specifice fiecărui autor în parte. În același mod sunt antrenate și tehnologiile care extrag emoțiile predominante dintr-un text. Mai nou, pe lângă analiza comentariilor de pe rețelele de socializare, oamenii de știință vor să ducă acest sector al tehnologiei limbajului și în altă direcție, deoarece doresc să ajute lingviștii să își formeze o părere despre un studiu critic sau să vadă dacă un anume autor a fost apreciat sau nu de către critica literară. În curând vom putea apela la resursele lingvistice și literare online doar printr-o simplă frază rostită, deoarece tehnologiile vor face și mai posibilă comunicarea dintre oameni și computere.

Așadar, tehnologiile limbajului ne dirijează existența în această societate multilingvă și ne permit să evoluăm ca oameni, ca națiune și ca civilizație. Aceste instrumente ne permit să navigăm pe internet într-un mod mai coerent, să explorăm bibliotecile online, să analizăm comportamentul oamenilor pe rețelele de socializare, să analizăm texte, să dăm comenzi vocale asistenților virtuali, să primim indicații de la asistenții de navigare prin satelit și nu numai. În viitor, poate vom putea folosi limbajul natural în totalitate și vom putea interacționa cu mediul digital doar prin comenzile vocale.

Referințe bibliografice

Cotelea, V. TEHNICI SIMBOLICE FUNDAMENTALE ALE LINGVISTICII. 2013. http://repository.utm.md/bitstream/handle/5014/136/MI_2013_3_pg_24_31.pdf?sequence=1&isAllowed=y.

Harari, Yuval Noah. Homo Deus. A brief history of tomorrow. Penguin Random Group, 2016.

Trandabăț, Diana, et al. Limba Română în era digitală. Ed. Georg Rehm. Iași: Springer-Verlag Berlin Heidelberg, 2012. 2021. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.592.2606&rep=rep1&type=pdf.

Comunicarea Lingvisticii Computaționale

Într-o societate care se dezvoltă într-un ritm alert, tehnologia este singura armă împotriva regresului cognitiv și social. De-a lungul timpului, omul a simțit nevoia să comunice, să transmită informații și să influențeze lumea în care există. Limba este principala metodă care permite omului să facă aceste lucruri, iar tehnologia vine în ajutorul său, facilitându-i accesul la informație, dar și la noile tehnici prin care omul, ca ființă socială, reușește să răspândească cunoștințele generale. Studiul lingvistic poate frânge zidul dintre populații și poate înlesni propagarea actualităților. În ultimele decenii, studiul tehnologic a devenit din ce în ce mai amănunțit pentru a simplifica viața oamenilor și interacțiunea dintre aceștia. Acest articol va explora semnficațiile lingvisticii și va explora provocarea pe care o lansează lingvistica tehnologiei.

Dezvoltarea fără zăbavă a mediului online a permis lumii să distribuie documente în toate limbile pământului și să traducă nenumărate documente dintr-o limbă în alta, simplificând procesul de transmitere a informației. Conform Dicționarului Explicativ al Limbii Române, lingvistica este știința care studiază limba, legile ei de dezvoltare și faptele de limbă așa cum se prezintă ele la un moment dat. Limba română face parte din ramura limbilor indo-europene și este înconjurată de multe limbi slave si din acest motiv, limba noastră este influențată major de aceste limbi, dar și de vechea limbă latină. De asemenea, în limba română există și numeroase dialecte, precum aromân, meglenoromân sau istroromân, iar acest lucru face și mai dificilă interpretarea cuvintelor de către un calculator. Însă dintre toate cele 6000 de limbi, limba engleză este folosită predominant în toate domeniile și, de aceea, oamenii de știință continuă să dezvolte tehnologii care prelucrează informațiile și în alte limbi. Acesta reprezintă începutul dezvoltării lingvisticii computaționale.

Lingvistica Computațională se referă la studiul limbii dintr-un unghi științific. Acest domeniu este motivat de o perspectivă științifică să exploreze diverse probleme ale limbii și să ofere explicații pentru diverse fenomene psiholingvistive. Lingvistica computațională este urmărită încă din mijlocul anilor ’90, cand apare primul ziar pe această temă intitulat “Mechanical Translation and Computational Linguistics”, tradus ca “Traducere Mecanică și Lingvistică Computațională”. Ulterior, în anii ’70, cercetătorii europeni au început să își canalizeze energia și resursele în lingvistica computațională, realizând impactul pe care l-ar putea avea în domeniul științei. Într-o altă ordine de idei, scopul acestei ramuri este de a simplifica studiul textelor, de a analiza limbajul din texte și de a oferi răspunsuri legate de text într-un mod mult mai rapid. Acest domeniu încorporează mai multe sisteme care ușurează analiza textului, printre acestea fiind: sistemele care identifică limbajul natural, sisteme care transpun textul scris in limbaj vorbit, sisteme care oferă răspunsuri automate, sisteme care fac căutări web, sisteme care oferă instrucțiuni în mai multe limbi și nu numai.

Din capitolul lingvistică fac parte analizele semantice, cu precădere analiza sensurilor cuvintelor întâmpinate în text și analiza termenilor aflați în structuri ambigue. De asemenea, semantica se ocupă și de recunoașterea entităților dintr-un text, precum nume de localități, de figuri publice, de instituții și nu numai. Această tehnică se numește Named Entity Recognition (NER) și este una dintre cele mai studiate tehnicii din această specialitate. Tot din domeniul lingvisticii este și analiza sintactică, adică analiza părților de vorbire, analiza rădăcinii cuvintelor, analiza morfemelor și analiza formelor flexionare ale cuvintelor pentru a ușura studiul discursurilor. Toate aceste cercetări au existat din momentul în care omul a învățat să scrie și să citească, deoarece aceste analize ajută la studiul diacronic al limbilor. Transpunerea acestor reguli gramatice în algoritmi și digitalizarea textelor existente în format fizic sunt câteva din responsabilitățile științei, iar acest lucru face lingvistica să fie computațională.

Fără îndoială, știința reprezintă cea mai importantă reușită a umanității. Cu toții merităm să știm că știința ne influențează destinul, ne modelează societatea și condiționează deciziile luate la nivel global. De aceea, lingvistica computațională explorează limbajul natural și modelează aplicațiile existente cu scopul de a trăi într-o societate care permite circulația informației în multiple formate, însă încă se crede cu tărie că tehnologiile se pot îmbunătăți și sistemele lingvistice încă se pot dezvolta.

Referințe biobliografice

Coteanu, Ion and Lucreția Mareș. Dicționarul explicativ al limbii române (ediția a II-a revăzută și adăugită). Academia Română, Institutul de Lingvistică. Editura Univers Enciclopedic Gold, 2009. https://dexonline.ro/definitie/lingvistic.

Eman M., Muslim. “An Introduction to Computational Linguistics. Advantages&Disadvantages.”.University of Baghdad.2007. https://www.researchgate.net/publication/318116302_An_Introduction_to_Computational_Linguistics_AdvantagesDisadvantages.

Trandabăț, Diana, et al. Limba Română în era digitală. Ed. Georg Rehm. Iași: Springer-Verlag Berlin Heidelberg, 2012. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.592.2606&rep=rep1&type=pdf.