Start-up-urile europene se întrec să rezolve o problemă a popularelor chatbots de inteligență artificială: calitatea răspunsurilor în alte limbi decât engleza.
Silo AI, cu sediul la Helsinki, va lansa miercuri o inițiativă pentru a contribui la construirea de noi modele lingvistice mari, care stau la baza produselor de inteligență artificială generativă, cum ar fi ChatGPT de la OpenAI și Bard de la Google, în limbile europene, inclusiv suedeză, islandeză, norvegiană și daneză.
Compania finlandeză se alătură altor grupuri care lucrează pentru a îmbunătăți tehnologia din spatele chatbots, care oferă răspunsuri realiste la solicitări scrise, cu limbi precum germana, ebraica și araba.
Mișcările vin în timp ce companiile din întreaga lume încep să adopte software de inteligență artificială construit de companii precum OpenAI și Google, susținute de Microsoft, determinând criticii să își exprime îngrijorarea cu privire la o dependență excesivă de o tehnologie puternică și închisă construită de un grup mic de participanți, în principal din SUA.
„O inițiativă europeană trebuie să … să capteze cunoștințele dintr-o perspectivă europeană și să putem controla ce fel de date sunt introduse în ea”, a declarat Peter Sarlin, director executiv al Silo AI.
În prezent, Bard de la Google funcționează doar în limba engleză. ChatGPT de la OpenAI acceptă zeci de limbi, inclusiv limbi europene, hindi, farsi și altele. Cu toate acestea, nu este la fel de precisă în toate limbile, potrivit celor care au testat-o pe scară largă.
Silo AI încearcă să rezolve această problemă prin reunirea unei echipe de academicieni experimentați în domeniul IA din întreaga Europă. Aceștia vor construi, antrena și opera modele de limbi scandinave pe cel mai puternic supercomputer de pe continent, LUMI, care se află în Finlanda și a fost modificat pentru a rula software de inteligență artificială generativă.
Inițiativa noii echipe, cunoscută sub numele de SiloGen, intenționează să se extindă la mai multe limbi în timp.
Cu toate acestea, problema nu este pur lingvistică. Crearea modelelor în Europa poate asigura calitatea datelor utilizate pentru instruire este reprezentativă pentru cultura și etica țărilor din afara SUA, inclusiv în ceea ce privește aspectele legate de confidențialitate, a declarat Sarlin.
Modelul Silo AI va fi, de asemenea, open-source, ceea ce înseamnă că poate fi analizat și adaptat de oricine dorește să îl implementeze. Acest lucru este în contrast cu modelele închise ale OpenAI și Google, cu care companiile ar putea fi reticente în a împărtăși datele lor confidențiale sau de proprietate.
Alte eforturi europene includ OpenGPT-X și LEAM, care sunt ambele inițiative conduse de germani pentru a dezvolta modele lingvistice cu sursă deschisă. Modelele din OpenGPT-X sunt construite împreună cu start-up-ul german de inteligență artificială Aleph Alpha.
Când a fost lansat anul trecut, grupul din spatele OpenGPT-X a avertizat că lipsa accesului la detaliile modelelor precum GPT-4 amenință „suveranitatea digitală și independența pieței” europene în domeniul IA, ceea ce ar putea împiedica creșterea companiilor și a cercetării europene.
Marco Trombetti, directorul executiv al companiei italiene de traduceri digitale Translated, a declarat că principalele chatbots au fost programate să ofere cele mai bune rezultate în limba engleză, ceea ce „nu este corect față de restul lumii”.
Pentru a contracara acest lucru, compania sa a creat un instrument de traducere live pentru ChatGPT care funcționează în 60 de limbi și care are ca scop îmbunătățirea răspunsurilor instrumentului.
„Este ca un salt cu cinci ani înapoi, în ceea ce privește tehnologia, pentru lumea care nu vorbește limba engleză, ceea ce creează efectiv o lume cu două viteze”, a declarat Trombetti despre instrumentele actuale de inteligență artificială generativă.
Astfel de îngrijorări nu sunt exprimate doar în Europa. Autoritatea israeliană pentru inovare a cheltuit 7,5 milioane de șkh (aproximativ 2,1 milioane de dolari) pentru a crea Asociația de procesare a limbajului natural. Grupul încearcă să inverseze „calitatea slabă și insuficientă a recunoașterii vorbirii în ebraică și arabă în diferite tipuri de sisteme computerizate”, a declarat Dror Bin, directorul său executiv.
Bin a declarat că, având în vedere finanțarea limitată pentru cercetarea în domeniul IA în țările vorbitoare de limbă arabă și relativ puțini vorbitori de ebraică în lume, teama este că vor fi lăsați în urmă pe măsură ce produsele de IA sunt integrate în aplicații comerciale precum Microsoft Office și Google Workspace.
„Calitatea înțelegerii și recunoașterii vorbirii umane în ebraică și arabă este mai scăzută și constituie o barieră în calea realizării și aplicării serviciilor avansate”, a adăugat el.
Sursa – www.ft.com