Mesterséges intelligencia

2022.08.17. 12:43

Az angol közbeiktatása nélkül fordít kétszáz nyelv között a Meta legújabb fejlesztése

Szuperkönnyű a fordítás a nagy nyelvek esetén, sokkal nehezebb, ha minőségi tartalmat keresünk valamelyik egzotikus nyelven.

Illusztráció

Forrás: Shutterstock

A hétezer beszélt nyelv közül van, amelyet több milliárdan megértenek, de olyan is bőséggel akad, amelyet pár százan, esetleg néhány ezren beszélnek. A különböző nyelvek közötti átmenetet megkönnyítő mesterségesintelligencia-alkalmazások közül a legújabb fejlesztés kétszáz nyelven ért - hívta fel a figyelmet a programra cikkében a Magyar Nemzet

Két adott nyelv közötti fordítás – különösen, ha egyik sem angol – jelentős kihívásnak bizonyult a mesterséges intelligencia nyelvi modelljei számára, mert e fordítórendszerek alapvetően az internetről származó írott adatokra támaszkodnak. Szuperkönnyű a fordítás a nagy nyelvek esetén, sokkal nehezebb, ha minőségi tartalmat keresünk valamelyik egzotikus nyelven.

A Facebook, amely tavaly október óta Meta néven ismert, hat hónappal ezelőtt elindította ambiciózus No Language Left Behind (NLLB) projektjét, amelynek célja, hogy a mesterséges intelligencia segítségével zökkenőmentesen fordítson számos nyelv között anélkül, hogy a szöveget először angolra kellene átültetni. 

Azaz egy magyar szöveget az angol közbeiktatása nélkül alakítana át például izlandira. A cég első nagy sikere az NLLB-200 névre keresztelt mesterségesintelligencia-modell, amely elvileg kétszáz nyelven tud beszélni, köztük számos kevésbé széles körben beszélten Ázsiából és Afrikából, például laoszi és kamba nyelven. 

A cég szerint az NLLB-200 egyebek mellett 55 afrikai nyelvet fordít le kiváló minőségben. A Meta fejlesztői azzal büszkélkednek, hogy a modell teljesítménye átlagosan 44 százalékkal, a kiválasztott afrikai és indiai dialektusok esetében pedig hetven százalékkal felülmúlja a meglévő (nyelvátültető) csúcsmodelleket.

A legtöbb nyilvánosan támogatott mesterségesintelligencia-programhoz hasonlóan a Meta is nyílt forráskódúvá, azaz szabadon felhasználhatóvá teszi a programot, valamint kétszázezer dolláros támogatást nyújt nonprofit szervezeteknek, hogy további alkalmazásokat fejlesszenek ki a technológia használatával.

Képzeld el, hogy felkeresed kedvenc Facebook-csoportod, ahol találkozol egy luganda nyelven írt bejegyzéssel! Egyetlen gombnyomással meg tudod érteni azt a saját nyelveden

– indokolta a kezdeményezést a Meta.

Az új modell működésének megértését demóprogram segíti, amely a No Language Left Behind program legújabb fejlesztéseit használja. A szövegeket származási nyelvükről, például indonézről, szomáliról és burmairól fordítja le – az elkövetkező hónapokban – több száz nyelvre. 

Ezzel a mesterségesintelligencia-eszközzel a családok a világ minden táján mostantól együtt olvashatnak történeteket anyanyelvükön. E cikk írásakor A herceg és a tigris minangkabau nyelven írt mesét – Indonéziában használt nyelvről van szó – angolra fordították, de baszkul, katalánul, portugálul és még néhány nyelven szintén elérhető a szöveg. A magyar még nem szerepelt a kiválasztottak között.

Ezek is érdekelhetik

Hírlevél feliratkozás
Ne maradjon le a boon.hu legfontosabb híreiről! Adja meg a nevét és az e-mail-címét, és mi naponta elküldjük Önnek a legfontosabb híreinket!