Kisgyerek

Egy baba fejére szerelt kamerával tanulta meg a nyelvet a mesterséges intelligencia

Az AI-nak sikerült megérteni, hogyan sajátítják el a nyelvet a gyerekek.
2024. Február 07.
baba beszél
Kép: Getty Images

Az elmúlt egy évben több minden is kiderült a beszédfejlődésről, például hogy az értelmes társalgás hallatára már a néhány hónapos csecsemők agyának beszédközpontja is látható fejlődésnek indul, vagy az, hogy egy olasz kutatás szerint már az anyaméhben megkezdődik az anyanyelv feldolgozása a magzati agyban, írja a Qubit.hu

Az emberi agy sokkal bonyolultabb, mint az AI: miközben még a legelső GPT-modellbe is sok-sok millió szóból álló szövegeket kellett betáplálni, hogy megtanuljon úgy fogalmazni, mint egy ember, a gyerekeknek a hallott szavak alapján kell rájönniük a nyelv bonyolult szabályrendszerére. És ez a legtöbb esetben működik is: hároméves korukban már sok mindent ki tudnak fejezni.

A New York-i Egyetem kutatói arra voltak kíváncsiak, hogy az AI mit kezd azzal, ha csak annyi információt kap, amennyihez egy kisbaba is hozzáfér. Hogy ezt megvizsgálják, kamerát rögzítettek egy sisakra, amit a kísérletben részt vevő féléves ausztrál kisfiú, Sam fejére helyeztek. A fiú kétéves koráig viselte hetente két alkalommal, így összesen 61 órányi videófelvétel gyűlt össze, ami a másfél éves kísérlet során ébren töltött óráinak 1 százalékát teszi ki.

A kutatók végül a videókból származó 600 ezer képkockát és a felvételeken elhangzó 250 ezer szó átiratát táplálták be az agy felépítését imitáló neurális hálóba. Az AI-nak rá kellett jönnie, hogy a játék, etetés, meseolvasás és más tevékenységek során elhangzó szavak és a kamera által rögzített képek illenek-e egymáshoz, vagy sem.

Az eredmények szerint az AI kiemelkedően jól teljesített a teszten: az esetek 62 százalékában eltalálta, melyik kép tartozik a szóhoz.

A kutatók elismerték, hogy mivel a kísérletet egyetlen gyerekkel végezték el, nem lehet általánosítani az eredményekből, hiszen minden egyes gyerek környezete és tapasztalatai különböznek egymástól. Azt azonban már ebből a kutatásból is le lehet szűrni, hogy a csecsemők az egyes érzékszervi források közötti asszociációk alapján rengeteget tanulnak. Az eredmények olyan tudósokat is megkérdőjeleznek – például Noam Chomsky amerikai nyelvészt -, akik azt állítják, hogy a nyelv túlságosan összetett, az információbevitel pedig túl ritka ahhoz, hogy a nyelvelsajátítás általános tanulási folyamatok révén történjen.

Persze az, hogy össze tudunk párosítani szavakat és tárgyakat, még nem jelenti azt, hogy tudunk egy nyelvet, ez csak egy kis része a beszédtanulási folyamatnak. A kutatók szándéka, hogy tovább finomítsák a kutatást és más alanyokat, gyerekeket is bevonjanak.

(Nature.com, Qubit.hu)