Demis Hassabis, a Google DeepMind vezérigazgatója szerint az MI-fejlesztés három fő iránya fogja meghatározni a következő évet: a multimodalitás, az interaktivitás és az autonóm működés. Ezek a technológiai áttörések alapjaiban változtathatják meg, hogyan használjuk az MI-t a mindennapokban és a munka világában.
A multimodalitás azt jelenti, hogy az MI-rendszerek többféle adatot – például szöveget, képet, hangot – képesek egyidejűleg értelmezni és feldolgozni. Demis Hassabis kiemelte, hogy a Gemini modell új alkalmazásokat tesz lehetővé e képesség révén. Egy példában utalt arra, hogyan tud az MI egy filmjelenetet filozófiai szinten értelmezni: a “Harcosok klubja” egyik jelenetében a gyűrű levétele a mindennapi élet feladásának szimbóluma az MI számára[^1].
A multimodális MI-modellek, például a Google legújabb képfeldolgozó rendszerei, már most képesek infografikák készítésére vagy vizuális tartalmak precíz elemzésére is[^1].
A Google DeepMind aktívan fejleszt olyan “világmodelleket”, mint a Genie 3, amelyekkel interaktív, bejárható videótereket lehet létrehozni valós időben. Ezek az újítások lehetővé teszik, hogy a felhasználók szabadon mozogjanak és cselekedjenek az MI által generált környezetekben, ami a játékfejlesztéstől kezdve az oktatáson át a szimulációkig számos területet forradalmasíthat.
Hassabis előrejelzése szerint az MI-ügynökök már egy éven belül képesek lehetnek önállóan, megbízhatóan és egyre összetettebb feladatokat elvégezni. A cél az, hogy ezek az MI-asszisztensek a mindennapi életben, különböző eszközökön keresztül, univerzális segítőtársként jelenjenek meg[^1].
„A cél egy univerzális asszisztens, amely végigkíséri a felhasználót az élet különböző területein.”
Az MI következő hulláma a multimodalitás, az interaktivitás és az autonóm működés köré épül. Ezek az irányok jelentősen növelhetik az MI alkalmazások gyakorlati hasznosságát, miközben új kihívásokat is teremtenek az etika, a felhasználói biztonság és a szabályozás terén. A szakértők szerint a felhasználók számára egyre természetesebb lesz az MI-eszközök használata a hétköznapokban.
[^1]: Matthias Bastian (2025. 12. 06.). “Deepmind-Chef sieht drei KI-Themen für 2026: Multimodal, interaktiv und autonom”. The Decoder. Közzétéve [2025. 12. 06. 10:17:58 +0000].