A DeepMind vezér három kulcs MI-témát lát 2026-ra: multimodalitás, interaktivitás és autonómia

Hírek2025.12.11.21 megtekintés

  • Demis Hassabis, a DeepMind vezérigazgatója három fő MI-trendet jelölt meg 2026-ra: multimodalitás, interaktivitás, autonómia[^1].
  • Az új modellek, mint a Gemini, jelentősen bővítik az MI-képességeket többféle adat (szöveg, kép, hang) együttes feldolgozásával.
  • A DeepMind dolgozik olyan “világmodelleken”, amelyek valós idejű, interaktív videótereket képesek generálni.
  • Az MI-ügynökök a közeljövőben önállóan is képesek lehetnek komplex feladatok elvégzésére.

Demis Hassabis, a Google DeepMind vezérigazgatója szerint az MI-fejlesztés három fő iránya fogja meghatározni a következő évet: a multimodalitás, az interaktivitás és az autonóm működés. Ezek a technológiai áttörések alapjaiban változtathatják meg, hogyan használjuk az MI-t a mindennapokban és a munka világában.

Az MI fejlődésének új hulláma: multimodalitás

A multimodalitás azt jelenti, hogy az MI-rendszerek többféle adatot – például szöveget, képet, hangot – képesek egyidejűleg értelmezni és feldolgozni. Demis Hassabis kiemelte, hogy a Gemini modell új alkalmazásokat tesz lehetővé e képesség révén. Egy példában utalt arra, hogyan tud az MI egy filmjelenetet filozófiai szinten értelmezni: a “Harcosok klubja” egyik jelenetében a gyűrű levétele a mindennapi élet feladásának szimbóluma az MI számára[^1].

A multimodális MI-modellek, például a Google legújabb képfeldolgozó rendszerei, már most képesek infografikák készítésére vagy vizuális tartalmak precíz elemzésére is[^1].

Interaktivitás: Valós idejű, bejárható MI-világok

A Google DeepMind aktívan fejleszt olyan “világmodelleket”, mint a Genie 3, amelyekkel interaktív, bejárható videótereket lehet létrehozni valós időben. Ezek az újítások lehetővé teszik, hogy a felhasználók szabadon mozogjanak és cselekedjenek az MI által generált környezetekben, ami a játékfejlesztéstől kezdve az oktatáson át a szimulációkig számos területet forradalmasíthat.

Autonómia: Az MI-ügynökök jövője

Hassabis előrejelzése szerint az MI-ügynökök már egy éven belül képesek lehetnek önállóan, megbízhatóan és egyre összetettebb feladatokat elvégezni. A cél az, hogy ezek az MI-asszisztensek a mindennapi életben, különböző eszközökön keresztül, univerzális segítőtársként jelenjenek meg[^1].

„A cél egy univerzális asszisztens, amely végigkíséri a felhasználót az élet különböző területein.”

Összefoglaló: Mit hoz 2026 az MI számára?

Az MI következő hulláma a multimodalitás, az interaktivitás és az autonóm működés köré épül. Ezek az irányok jelentősen növelhetik az MI alkalmazások gyakorlati hasznosságát, miközben új kihívásokat is teremtenek az etika, a felhasználói biztonság és a szabályozás terén. A szakértők szerint a felhasználók számára egyre természetesebb lesz az MI-eszközök használata a hétköznapokban.

Forrás:

[^1]: Matthias Bastian (2025. 12. 06.). “Deepmind-Chef sieht drei KI-Themen für 2026: Multimodal, interaktiv und autonom”. The Decoder. Közzétéve [2025. 12. 06. 10:17:58 +0000].

Follow
Keresés Népszerű
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...