Az összetett mesterséges intelligencia (MI) ügynökökkel kapcsolatos várakozások túlzottnak bizonyulnak a mindennapi vállalati használatban – derül ki egy friss tanulmányból, amely szerint a ténylegesen működő rendszerek többsége egyszerű, jól kontrollált architektúrákra és emberi felügyeletre támaszkodik.
Habár a tudományos publikációkban gyakran szerepelnek bonyolult, több tucat vagy akár száz lépésből álló MI-ügynökök, a vállalati gyakorlatban ezek működése jóval korlátozottabb. Az elemzett produktív rendszerek 68 százalékában az ügynökök legfeljebb tíz lépést hajtanak végre emberi beavatkozás előtt, és az esetek 47 százalékában ez kevesebb mint öt lépés.
Az MI-ügynököket fejlesztő csapatok 70 százaléka szabványos, előre elkészített modelleket választ, és elkerüli a bonyolult finomhangolást. A promptok (utasítások) többségét kézzel írják: 45 százalék kombinálja a manuális promptokat MI-támogatással, 34 százalék teljesen manuálisan dolgozik, míg csupán 9 százalék használ automatikus promptoptimalizáló eszközöket.
„A gyakorlatban az egyszerű, kontrollálható megközelítések élveznek előnyt.”
A tanulmány szerint a produktív MI-ügynököket leginkább a hatékonyság növelése miatt alkalmazzák: 72,7 százalék a termelékenységet, 63,6 százalék a munkaórák csökkentését, 50 százalék a rutinfeladatok automatizálását jelöli meg fő indokként. Csak minden nyolcadik csapat említi a kockázatok csökkentését mint fő motivációt.
A produktív MI-ügynökök 92,5 százaléka embereknek nyújt támogatást, és csak elenyésző részük szolgál ki más MI-rendszereket. Az ügynököket általában először belső használatban vezetik be, hogy könnyebben kezelhetőek legyenek a hibák, és a szakemberek megtarthassák a végső döntési jogot.
Bár az általános felmérésben 60 százalék említ MI-ügynök keretrendszereket (például LangChain vagy CrewAI), a ténylegesen működő rendszerek 85 százaléka saját fejlesztésű, közvetlen API-hívásokkal megvalósított alkalmazás. A fő indokok között szerepel az ellenőrzés és a rugalmasság fenntartása.
Az MI-ügynökök többsége előre meghatározott, statikus munkafolyamatokat követ, ahol az autonómia csak az egyes részfeladatok szintjén jelenik meg. Az emberi felügyelet és a rendszeres ellenőrzés továbbra is elengedhetetlen.
Az MI-ügynökök fejlesztésének legnagyobb kihívása a technikai megbízhatóság: a csapatok 37,9 százaléka ezt említi első helyen, megelőzve az adat- és modellminőséget, az integrációt, a megfelelőséget és az átláthatóságot. A produktív ügynökök 74 százalékát emberek értékelik, 52 százalékban MI-alapú értékeléssel kombinálva, de emberi kontrollal kiegészítve.
A tanulmány szerint az MI-ügynökök fejlesztői általában a leghatékonyabb, költséghatékony és szabályozási szempontból megfelelő modelleket részesítik előnyben, jellemzően a nagyvállalati, zárt forráskódú rendszerek (pl. OpenAI GPT-sorozat, Anthropic Claude).
A tanulmány rámutat, hogy a kutatási területen népszerű komplex MI-ügynök architektúrák és automatizált promptoptimalizációk jelenleg kevéssé jellemzőek a produktív vállalati rendszerekben. Az egyszerűség, átláthatóság és kontroll továbbra is elsődleges szempont marad a fejlesztés során.
„A kutatók szerint a termelékenység és az automatizáció már most érezhető, de a hype a valóságnál előrébb jár.”
Az MI-ügynökökkel kapcsolatos túlzott várakozások helyett a vállalatok jelenleg inkább óvatos, jól kontrollált megközelítést alkalmaznak. A jövőben a technikai megbízhatóság és az autonómia növekedése újabb lehetőségeket nyithat, de a tanulmány szerint a valódi áttörés még várat magára.
Pan et al. (2025. 12. 07.). “Komplexe KI-Agenten sind laut Studie im Arbeitsalltag noch overhyped”. The Decoder. Közzétéve [2025. 12. 07.].