Túlzott várakozások: az összetett MI-ügynökök valós munkakörnyezetben még nem bizonyítottak

Hírek2025.12.07.18 megtekintés

  • A legtöbb produktív MI-ügynök egyszerű, korlátozott autonómiával működik, és ritkán használ komplex multi-ügynökös megoldásokat.
  • A cégek főként kézi prompt-építést alkalmaznak, az automatikus optimalizálás ritka.
  • Az MI-ügynökök legfőbb célja a produktivitás növelése és a rutinfeladatok automatizálása.
  • A technikai megbízhatóság és a teljesítmény jelentik a legnagyobb kihívást.

Az összetett mesterséges intelligencia (MI) ügynökökkel kapcsolatos várakozások túlzottnak bizonyulnak a mindennapi vállalati használatban – derül ki egy friss tanulmányból, amely szerint a ténylegesen működő rendszerek többsége egyszerű, jól kontrollált architektúrákra és emberi felügyeletre támaszkodik.

Az MI-ügynökök valós használata: egyszerűség és kontroll

Habár a tudományos publikációkban gyakran szerepelnek bonyolult, több tucat vagy akár száz lépésből álló MI-ügynökök, a vállalati gyakorlatban ezek működése jóval korlátozottabb. Az elemzett produktív rendszerek 68 százalékában az ügynökök legfeljebb tíz lépést hajtanak végre emberi beavatkozás előtt, és az esetek 47 százalékában ez kevesebb mint öt lépés.

Egyszerű, szabványos modellek és kézi promptolás dominál

Az MI-ügynököket fejlesztő csapatok 70 százaléka szabványos, előre elkészített modelleket választ, és elkerüli a bonyolult finomhangolást. A promptok (utasítások) többségét kézzel írják: 45 százalék kombinálja a manuális promptokat MI-támogatással, 34 százalék teljesen manuálisan dolgozik, míg csupán 9 százalék használ automatikus promptoptimalizáló eszközöket.

„A gyakorlatban az egyszerű, kontrollálható megközelítések élveznek előnyt.”

Az MI-ügynökök bevezetésének fő célja: produktivitás és automatizáció

A tanulmány szerint a produktív MI-ügynököket leginkább a hatékonyság növelése miatt alkalmazzák: 72,7 százalék a termelékenységet, 63,6 százalék a munkaórák csökkentését, 50 százalék a rutinfeladatok automatizálását jelöli meg fő indokként. Csak minden nyolcadik csapat említi a kockázatok csökkentését mint fő motivációt.

Főként embereket támogatnak, nem más MI-rendszereket

A produktív MI-ügynökök 92,5 százaléka embereknek nyújt támogatást, és csak elenyésző részük szolgál ki más MI-rendszereket. Az ügynököket általában először belső használatban vezetik be, hogy könnyebben kezelhetőek legyenek a hibák, és a szakemberek megtarthassák a végső döntési jogot.

Szoftverarchitektúra: saját fejlesztés előnyben a keretrendszerekkel szemben

Bár az általános felmérésben 60 százalék említ MI-ügynök keretrendszereket (például LangChain vagy CrewAI), a ténylegesen működő rendszerek 85 százaléka saját fejlesztésű, közvetlen API-hívásokkal megvalósított alkalmazás. A fő indokok között szerepel az ellenőrzés és a rugalmasság fenntartása.

Statikus folyamatok, kevés valódi autonómia

Az MI-ügynökök többsége előre meghatározott, statikus munkafolyamatokat követ, ahol az autonómia csak az egyes részfeladatok szintjén jelenik meg. Az emberi felügyelet és a rendszeres ellenőrzés továbbra is elengedhetetlen.

A legnagyobb akadály: technikai megbízhatóság

Az MI-ügynökök fejlesztésének legnagyobb kihívása a technikai megbízhatóság: a csapatok 37,9 százaléka ezt említi első helyen, megelőzve az adat- és modellminőséget, az integrációt, a megfelelőséget és az átláthatóságot. A produktív ügynökök 74 százalékát emberek értékelik, 52 százalékban MI-alapú értékeléssel kombinálva, de emberi kontrollal kiegészítve.

Frontier-modellek és pragmatikus modellválasztás

A tanulmány szerint az MI-ügynökök fejlesztői általában a leghatékonyabb, költséghatékony és szabályozási szempontból megfelelő modelleket részesítik előnyben, jellemzően a nagyvállalati, zárt forráskódú rendszerek (pl. OpenAI GPT-sorozat, Anthropic Claude).

Kutatás és gyakorlat közötti szakadék

A tanulmány rámutat, hogy a kutatási területen népszerű komplex MI-ügynök architektúrák és automatizált promptoptimalizációk jelenleg kevéssé jellemzőek a produktív vállalati rendszerekben. Az egyszerűség, átláthatóság és kontroll továbbra is elsődleges szempont marad a fejlesztés során.

„A kutatók szerint a termelékenység és az automatizáció már most érezhető, de a hype a valóságnál előrébb jár.”

Összefoglaló: Óvatos fejlődés, növekvő elvárások

Az MI-ügynökökkel kapcsolatos túlzott várakozások helyett a vállalatok jelenleg inkább óvatos, jól kontrollált megközelítést alkalmaznak. A jövőben a technikai megbízhatóság és az autonómia növekedése újabb lehetőségeket nyithat, de a tanulmány szerint a valódi áttörés még várat magára.

Forrás:

Pan et al. (2025. 12. 07.). “Komplexe KI-Agenten sind laut Studie im Arbeitsalltag noch overhyped”. The Decoder. Közzétéve [2025. 12. 07.].

Follow
Keresés Népszerű
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...