Az OpenAI bemutatta a legújabb mesterséges intelligencia fejlesztését, az GPT-5.2 modellcsaládot, amely jelentős előrelépéseket mutat benchmark teszteken, és több változatban kínálja az AI-tudásmunkát professzionális felhasználók számára. A gyors ütemű fejlesztés hátterében az Google Gemini modellekkel folytatott verseny áll, amely tovább fokozza az innovációs nyomást a piacon.[^1]
Az OpenAI három új modellváltozatot jelentett be:
Az új modellcsalád célja, hogy professzionális szintű tudásmunkát támogasson, miközben gyorsabb, olcsóbb és pontosabb eredményeket nyújt.[^1]
A GPT-5.2 Thinking változat a GDPval-benchmarkban – amely 44 különböző szakmát vizsgál – 70,9%-os pontosságot ért el, szemben az előd 38,8%-ával. Ez több mint 80%-os javulást jelent egy hónapon belül. Az OpenAI szerint ez az első modell, amely jól definiált feladatoknál vagy eléri, vagy meghaladja az emberi szakértői szintet.[^1]
A SWE-Bench Pro (szoftvermérnöki feladatok) teszten 55,6%-ot, a SWE-bench Verified teszten 80%-ot ért el a modell, mindkettő növekedést mutat az előző verzióhoz képest. A hibaarányt 30%-kal sikerült csökkenteni: a hibás válaszok aránya 8,8%-ról 6,2%-ra esett vissza egy belső teszt során.
„A GPT-5.2 Thinking az első MI-modell, amely a GDPval-benchmarkban a tudásalapú munkákban szakértői szintet ér el.” – OpenAI
A modell a hosszú szövegek értelmezésében közel 100%-os pontosságot mutatott a 4-Needle-MRCR-teszten 256.000 tokenig, amely kiemelten fontos a komplex szerződések vagy kutatási anyagok feldolgozásánál. A képelemzési feladatokban, mint a CharXiv-Reasoning, a pontosság 80,3%-ról 88,7%-ra nőtt, míg a ScreenSpot-Pro-ban 64,2%-ról 86,3%-ra ugrott.
Az ARC-AGI-2 benchmarkban, amely az absztrakt gondolkodást méri, a GPT-5.2 Thinking 52,9%-ot ért el (szemben a GPT-5.1 17,6%-ával és a Gemini 3 Pro 31,1%-ával). Az eszközhasználati (tool-calling) feladatokban a Tau2-bench-Telecom teszten 98,7%-os sikerrel teljesített.
Az új GPT-5.2 modellek az API-n keresztül magasabb áron érhetők el, mint elődjeik: 1,75 USD/millió input-token és 14 USD/millió output-token, míg a Pro változat 21 illetve 168 USD/millió token. Az OpenAI szerint azonban a nagyobb hatékonyságnak köszönhetően az adott minőségi szintre vetített végfelhasználói költség csökkenhet.[^1]
A konkurens modellek, például a Google Gemini 3 Pro és az Anthropic Claude Opus 4.5, árban és teljesítményben is versenytársai az OpenAI új fejlesztésének.
Az OpenAI GPT-5.2 modellcsalád bemutatása új szintre emelte az MI-alapú tudásmunkát, és jelentős előrelépéseket hozott a hibaarány, a hatékonyság és a komplex feladatok kezelése terén. Az iparági verseny tovább éleződik, és az új fejlesztések minden bizonnyal felgyorsítják a mesterséges intelligencia gyakorlati alkalmazásának terjedését.
[^1]: The Decoder (2025-12-11). “KI-Wettrennen mit Google: OpenAI veröffentlicht neue Modelle GPT-5.2”. Közzétéve [2025. 12. 11.].