MI-verseny a Google-lal: az OpenAI bemutatta a GPT-5.2 modelleket

Hírek2025.12.12.24 megtekintés

  • Az OpenAI kiadta az új GPT-5.2 mesterséges intelligencia modellcsaládot, amely három változatban érhető el.
  • Az új modellek jelentősen javultak a benchmark teszteken, néhány területen felülmúlva a Google Gemini 3 Pro-t.
  • A GPT-5.2 Thinking változat már szakértői szintet ér el a tudásalapú munkában, miközben csökkent a hibaarány és nőtt a hosszú szövegek megértése.
  • Az új modellek ára magasabb, de a megnövelt hatékonyságnak köszönhetően a végfelhasználói költségek csökkenhetnek.

Az OpenAI bemutatta a legújabb mesterséges intelligencia fejlesztését, az GPT-5.2 modellcsaládot, amely jelentős előrelépéseket mutat benchmark teszteken, és több változatban kínálja az AI-tudásmunkát professzionális felhasználók számára. A gyors ütemű fejlesztés hátterében az Google Gemini modellekkel folytatott verseny áll, amely tovább fokozza az innovációs nyomást a piacon.[^1]

Az OpenAI GPT-5.2 modellcsalád bemutatása

Az OpenAI három új modellváltozatot jelentett be:

  • GPT-5.2 Instant: mindennapi, gyors feladatokra
  • GPT-5.2 Thinking: komplex, összetett munkafolyamatokra
  • GPT-5.2 Pro: prémium opció, kiemelkedő igényekhez

Az új modellcsalád célja, hogy professzionális szintű tudásmunkát támogasson, miközben gyorsabb, olcsóbb és pontosabb eredményeket nyújt.[^1]

Jelentős teljesítménynövekedés a benchmark teszteken

Átfogó fejlesztések és összehasonlítás a konkurenciával

A GPT-5.2 Thinking változat a GDPval-benchmarkban – amely 44 különböző szakmát vizsgál – 70,9%-os pontosságot ért el, szemben az előd 38,8%-ával. Ez több mint 80%-os javulást jelent egy hónapon belül. Az OpenAI szerint ez az első modell, amely jól definiált feladatoknál vagy eléri, vagy meghaladja az emberi szakértői szintet.[^1]

A SWE-Bench Pro (szoftvermérnöki feladatok) teszten 55,6%-ot, a SWE-bench Verified teszten 80%-ot ért el a modell, mindkettő növekedést mutat az előző verzióhoz képest. A hibaarányt 30%-kal sikerült csökkenteni: a hibás válaszok aránya 8,8%-ról 6,2%-ra esett vissza egy belső teszt során.

„A GPT-5.2 Thinking az első MI-modell, amely a GDPval-benchmarkban a tudásalapú munkákban szakértői szintet ér el.” – OpenAI

Kiemelkedő teljesítmény a hosszú szövegek és képelemzés terén

A modell a hosszú szövegek értelmezésében közel 100%-os pontosságot mutatott a 4-Needle-MRCR-teszten 256.000 tokenig, amely kiemelten fontos a komplex szerződések vagy kutatási anyagok feldolgozásánál. A képelemzési feladatokban, mint a CharXiv-Reasoning, a pontosság 80,3%-ról 88,7%-ra nőtt, míg a ScreenSpot-Pro-ban 64,2%-ról 86,3%-ra ugrott.

Absztrakt gondolkodás és eszközintegráció

Az ARC-AGI-2 benchmarkban, amely az absztrakt gondolkodást méri, a GPT-5.2 Thinking 52,9%-ot ért el (szemben a GPT-5.1 17,6%-ával és a Gemini 3 Pro 31,1%-ával). Az eszközhasználati (tool-calling) feladatokban a Tau2-bench-Telecom teszten 98,7%-os sikerrel teljesített.

Árak és piaci pozicionálás

Az új GPT-5.2 modellek az API-n keresztül magasabb áron érhetők el, mint elődjeik: 1,75 USD/millió input-token és 14 USD/millió output-token, míg a Pro változat 21 illetve 168 USD/millió token. Az OpenAI szerint azonban a nagyobb hatékonyságnak köszönhetően az adott minőségi szintre vetített végfelhasználói költség csökkenhet.[^1]

A konkurens modellek, például a Google Gemini 3 Pro és az Anthropic Claude Opus 4.5, árban és teljesítményben is versenytársai az OpenAI új fejlesztésének.

Összefoglaló

Az OpenAI GPT-5.2 modellcsalád bemutatása új szintre emelte az MI-alapú tudásmunkát, és jelentős előrelépéseket hozott a hibaarány, a hatékonyság és a komplex feladatok kezelése terén. Az iparági verseny tovább éleződik, és az új fejlesztések minden bizonnyal felgyorsítják a mesterséges intelligencia gyakorlati alkalmazásának terjedését.

Forrás:

[^1]: The Decoder (2025-12-11). “KI-Wettrennen mit Google: OpenAI veröffentlicht neue Modelle GPT-5.2”. Közzétéve [2025. 12. 11.].

Follow
Keresés Népszerű
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...