A Mistral új, nagy teljesítményű, nyílt forráskódú MI-modelleket mutatott be

Hírek2025.12.03.26 megtekintés

  • A Mistral AI bemutatta a Mistral 3 modellsorozatot, köztük az új Mistral Large 3-at és kompakt edge-modelleket[^1].
  • Az új modellek multimodálisak, többnyelvűek és teljesen nyílt forráskódúak, Apache-2.0 licenc alatt érhetők el.
  • A Mistral Large 3 jelentős teljesítményt ért el a szakmai benchmarkokon, felveszi a versenyt más vezető nyílt modellekkel.
  • A modellek több platformon, például a Hugging Face-en, az Amazon Bedrockon és az Azure Foundry-n is elérhetők.

A Mistral AI francia mesterséges intelligencia vállalat új, nagy teljesítményű, nyílt forráskódú MI-modelleket jelentett be. A Mistral 3 névre keresztelt sorozatban különböző modellméretek találhatók, köztük az új zászlóshajó, az Mistral Large 3, amely jelentős eredményeket ért el a szakmai teszteken, és több platformon is elérhetővé vált.

Az új Mistral 3 modellek fő jellemzői

Multimodális és többnyelvű MI-modellek

Az új generációs modellek közé tartozik három kisebb, úgynevezett „Ministral” modell (3, 8 és 14 milliárd paraméterrel), valamint az Mistral Large 3, amely Mixture-of-Experts architektúrát használ és mintegy 41 milliárd aktív, illetve 675 milliárd összparaméterrel rendelkezik[^1]. Ez a modell körülbelül 3000 Nvidia H200 GPU-n készült el, és képes szöveges, valamint képi tartalmak feldolgozására is.

Nyílt forráskód és teljes hozzáférhetőség

Az összes új modell teljesen nyílt forráskódú és Apache-2.0 licenc alatt érhető el, lehetővé téve a szabad használatot és integrációt különféle alkalmazásokban.

Edge-modellek és alkalmazásuk

Kompakt megoldások helyi felhasználásra

A kisebb modellek, az úgynevezett „Ministral 3” sorozat tagjai (3B, 8B, 14B) különösen alkalmasak edge-alkalmazásokra, ahol a hatékonyság és az alacsony erőforrásigény kulcsfontosságú. Ezek a modellek elérhetők alap-, „Instruct”- és „Reasoning”-változatban, mindegyikük képes képi tartalom értelmezésére is. Az Mistral szerint a Reasoning-változatok különösen erősek a következtetésre irányuló feladatokban, a 14B modell például 85%-os eredményt ért el az AIME-25 benchmarkon[^1].

Elérhetőség és ipari partnerségek

Az új modellek számos platformon hozzáférhetők, például a Mistral AI Studio, a Hugging Face, illetve olyan felhőszolgáltatók, mint az Amazon Bedrock, Azure Foundry, IBM WatsonX és Together AI. Később várható a támogatás az Nvidia NIM és az AWS SageMaker platformokon is. A fejlesztés során szoros együttműködés valósult meg az Nvidia vállalattal is.

Összehasonlítás és teljesítmény

Az Mistral Large 3 a LMArena-leaderboardon a második helyet szerezte meg az open-source modellek között (reasoning nélküli kategóriában), míg a reasoning-kategóriában a hatodik helyen végzett. A közzétett benchmarkok alapján az Mistral modellek teljesítménye felveszi a versenyt más vezető nyílt forráskódú modellekkel, mint például a Qwen vagy a Deepseek[^1][^2].

Összefoglaló

Az új Mistral 3 modellsorozat bevezetése jelentős lépés a nyílt forráskódú mesterséges intelligencia fejlesztésében, különösen a multimodális és edge-alkalmazások terén. A modellek teljesítménye és nyílt elérhetősége várhatóan ösztönzi a további innovációkat, miközben fokozza a versenyt a vezető MI-fejlesztők között.

Forrás:

[^1]: The Decoder (2025-12-02). “Mistral veröffentlicht neue leistungsstarke Open-Source-Modelle”. Közzétéve [2025. 12. 02.].
[^2]: The Decoder (2025-12-01). “Deepseek V3.2 soll GPT-5 und Gemini 3 Pro Konkurrenz machen”. Közzétéve [2025. 12. 01.].

Follow
Keresés Népszerű
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...