Az OpenAI hivatalosan is leleplezte legújabb mesterséges intelligencia modellcsaládját, a GPT-5.6-ot, ám a premier a vártnál csendesebbre sikerült. A Decrypt beszámolója szerint a vállalat pénteken elindította az új modellek limitált tesztverzióját, a döntés hátterében azonban ezúttal nem technikai akadályok, hanem közvetlen kormányzati kérés áll. Az amerikai adminisztráció ugyanis arra kérte a fejlesztőcéget, hogy korlátozza az elsődleges hozzáféréseket, amíg a hatóságok meg nem vizsgálják a rendszereket egy újonnan kidolgozott szövetségi szabályozási keretrendszer alapján. A konkrét biztonsági és képességmérésekhez az OpenAI GPT-5.6 system cardja ad részletesebb támpontot.

// hardver · 2026.06.26 A GPT-5.6 körül már az amerikai kormány is óvatos lehet Források szerint Washington óvatosságra inthette az OpenAI-t a GPT-5.6 kiadása előtt. Ha igaz, ez már nem egyszerű termékstart. olvasás →

Illusztráció: BytePoint

Sol, Terra és Luna: Három új modell a fedélzeten

Az OpenAI ezúttal egy komplett modellcsaládot mutatott be, amely a Sol, a Terra és a Luna kódneveket kapta. Mindhárom verzió eltérő igényekre lett optimalizálva, hogy a fejlesztők és a vállalkozások a leginkább költséghatékony és hatékony megoldást választhassák.

  • Sol: A termékcsalád zászlóshajója. Elsősorban a komplex programozási feladatoknál, biológiai kutatásoknál és kiberbiztonsági folyamatoknál nyújt kiemelkedő teljesítményt. Két új üzemmódot vezet be, a „max” és „ultra” következtetési (reasoning) módokat. Ezek segítségével a Sol több időt fordíthat a bonyolult problémák elemzésére, valamint képes koordinálni és felügyelni több alügynök (subagent) párhuzamos munkáját.
  • Terra: A mindennapi munkára tervezett, kiegyensúlyozott teljesítményt nyújtó modell. Képességei terén felveszi a versenyt a korábbi GPT-5.5 modellel, miközben az üzemeltetése és a token-alapú elérése kétszer olcsóbb nála.
  • Luna: A leggyorsabb és egyben a legalacsonyabb költségű verzió. Kifejezetten a nagy volumenű, de alacsonyabb számítási igényű munkafolyamatok kiszolgálására tervezték, ahol a válaszidő és a költséghatékonyság a legfontosabb szempont.

Különösen izgalmas a Sol jövője a hardveres oldalon: a tervek szerint júliusban a modell elérhetővé válik a Cerebras szuperszámítógépes platformján is, ahol a brutális teljesítményű egyedi csipeknek köszönhetően akár másodpercenként 750 tokenes következtetési sebességet is elérhet.

Mérési eredmények: erős, de nem mindenhol elszabadult

Az OpenAI system cardja alapján a GPT-5.6 Sol több biztonsági és tudományos teszten is előrelépett, de a kép nem annyira egyszerű, hogy mindenhol „letarolta” volna az elődöket. A kiberbiztonsági méréseknél például az OpenAI szerint a modell jobb lett sebezhetőségek megtalálásában és javításában, mint azok teljes kihasználásában. Ez fontos különbség: védelmi oldalon hasznos, támadó oldalon viszont pont ezért kapott erősebb korlátokat.

  • A CTF jellegű, támadó kiberbiztonsági teszteken a GPT-5.6 Sol az OpenAI szerint 96,7%-os eredményt ért el, vagyis ez a mérés gyakorlatilag telítetté vált.
  • A CVE-Bench típusú, valós webes sérülékenységeket szimuláló feladatoknál az OpenAI azt írja, hogy a Sol meghaladta a „High” küszöböt, de a legerősebb, kritikus szintű autonóm támadási képességet nem érte el.
  • A zero-day jellegű teszteknél a Sol 11%-ot ért el Easy, 12%-ot Medium, 5%-ot Hard és 0%-ot Elite kihívásokon. Ugyanezeknél a GPT-5.5 rendre 6%, 6%, 4% és 0% körül szerepelt.
  • CyScenarioBench alatt a GPT-5.6 Sol átlagosan 28%-os sikerarányt hozott, nagyjából 3 százalékponttal a GPT-5.5 fölött.
GPT-5.6 Sol vs GPT-5.5 Zero-Day kiberbiztonsági diagram
Forrás: OpenAI / Illusztráció: BytePoint

A biológiai és kutatási jellegű mérések sem egységes képet adnak. A SecureBio által vizsgált szakértői biológiai benchmarkoknál a legerősebb GPT-5.6 konfigurációk 53,5%-ot értek el a Virology Capabilities Testen, 60,0%-ot a Molecular Biology Capabilities Testen, 68,4%-ot a Human Pathogen Capabilities Testen, és 68,3%-ot a World-Class Bio feladatsoron. Utóbbinál az OpenAI szerint ez nagyjából 9 százalékpontos előny a GPT-5.5-höz képest.

GPT-5.6 Sol SecureBio biológiai kutatási diagram
Forrás: SecureBio / OpenAI / Illusztráció: BytePoint

Van olyan mérés is, ahol a szám kifejezetten óvatosságra int. Az AAV capsid packaging prediction teszten a GPT-5.6 Sol 0,529-es Spearman-korrelációt ért el, szinte ugyanott, ahol a GPT-5.5 0,528-cal, és még a 0,600-as belső küszöb alatt maradt. Vagyis nem minden területen beszélhetünk látványos ugrásról.

Az OpenAI külön kitér a láncolt gondolkodás kontrollálhatóságára is. A CoT-Control teszten a GPT-5.6 Sol 5 ezer token körüli gondolatmeneteknél 1,3%-ban tudta sikeresen kontrollálni a láncolt gondolkodását, míg a GPT-5.5 0,4%-ot, a GPT-5.4 Thinking pedig 0,7%-ot ért el. Ez kicsi számnak tűnik, de biztonsági szempontból pont az a lényeg, hogy a modell ne legyen túl jó a saját gondolatmenetének elfedésében vagy formázásában.

Állami kontroll és szigorú kiberbiztonsági korlátok

A rendkívüli képességek ugyanakkor fokozott biztonsági kockázatokkal járnak, ami magyarázza a Trump-adminisztráció óvatosságát. Nem ez az első eset, hogy az amerikai kormány beavatkozik az AI-piac alakulásába: ebben a hónapban ez már a második alkalom, hogy a Fehér Ház korlátozást kér. Korábban az Anthropicot szólították fel arra, hogy a biztonsági értékelések idejére korlátozza a Fable 5 és a Mythos 5 modellek hozzáférését.

Az OpenAI hangsúlyozta, hogy a GPT-5.6 Sol fejlett kiberbiztonsági védelemmel és beépített korlátozásokkal rendelkezik, amelyeket a kiberbiztonsági kutatások támogatására, de a támadó célú visszaélésem megelőzésére fejlesztettek ki. A tesztek során a Sol a kritikus küszöbérték (Cyber Critical threshold) alatt maradt, ami azt jelenti, hogy bár képes azonosítani a biztonsági réseket és elemezni az exploit komponenseket, önállóan nem tudott felépíteni egy teljes, működőképes támadási láncot.

Az OpenAI korábbi biztonsági fejlesztései, mint például a kiberbiztonsági benchmarkokban domináló GPT-5.5-Cyber, már előrevetítették a szigorúbb ellenőrzések szükségességét, a kormányzati szervek pedig láthatóan nem akarnak kockáztatni az újabb verziókkal. A modell szintű védelmet úgy tervezték meg, hogy az ellenálljon a jailbreak-kísérleteknek és a kifinomult, szándékot elfedő felhasználói kérdéseknek is.

Átmeneti zártság után jön a nagyközönségi start

A jelenleg futó tesztfázisban a GPT-5.6 Sol, Terra és Luna modellek kizárólag az API-n és a Codex-en keresztül érhetők el a kijelölt, megbízható fejlesztői partnerek számára, akiknek listáját az OpenAI megosztotta az amerikai kormánnyal. A korlátozások ellenére a vállalat megerősítette, hogy továbbra is elkötelezett a széles körű hozzáférés mellett.

„Hiszünk a széles körű hozzáférésben, és azt tervezzük, hogy a GPT-5.6 Sol, Terra és Luna modelleket a következő hetekben általánosan elérhetővé tesszük” – írta a vállalat a közleményében, így a ChatGPT előfizetőknek és a nyilvánosságnak feltehetően már nem kell sokat várnia a frissítésekre.