Stand 19. Juni 2026 existiert GPT-5.6 offiziell nicht. Es gibt weder eine Modellkarte auf der OpenAI-Website, noch eine Systemkarte, keine API-Auflistung, keine Benchmark-Tabelle und keine Preisangabe. Das derzeit ausgelieferte Flaggschiffmodell ist weiterhin GPT-5.5, das am 23. April veröffentlicht wurde. Wer behauptet, GPT-5.6 sei bereits „verfügbar“, stützt sich auf Leak-Informationen – nicht auf offizielle Veröffentlichungen.
Dennoch sind die Gerüchte ungewöhnlich laut und ungewöhnlich konkret. Ein Modellkennzeichner tauchte in den Codex-Routing-Logs von OpenAI auf; Vorhersagemärkte bewerten einen Start im Juni als nahezu sicher; zudem soll OpenAIs Chefwissenschaftler das nächste Modell intern als „deutliche Verbesserung“ bezeichnet haben. Dieser Artikel zieht eine klare Trennlinie zwischen dem, was OpenAI tatsächlich bestätigt hat, und dem, was bislang reine Hörensagen bleibt – ergänzt durch eine Einschätzung, wie das angebliche GPT-5.6 im Vergleich zu Claude Fable 5, Gemini 3.5 und der neuen Welle chinesischer Open-Weight-Modelle abschneiden würde.
Wichtigste Erkenntnisse
- Nicht angekündigt. OpenAI hat bis zum 19. Juni 2026 nichts Offizielles zu GPT-5.6 veröffentlicht – weder eine Modellkarte, noch Benchmarks oder Preise. GPT-5.5 (23. April) bleibt das aktuelle Flaggschiffmodell.
- Der Leak ist real, die Spezifikationen jedoch nicht bestätigt. Ein
gpt-5.6Ein Eintrag tauchte in den Codex-Routing-Logs auf (entdeckt am 14. Mai); die Angaben zum Kontextfenster von 1,5 Mio. Token sowie zu Mini-/Pro-Varianten und Effizienzsteigerungen stammen aus Entwickler-Tests und Berichten – nicht von OpenAI. - Eine ‚deutliche Verbesserung‘. Chefwissenschaftler Jakub Pachocki soll laut einem internen Nachrichtenaustausch gegenüber Mitarbeitern erklärt haben, dass GPT-5.6 GPT-5.5 übertrifft – so berichtet The Information, nicht aber in einer öffentlichen Aussage.
- Die Märkte setzen auf Ende Juni. Polymarket bewertete die Wahrscheinlichkeit einer Veröffentlichung im Zeitraum vom 22. bis 28. Juni mit rund 83 %; unter Einbeziehung von Manifold und breiter gefassten Formulierungen wie „bis spätestens 30. Juni“ liegt die Spanne bei etwa 80–89 %.
- Das Feld hat sich bereits bewegt. Claude Fable 5 (9. Juni) erzielte selbstberichtet 80,3 % auf SWE-bench Pro; GLM-5.2 und Kimi K2.7 wurden in der Woche vom 12. Juni mit Open-Weight-Modellen veröffentlicht.
- Wir aktualisieren bei Verfügbarkeit. Sobald OpenAI eine offizielle Modell- oder Systemkarte veröffentlicht, wird dieser Artikel mit verifizierten Zahlen aktualisiert.
Was OpenAI tatsächlich bestätigt hat
Entfernen Sie die Spekulationen – und die offizielle Aufzeichnung bleibt knapp. Die öffentliche Modellpalette von OpenAI steht Mitte Juni 2026 bei GPT-5.5 und dessen Pro-Version. Alle folgenden Informationen stammen aus primären Veröffentlichungen und Systemkarten – nicht aus Gerüchten:
- GPT-5.4 wurde am 5. März 2026 ausgeliefert und löste GPT-5.2 ab. Es reduzierte sachliche Fehler gegenüber GPT-5.2 und führte die native Computer-Nutzung ein, wobei es auf OSWorld-Verified 75 % erreichte – verglichen mit 47,3 % bei GPT-5.2 (und knapp über der menschlichen Referenz von rund 72 %). Mini- und Nano-Varianten folgten kurz darauf.
- GPT-5.5 wurde am 23. April 2026 ausgeliefert, mit API-Zugriff am nächsten Tag. OpenAI bezeichnete es als sein „klügste und intuitivste“ Modell, speziell für langfristige agentische Aufgaben konzipiert – Planung, Werkzeugnutzung und mehrstufige Ausführung. Zu den veröffentlichten Benchmarks zählen 82,7 % auf Terminal-Bench 2.0 und 51,7 % auf FrontierMath Tier 1–3. Es verfügt über ein Kontextfenster von rund 1 Mio. Token.
Das ist die bestätigte Grundlage. Falls GPT-5.6 tatsächlich erscheint, wäre es der nächste Schritt innerhalb eines 60-Tage-Rhythmus, den OpenAI das gesamte Jahr über eingehalten hat. Dieses Muster ist der stärkste Beweis für eine Veröffentlichung im Juni – doch ein Muster ist keine offizielle Ankündigung.
Was lediglich durchgesickert ist (als unbestätigt zu behandeln)
Hier kommt Vorsicht ins Spiel. Jede der folgenden Spezifikationen stammt entweder von einem Hersteller-nahen Kreis oder aus der Community – keinerlei Angaben finden sich auf einer OpenAI-Seite.
Der Codex-Log-Kennzeichner
Am 14. Mai 2026 entdeckte ein Forscher namens Haider eine einzelne auffällige Zeile in den Routing-Logs von Codex, OpenAIs Programmier-Assistenten: ein Mapping-Eintrag, der auf ein Modell namens gpt-5.6verwies. Dieser Eintrag war nur wenige Minuten reproduzierbar, bevor er in späteren Sitzungen verschwand. Das ist der einzige konkrete, reproduzierbare Datenpunkt. Er bestätigt, dass der Name innerhalb der OpenAI-Infrastruktur existiert. Er bestätigt jedoch nichts über die Fähigkeiten des Modells.
Die Behauptung zum 1,5-Mio.-Token-Kontext
Mehrere Entwickler berichten, ein nicht veröffentlichtes Modell über Codex mittels ChatGPT Pro OAuth getestet zu haben und dabei Verhalten beobachtet zu haben, das mit einem Kontextfenster von rund 1,5 Millionen Token übereinstimmt – ein Anstieg gegenüber den rund 1 Million Token von GPT-5.5. Falls zutreffend, entspräche dies einem Plus von etwa 50 % und wäre vor allem für Programmieragenten relevant, die viel Kontext benötigen, um Repositories zu lesen, Tests auszuführen und Diffs zu vergleichen. Doch „Verhalten, das damit übereinstimmt“, ist ein Testergebnis – nicht eine dokumentierte Grenze. Behandeln Sie die Zahl 1,5 Mio. daher als starkes Gerücht, nicht als eine Angabe, die Sie Ihrem CFO gegenüber zitieren können.
Varianten und Sprachfunktion
Berichte und durchgesickerte Screenshots deuten auf eine Familie– nicht auf ein einzelnes Modell – hin: eine Standardversion GPT-5.6, eine GPT-5.6 Pro sowie wahrscheinlich eine Mini-Version, zudem eine speziell für Codex optimierte Build und möglicherweise ein Alias „chat-latest“. TestingCatalog berichtete am 18. Juni, dass frühe Pro-Builds bereits bei einigen Abonnenten aufgetaucht seien, zusammen mit einem sogenannten „verschiebbaren Sprach-Bubble“, der auf ein umfassendes Update des Sprachmodus hindeutet (über das zudem separat gemunkelt wird, dass es ein neues bidirektionales Audio-Modell umfassen soll). Effizienz-Leaks deuten auf einen weiteren Rückgang der Token pro Aufgabe um 10–15 % zusätzlich zu den Verbesserungen von GPT-5.5 hin – dies erscheint angesichts der bisherigen Entwicklungslinie von OpenAI plausibel, ist jedoch noch nicht verifiziert.
Das Zitat „bedeutende Verbesserung“
Das meistzitierte Indiz ist die Aussage des Chief Scientist Jakub Pachocki, der laut einem internen Slack-Nachrichten-Beitrag, den The Information veröffentlichte, seinen Mitarbeitern gegenüber behauptet haben soll, GPT-5.6 stelle eine „bedeutende Verbesserung“ gegenüber GPT-5.5 dar. Es handelt sich um einen echten journalistischen Bericht – keine offizielle Äußerung von OpenAI – und der Ausdruck „bedeutende Verbesserung“ gehört genau zu jener Kategorie vager Formulierungen, die erst dann konkrete Aussagekraft gewinnen, wenn unabhängige Benchmarks vorliegen.
| Behauptung | Status | Quellengüte |
|---|---|---|
| Intern existiert ein Modell namens „gpt-5.6“ | Wahrscheinlich zutreffend | Codex-Log-Identifier (reproduzierbar) |
| Veröffentlichung Ende Juni 2026 | Wahrscheinlich, aber nicht bestätigt | Berichterstattung + Vorhersagemärkte (~80–89 %) |
| ~1,5-Mio.-Token-Kontextfenster | Gerüchteweise | Entwickler-Abfragen über Codex-OAuth |
| Standard-, Mini- und Pro-Varianten | Gerüchteweise | Berichterstattung + durchgesickerte Screenshots |
| 10–15 % geringere Token-Kosten pro Aufgabe | Gerüchteweise | Community-Tests |
| Offizielle Preise / Benchmarks | Existiert nicht | — |
Wie das angebliche GPT-5.6 abschneiden würde
Die unangenehme Wahrheit für OpenAI lautet: Selbst wenn sämtliche Leaks korrekt sind, trifft GPT-5.6 auf ein Feld, das nicht gewartet hat. Die nachfolgenden Überschriften stammen von Konkurrenten – und mehrere dieser Angaben basieren auf Herstellerangaben statt auf unabhängiger Prüfung; genau deshalb steht einer hypothetischen GPT-5.6 eine hohe Hürde bevor. (Zum dreiteiligen Vergleich der vorherigen Generation siehe unseren Artikel GPT-5 vs. Claude 4 vs. Gemini 3.)
| Modell | Status (Juni 2026) | Kontext | SWE-bench Pro | API-Preis (pro 1 Mio. Ein- / Ausgabe-Token) |
|---|---|---|---|---|
| GPT-5.5 (derzeitiges OpenAI-Flaggschiff) | Ausgeliefert am 23. April | ~1 Mio. | Nicht offiziell veröffentlicht* | Nutzungsbasiert |
| GPT-5.6 | Gerüchteweise | ~1,5 Mio. (durchgesickert) | Unbekannt | Unbekannt |
| Claude Fable 5 | Ausgeliefert am 9. Juni | ~1 Mio. | 80,3 % (von Anthropic angegeben†) | $10 / $50 |
| Claude Opus 4.8 | Ausgeliefert am 28. Mai | ~1 Mio. | 69,2 % (von Anthropic angegeben†) | $5 / $25 |
| Gemini 3.5 Flash | Ausgeliefert am 19. Mai | 1 Mio. | 55.1% | $1.50 / $9 |
| Gemini 3.5 Pro | Eingeschränkte Vorschau (noch nicht allgemein verfügbar) | ~2 Mio. (erwartet) | Unbekannt | Unbekannt |
| GLM-5.2 (offene Gewichte) | Ausgeliefert ca. am 13. Juni | 1 Mio. | Keine Angaben seitens des Anbieters** | Open Source / Selbsthosting |
| Kimi K2.7 Code (offene Gewichte) | Ausgeliefert ca. am 12. Juni | 256 K | Keine Angaben seitens des Anbieters** | Open Source / Selbsthosting |
*OpenAI veröffentlicht Terminal-Bench- und FrontierMath-Werte, jedoch keine SWE-bench-Pro-Zahl für GPT-5.5. †Anthropics SWE-bench-Pro-Ergebnisse sind Eigenangaben, ermittelt auf deren eigenem Scaffolding; unabhängige Evaluatoren berichteten über ein engmaschigeres Ergebnis – daher sind diese Werte als herstellereigene Angaben zu betrachten, bis neutrale Replikationen vorliegen. **Z.ai und Moonshot veröffentlichten ohne direkten SWE-bench-Pro-Vergleich; externe Test-Suiten befinden sich noch in der Messphase.
Zwei Aspekte fallen sofort ins Auge. Erstens: Die Kontextgröße ist kein Alleinstellungsmerkmal mehr. Ein durchgesickertes Kontextfenster von 1,5 Mio. Tokens würde zwar knapp die 1-Mio.-Marke übertreffen, doch Gemini 3.5 Pro wird mit 2 Mio. Tokens erwartet – GPT-5.6 könnte diesen Titel also nicht für sich beanspruchen. Zweitens: Der Agenten-basierte Programmier-Benchmark, den alle im Blick haben, stammt von Anthropic – nämlich – allerdings mit einem Vorbehalt. Fable 5 erreicht mit 80,3 % auf SWE-bench Pro den derzeitigen Spitzenwert, doch handelt es sich dabei um eine ersteigene, von Anthropic selbst ermittelte Kennzahl, die auf deren eigenem Scaffolding und nicht auf einem neutralen Testrahmen basiert; unabhängige Evaluatoren berichteten über ein weniger deutliches Ergebnis. Falls GPT-5.6 diesen Wert nicht erreicht, liest sich „bedeutende Verbesserung“ wie reine Marketing-Rhetorik – doch die Zielmarke selbst ist noch nicht endgültig festgelegt. Anthropic setzte zudem beim Markteintritt aggressiv auf Preisgestaltung: Fable 5 war bis zum 22. Juni kostenlos in den Pro-, Max-, Team- und Enterprise-Plänen enthalten – ein klarer Wettbewerbsimpuls genau zum Zeitpunkt, zu dem GPT-5.6 angeblich erscheinen soll. Unser Überblick zu den neuen Claude-Modellen geht tiefer auf diese Modellreihe ein.
Der chinesische Faktor
Die Woche vom 12. Juni brachte zwei open-weight-Coding-Modelle hervor, die die Kostenrechnung verändern. GLM-5.2 von Z.ai (Zhipu) umfasst 744 Milliarden Parameter mit etwa 40 Milliarden aktiv und einem Kontextfenster von 1 Mio. Tokens; es wurde unter der MIT-Lizenz veröffentlicht; Kimi K2.7 Code Kimi K2.7 Code von Moonshot ist ein Modell mit 1 Billion Parametern, davon 32 Milliarden aktiv, und einem Kontextfenster von 256 Kilo-Tokens. Beide Modelle werden mit offenen Gewichten ausgeliefert und richten sich an Entwickler, die state-of-the-art-Codegenerierung ohne Rechnung für GPT- oder Claude-APIs erhalten möchten. Keines der beiden Modelle hat bislang eine saubere SWE-bench-Pro-Zahl veröffentlicht, sodass ihre tatsächliche Position noch unklar ist – doch die Preisgestaltung Der Druck ist unmittelbar und real. Wenn Sie die Lücke zwischen geschlossenen US-Flaggschiffmodellen und offenen chinesischen Modellen abwägen, dann liefert unser DeepSeek-gegen-ChatGPT-Vergleich eine Übersicht über diese breitere Dynamik.
Falls die Leak-Informationen zutreffen, scheint GPT-5.6 bei folgenden Aspekten stark zu sein:
- Langkontext-Coding-Agenten (1,5-Mio.-Token-Fenster, falls zutreffend)
- Geringere Kosten pro Aufgabe – ein angeblicher Token-Rabatt von 10–15 %
- Eine vollständige Mini-/Standard-/Pro-Modellreihe zur Aufgabenbasierten Routing-Entscheidung
- OpenAIs Ökosystemreichweite (ChatGPT, Codex, API)
Gründe für Skepsis
- Es existieren bisher keinerlei offizielle Spezifikationen, Benchmarks oder Preise
- Der Kontextvorteil ist gering – Gemini 3.5 Pro zielt auf 2 Mio. Tokens ab
- Claude Fable 5 hat eine hohe (wenn auch vom Hersteller angegebene) Leistungsgrenze im agentic-coding-Bereich gesetzt
- Offene Modelle (GLM-5.2, Kimi K2.7) unterbieten hinsichtlich Kosten
Was Sie jetzt tun sollten
Wenn Sie auf OpenAI aufbauen: Verwenden Sie für Produktion weiterhin GPT-5.5, das dokumentiert und stabil ist. Entwerfen Sie keine Architektur um ein 1,5-Mio.-Token-Kontextfenster herum, das noch nicht in irgendeiner offiziellen Grenze festgelegt ist. Falls Sie diesen Quartal Coding-Assistenten evaluieren, führen Sie Benchmarks mit den aktuell verfügbaren Modellen durch – Fable 5, Opus 4.8, GPT-5.5 sowie den offenen Modellen – statt auf ein Gerücht zu warten. Unser Leitfaden zum beste KI-Coding-Assistenten vergleicht die derzeit lieferbaren Optionen direkt miteinander.
Sobald GPT-5.6 tatsächlich erscheint, sollten als Erstes das Systemdokument (Kontextlimit, Wissensstand, Sicherheitsrichtlinie), die tatsächlichen SWE-bench-Pro- und Terminal-Bench-Werte sowie der API-Preis pro Million Tokens überprüft werden. Diese drei Angaben klären die Spekulationen innerhalb eines Nachmittags.
Häufig gestellte Fragen (FAQ)
Ist GPT-5.6 bereits veröffentlicht?
Nein. Stand 19. Juni 2026 hat OpenAI GPT-5.6 weder offiziell veröffentlicht noch angekündigt. Es gibt weder eine Modellkarte, noch ein Systemdokument, keine API-Auflistung, kein Benchmark-Ergebnis und keine Preisangabe. Das derzeit verfügbare Flaggschiffmodell ist GPT-5.5, das am 23. April 2026 veröffentlicht wurde.
Wann wird GPT-5.6 voraussichtlich erscheinen?
Berichte und Vorhersagemärkte deuten auf Ende Juni 2026 hin. Polymarket bewertete die Wahrscheinlichkeit einer Veröffentlichung im Zeitraum 22.–28. Juni mit rund 83 % (bei einem Handelsvolumen von nahezu 1 Mio. USD Stand 15. Juni); allgemeinere Formulierungen wie „bis zum 30. Juni“ auf Polymarket und Manifold liegen bei etwa 80–89 %. OpenAI hat keinen Termin bestätigt – dies ist also eine Markterwartung, keine Unternehmenszusage.
Hat GPT-5.6 wirklich ein Kontextfenster von 1,5 Millionen Tokens?
Dies ist ein Leak, keine bestätigte Spezifikation. Entwickler, die ein noch nicht veröffentlichtes Modell über OAuth-Zugriff auf Codex untersuchten, berichteten über Verhalten, das mit etwa 1,5 Mio. Tokens konsistent ist – gegenüber den etwa 1 Mio. Tokens von GPT-5.5. Solange OpenAI kein offizielles Limit veröffentlicht, ist der Wert von 1,5 Mio. als glaubwürdiger Gerüchtswert und nicht als dokumentierte Größe zu betrachten.
Was sagte OpenAIs Chief Scientist zu GPT-5.6?
Laut einem Bericht von The Information erklärte Chief Scientist Jakub Pachocki intern gegenüber Mitarbeitern, GPT-5.6 sei eine „bedeutende Verbesserung“ gegenüber GPT-5.5. Dies war eine interne Äußerung, die von Journalisten publik gemacht wurde – keine öffentliche Aussage von OpenAI – und enthielt keine Benchmarks.
Wie schneidet GPT-5.6 im Vergleich zu Claude Fable 5 ab?
Ein Vergleich anhand realer Zahlen ist derzeit nicht möglich, da GPT-5.6 noch keine veröffentlichten Benchmarks vorweisen kann. Claude Fable 5, am 9. Juni veröffentlicht, meldet 80,3 % auf SWE-bench Pro (eine von Anthropic selbst erhobene Zahl, ermittelt mit eigener Infrastruktur und bislang nicht durch unabhängige Testumgebungen bestätigt) bei einem Kontextfenster von etwa 1 Mio. Tokens und Preisen von 10 bzw. 50 USD pro Million Tokens. Dies ist die öffentliche Referenzmarke, an der GPT-5.6 im Bereich agentic coding gemessen werden würde.
Gibt es GPT-5.6-Varianten in den Versionen Mini und Pro?
Berichte und durchgesickerte Screenshots deuten auf eine Modellfamilie hin – ein Standardmodell, ein Pro-Modell und wahrscheinlich auch ein Mini-Modell, möglicherweise ergänzt durch eine speziell für Codex optimierte Version. Keiner dieser Punkte wurde von OpenAI bestätigt; die genaue Modellpalette bei Markteinführung – und welche Varianten zuerst verfügbar sein werden – bleibt unbestätigt.
Sollte ich mit der Entwicklung warten, bis GPT-5.6 erscheint?
Für Produktionsanwendungen: Nein – bauen Sie heute auf dokumentierten Modellen wie GPT-5.5 auf und migrieren Sie erst, sobald GPT-5.6 mit einem echten Systemdokument und konkreten Preisen verfügbar ist. Die Architektur auf nicht bestätigten Spezifikationen aufzubauen, ist der schnellste Weg, bei falschen Gerüchten eine Regression einzuführen.
Fazit
GPT-5.6 ist das am meisten erwartete Modell, das offiziell noch gar nicht existiert. Der Name ist echt – er stammt aus OpenAIs eigenen Codex-Logs – und eine Veröffentlichung Ende Juni erscheint wahrscheinlich. Doch „wahrscheinlich“ leistet hier schwere Arbeit: Es gibt keine offiziellen Benchmarks, keine Preise und kein Systemdokument – das bedeutet, dass jede Spezifikation, die Sie gesehen haben – inklusive des 1,5-Mio.-Token-Kontextfensters – ein Gerücht ist, das sich selbstbewusst gibt. Der Wettbewerbskontext ist der klarste Teil der Geschichte: Claude Fable 5 hat eine hohe (wenn auch selbstberichtete) Leistungsgrenze im agentic-coding-Bereich gesetzt, Gemini 3.5 Pro strebt ein 2-Mio.-Token-Kontextfenster an, und offene Modelle aus China setzen vor allem auf Kostenvorteile. GPT-5.6 muss sich daher tatsächlich verbessern – nicht nur neuer sein. Wir aktualisieren diesen Artikel umgehend mit verifizierten Zahlen, sobald OpenAI das Modell veröffentlicht.
