👨‍🚀 OpenAI setzt neue Maßstäbe in Sachen AI Bilder

Moin AInauten,

Willkommen zur neuen Ausgabe deines Lieblingsnewsletters.

Die Woche ist wieder einiges Neues an den Start gegangen. Besonders in Sachen AI-Bilder gab es einen großen Sprung. Aber auch für alle, die gerne designen oder Webseiten bauen, haben wir etwas dabei.

Und wenn du Google Nutzer bist, lohnt es sich auch, die Ausgabe bis zum Ende zu lesen. Obwohl sie super lang geworden ist...

Hier die Themen im Detail:

🎨 ChatGPT Images 2.0 definiert neu, was mit AI-Bildern möglich ist
🪄 Du bist jetzt Designer und baust geniale Webseiten - dank DESIGN.md
🧘 Warum Google/Gemini Nutzer (noch) nicht wechseln sollten

Los geht's!

🎨 ChatGPT Images 2.0 definiert neu, was mit AI-Bildern möglich ist

Am Montag haben wir noch über die drei anonymen Modelle spekuliert, die kurz auf dem AI-Vergleichsportal LM Arena aufgetaucht und sofort wieder verschwunden sind.

Community-Konsens: OpenAIs nächste Bildgeneration.

Zwei Tage später war es dann da: ChatGPT Images 2.0 (API-Name: gpt-image-2).

Und das ist kein kleines Update. Das ist ein Release, der es in sich hat und spannende neue Use Cases bereithält - auch für uns Normalos.

— # (#)

Die Zahl, über die gerade alle diskutieren

In der LM Arena hat gpt-image-2 stolze 1.512 Punkte geholt. Nano Banana 2 (aka Google Gemini 3.1 Flash Image), das bis gestern als Maß aller Dinge galt, liegt bei 1.271.

Das sind +242 Punkte Abstand. Der größte Gap zwischen Platz 1 und Platz 2, der jemals auf diesem Leaderboard gemessen wurde.

Und zwar über alle drei Disziplinen hinweg: Text-to-Image, Single-Image-Edit, Multi-Image-Edit. OpenAI liegt damit nicht nur in einer Kategorie vorne. Sondern in allen.

Warum das Modell wirklich ein Shift ist

Erstellt von uns mit ChatGPT Image 2.0 - One Shot

Vier Sachen, die wir selbst getestet haben oder in den letzten 24h intensiv durchgeschaut haben:

1. Text-Rendering funktioniert endlich.

Texte auf Bildern wurden mit der Zeit schon immer besser.

Aber jetzt: Magazin-Cover, Infografiken, UI-Elemente, handgeschriebene Essays, sogar Barcodes - alles ist lesbar, direkt im ersten Wurf. In unseren Tests gab es keine Fehler.

2. Thinking Mode: Das Modell denkt für uns mit

Wenn du in ChatGPT ein Thinking-/Pro-Modell auswählst, plant gpt-image-2 das Bild zuerst, bevor es gerendert wird. Es kann im Web nach aktuelle Fakten suchen, den eigenen Output prüfen und bis zu 8 zusammenhängende Bilder aus einem Prompt generieren.

Ja, bis zu 8 zusammenhängende Bilder. Mit Charakter- und Objekt-Kontinuität.

Heißt konkret: Du kannst eine 4er-Serie Instagram-Posts für dein Produkt bauen. Gleiche Tasse, gleiche Farbpalette, gleiches Branding über alle Bilder. In einem Prompt.

3. Multilingual macht ernst.

Japanisch, Koreanisch, Chinesisch, Hindi, Bengali, ... alles was mit Non-Latin-Schriften zu tun hatte, war bisher oft Buchstabensuppe.

Wir brauchen selten Japanisch, aber freuen uns sehr, dass deutsche Umlaute endlich zuverlässig klappen. 😁

4. Flexible Formate.

Du kannst von 3:1 Banner bis 1:3 Mobile Vertical alles machen, direkt im Prompt. Standard-Auflösung ist 2K, 4K im Beta. Endlich kein Nachschneiden mehr, und vor allem: keine abgeschnittenen Ränder!

Erstellt von uns mit ChatGPT Image 2.0 - One Shot

Der ehrliche Vergleich zu Nano Banana 2

Jetzt nicht falsch verstehen: Googles Nano Banana 2, der bisherige Platzhirsch, ist nicht “tot”. Im Gegenteil.

Wir haben eine kleine Vergleichsengine gebaut und damit ein paar Tests gefahren.

Wie immer bei Portrait etc. ist es Geschmackssache. Beide sind stark. Der Text bei GPT ist nicht ganz clean, aber der Stil etwas authentischer und treffender - finden wir, rein subjektiv. Wirkt etwas mehr wie Berlin als Nano Banana.

Dann noch ein kurzer Magazin-Cover-Test. Hier haben wir bewusst einen super einfachen Prompt gewählt. Nach 1-2 Iterationen wurden beide Resultate deutlich besser. Oben die erste Version ohne Nachbessern.

Hier finden wir auch GPT Image 2 etwas stärker - wenn auch nicht fehlerfrei.

Im Großen und Ganzen sind beide Modelle top. Aber OpenAI hat hier definitiv neue Maßstäbe gesetzt.

So kannst du es ausprobieren

Der Abstand in der LM Arena ist beeindruckend, keine Frage. Aber wenn man die Bilder so sieht, die die neuen Modelle produzieren, sind wir immer so extrem davon beeindruckt, was heute einfach möglich ist. 🤯

Und das Beste: Die Modelle denken für uns. Was dazu führt, dass wir nicht mehr so genau prompten müssen und mit weniger Aufwand wirklich gute Ergebnisse bekommen.

AI-Bildgenerierung ist definitiv raus aus dem Spielzeug-Stadium.

Wir alle können heute produktionsreife Inhalte produzieren: Newsletter-Header, Social Graphics, Ads, Slides, Thumbnails, Produkt-Serien, Comics, Infografiken uvm.

Der Gap zwischen "Idee" und "fertigem Visual" ist von Stunden auf Minuten geschrumpft. Und er schrumpft weiter. Alle paar Monate gibt es einen Sprung wie diesen.

Das neue Image Model ist ab sofort bei ChatGPT verfügbar. Alle bezahlten Accounts haben Zugang zur Thinking-Variante.

Auch per API ist es verfügbar - entweder direkt via OpenAI oder über Partner - wir nutzen dafür gerne Fal.ai.

Jetzt bist du an der Reihe. Viel Spaß beim Experimentieren! Und wenn du Promptideen brauchst, schau einfach in unsere Prompt-Datenbank.

MIT UNSEREN PARTNERN

Warum wir dieses Jahr mehr auf AI-Events setzen

Rückblickend haben wir unsere großen Insights, Inspirationen und Kontakte sehr oft aus In-Person Events gezogen (wir kommen ja beide aus der Marketing-Ecke) .

Aktuell verbringen wir den ganzen Tag mit unseren AIs. Claude hier, ChatGPT dort, dazwischen eine Runde Automations, Vibe Coden und manchmal sogar tief gehende AI-Therapie Gespräche. Das braucht es alles, denn wir wollen ja so viel es geht für dich und uns ausprobieren - und am besten lernt man durch die Praxis-Erfahrung.

Trotzdem wächst bei uns das Bedürfnis, AI dieses Jahr mehr live und mit echten Menschen zu erleben.

Also werden wir Jahr selektiv auf ein paar mehr Events gehen und uns vielleicht auch in Form von Workshops etc. involvieren.

Zwei stehen jetzt schon fest und sind bewusst extrem gegensätzlich. Wenn du auf eines oder beide Lust hast: wir haben ordentliche Rabatte für die AINAUTEN bekommen!

Rise of AI – 6. Mai, Berlin

Das "kuratierte Dinner" unter den AI-Events. Wir sind dort seit Jahren mit dabei.

300 handverlesene Entscheider
Kein einziger Vendor-Stand, keine Pitches
Politik direkt im Raum: Bundestag, Europäisches Parlament
Fokus: Europa & AI-Souveränität
Mit C-Level, Investoren und Forschung auf Augenhöhe reden statt nur zuhören

Rise of AI-Tickets mit 20% AInauten-Rabatt

Big Bang KI Festival – 16. & 17. September, Berlin

Das komplette Gegenteil. Aber ebenso großartig. Europas größtes KI-Event.

11.000+ Gäste, 2 Tage, 5 Bühnen parallel
350+ Speaker aus Wirtschaft, Tech, Health, Politik
Große Namen (Frank Thelen, Richard David Precht)
Keynotes, Panels, Masterclasses, Networking
Jeder kann sich seine gewünschten Inhalte suchen

Große Vielfalt und für jeden was Passendes mit dabei.

Big Bang Festival-Tickets mit AInauten-Coupon 30% sparen

Code: KOOP-AIN-249

Wie gesagt erhoffen wir uns von beiden Events Inspiration, Learnings und mit Menschen in Kontakt zu kommen. Wer auf einem der beiden (oder beiden) Veranstaltungen unterwegs ist, meldet euch gerne!

🪄 Du bist jetzt Designer und baust geniale Webseiten - dank DESIGN.md

Nicht nur der Bildbereich wird durch AI ordentlich aufgewirbelt, sondern im Prinzip der ganze Designbereich.

Gerade Claude Design macht hier eine ordentliche Welle im Moment, wie wir am Montag schon erwähnt haben. Dazu kommt diese Woche auch ein Deep-Dive für alle AI POWER USER und AI AUTOMATION EXPERTS. Wir zeigen dir, wie du loslegst mit Claude Design und was es alles kann.

Dabei ist es ganz egal, ob du Webseiten, Präsentationen, Bilder oder andere Assets erstellen willst. Das alles ist möglich - aber oft hat man dabei die Herausforderung, die AI dazu zu bringen, dass sie einen bestimmten Stil beibehält.

Gerade Marken kennen das Problem…

Kommen wir daher zu einer einfachen Lösung, die uns alle zu super Designern macht.

Google open-sourced DESIGN.md

Google Labs hat ihre DESIGN.md-Spec open-sourced. Vorher war das ein proprietäres Feature in Google Stitch, eine unserer Lieblings-Design-Apps.

— # (#)

Was ist DESIGN.md?

Stell dir den Styleguide von BMW, Apple oder Nike vor.

Welche Farben, welche Schriften, welche Abstände, welcher Ton? Normalerweise ist das ein 80-Seiten-PDF beim Designer.

DESIGN.md ist genau das! Aber als eine einzige Markdown-Datei, die jede AI direkt lesen und umsetzen kann.

Die Datei besteht dabei aus mehreren Elementen:

Maschinenlesbare Tokens (Farben als Hex, Schriftgrößen, Spacing).
Menschenlesbarer Text, der das Warum erklärt ("warme Terracotta-Akzente, editoriales Layout. Do: Whitespace großzügig. Don't: Neonfarbene CTAs").

Und das Beste: Die AI kann sogar selbst prüfen, ob deine Farben WCAG-Kontrast-Regeln (Accessibility) einhalten!

Der Game Changer: fertige DESIGN.mds zum Klauen

Und jetzt wird's für alle spannend, die selbst keine Designer sind.

Es gibt bereits fertige DESIGN.md-Directories, wo Leute die Design-Systeme von Top-Brands als DESIGN.md nachgebaut haben:

Heißt: Du willst eine Landing Page, die ähnlich aussieht wie Stripe? Du kopierst einfach deren DESIGN.md. Du willst cinematisches Nike-Feeling? Gleiches Spiel.

Der 3-Schritte-Workflow (sofort umsetzbar)

DESIGN.md: Auf awesome-design-md eine Marke wählen, deren Look du willst. Datei kopieren.
Ins Projekt legen: Als DESIGN.md ins Projekt-Root anlegen. Oder bei den Tools: einfach oben im Chat reinpasten mit dem Satz "Nutze dieses Design-System".
Bauen lassen: Einfach mit normalen Prompt ergänzen, z.B. "Bau mir eine Landing Page für mein Supplements-Business mit Hero, 3 Benefits, Testimonials, FAQ, CTA-Footer." Fertig.

So erhältst du konsistente Designs und Webseiten. Super simpel. Immer.

Die andere Seite: Claude Design & Google Stich

Anthropic hat mit Claude Design sein eigenes Design-Tool aus den Labs gelassen.

Wenn du eine eigene Brand, Stil und Co. hast, aber noch keine richtige Design.md, dann kannst du das ganze natürlich auch reverse engineeren und dir von Claude Design oder Google Stich einfach bauen lassen.

Gib dazu deine Webseiten-URL in den Tools ein und sie bauen dir eine komplette Design.md mit allem, was dazu gehört.

Unser Take: Jeder kann jetzt designen

Wie bei Bildern und anderen Bereichen sehen wir auch im Design und Interfacebereich, wie AI den Zugang demokratisiert. (Oder an sich reißt.)

Früher: Design = Spezialist mit Figma + Jahren Erfahrung. Exklusiver Club.

Jetzt: Design = Spezifikation in Markdown + AI. Oder Chat + Canvas.

Die Rolle des Designers verschwindet nicht. Sie verschiebt sich. Weniger Pixel schieben, mehr Systeme definieren.

Und für alle anderen bedeutet das: Du kannst jetzt professionelle Brands, Bilder, Grafiken, Webseiten, Apps bauen, ohne je einen Designer gesehen zu haben.

🧘 Warum Google/Gemini Nutzer (noch) nicht wechseln sollten

Zum Abschluss noch eine News, die zu einem Thema passt, das uns in der täglichen Arbeit mit der AINAUTEN-Community sehr oft unterkommt.

Kurz was ist passiert…

Sergey Brin, der Google-Co-Founder, ist persönlich bei Google DeepMind aufgeschlagen und hat ein "Strike Team" aufgesetzt, das Claude beim Coden überholen soll.

Selbst Google intern finden alle Claude besser als das eigene Angebot. Google hat realisiert, dass sie hier aufholen müssen - und das Strike Team hat das Ziel, das zu ändern.

Warum das für dich wichtig ist

Aus vielen Nachrichten und der Arbeit mit vielen Unternehmen aus dem AINAUTEN-Umfeld, kommt immer wieder ein Thema auf:

"Ich nutze noch Google Workspace und Gemini. Soll ich jetzt komplett auf Claude wechseln? Alles migrieren?"

Oder: "Unser Team ist noch auf ChatGPT Enterprise. Lohnt sich der Wechsel?"

Schau dir die Bewegung im Markt an:

Ende 2025: Google führt mit Gemini 3. Teams steigen auf Google-Stack um.
Q1 2026: Claude drückt durch mit Claude Code, Cowork, Skills, Routines. Die erste Migrationswelle von ChatGPT → Claude rollt. Wir sehen es überall.
April 2026: OpenAI versucht aufzuholen (mit Codex-Update & gpt-image-2).
Jetzt: Google geht wieder in den Code Red-Modus, wie schon letztes Jahr

Ja, Anthropic hat in letzter Zeit sehr viel richtig gemacht. Sie haben ein neues Paradigma für Knowledge Work geschaffen.

Sie dominieren alles. Wer in den letzten Wochen hier nicht aufgepasst hat, hat tatsächlich einiges verpasst. Die Welt hat sich verändert. Wirklich. Claude kann auf deinem Rechner alles machen, was du auch kannst.

Die Frage, die man sich aber stellen muss: Soll ich (gerade als Unternehmen) ständig meinen AI-Tech-Stack umbauen und migrieren?

Die Entlastung

Unserer Meinung nach: Wenn du noch nicht komplett gewechselt hast, musst du jetzt nicht hektisch migrieren.

Google hat es schon mal geschafft und sie werden es wieder schaffen. Auch OpenAI ist bereits sehr nah dran an dem was Anthropic macht. Und Anthropic kann nicht auf ewig 10x schneller iterieren als die Mitbewerber.

Wir würden nie gegen Google wetten. Wenn deine ganze Infrastruktur auf Google läuft: bleib dabei. Es sollte damit bald alles möglich sein, was Claude & Co. auch können.

Drei Nerd-Bonbons für Ungeduldige

Wenn man ein wenig nerdig ist, ist es eigentlich heute schon möglich, mit dem Google Tech-Stack so zu arbeiten wie mit Claude Cowork / Code.

Du braucht dafür nur 3 Dinge.

1. Google CLI

Damit kann jeder Coding Agent direkt auf alle deine Google Apps zugreifen und darin handeln. Drive, Mail, Calendar usw.

2. Antigravity

Eigentlich ein Coding Tool. Aber das ist Claude Code auch. Du kannst auch hier direkt Gemini auf lokalen Dateien arbeiten lassen, Programme installieren lassen, … Im Prinzip fast all das, was auch Claude Code kann. Die neue Gemini Mac App ist da zum Vergleich noch sehr basic.

3. “Files over Tools”-Denken

Ziehe die Konversationen aus den Chatbots raus, speichere sie als Markdown und schaffe Ordner mit gut strukturierten Files als Context. Damit kannst du Modellunabhängig mit jedem Tool damit arbeiten! Unser Deep-Dive liefert dazu einen guten Einstieg.

→ Files over Tools-Deep Dive

Unser Take: Deine Arbeitsweise ist wichtiger als das neueste Modell

Wir merken es schon lange und glauben weiter fest daran: Die Anbieter- und Modell-Wahl ist nicht mehr das, was über Erfolg entscheidet.

Alle drei großen Labs (OpenAI, Google, Anthropic) pushen sich gegenseitig in einem immer schneller werdenden 3-Monats-Takt nach oben.

Was Claude heute kann, kann Gemini bald auch und ChatGPT/Codex sowieso. Und vice-versa.

Was bleibt: Deine Arbeitsweise.

Wie du Kontext baust. Wie du strukturierst. Wie du Files über Tools stellst. Wie du verstehst, was die Agents können und wie sie arbeiten.

Das ist unser Ziel mit dem Newsletter und der Community. Dir immer zu zeigen, wie die Frameworks hinter den Tools und dem Hype funktionieren.

Wie immer: vielen Dank fürs Lesen. War wieder sehr lang heute, aber wir hatten Spaß!

Reto & Fabian von den AInauten

Die AInauten Journey: So können wir dir helfen!

⭐ AI EXPLORER: Der schnelle Einstieg in die AI-Welt, perfekt zum Reinschnuppern, wenn du noch keine Erfahrung hast. Mehr erfahren »

⭐⭐⭐ AI POWER USER: Werde zum AI-Profi in 30 Tagen. ChatGPT Masterclass, Prompting Pro Bootcamp, 50+ Deep-Dives mit wöchentlichen Updates. Spare 10+ Stunden pro Woche. Kein Abo. Mehr erfahren »

⭐⭐⭐⭐⭐ AI AUTOMATION EXPERT: Die Königsklasse. Alle unsere Trainings aus AI EXPLORER und AI POWER USER! Plus Community mit Support. Baue Systeme, die 24/7 für dich arbeiten - mit Zapier, Make, n8n Trainings, Vibe Coding, 50+ Use Cases und Tool-Rabatte. Mehr erfahren »

👨‍🚀 OpenAI setzt neue Maßstäbe in Sachen AI-Bilder

🎨 ChatGPT Images 2.0 definiert neu, was mit AI-Bildern möglich ist

Die Zahl, über die gerade alle diskutieren

Warum das Modell wirklich ein Shift ist

Der ehrliche Vergleich zu Nano Banana 2

So kannst du es ausprobieren

Warum wir dieses Jahr mehr auf AI-Events setzen

🪄 Du bist jetzt Designer und baust geniale Webseiten - dank DESIGN.md

Google open-sourced DESIGN.md

Der Game Changer: fertige DESIGN.mds zum Klauen

Der 3-Schritte-Workflow (sofort umsetzbar)

Die andere Seite: Claude Design & Google Stich

Unser Take: Jeder kann jetzt designen

🧘 Warum Google/Gemini Nutzer (noch) nicht wechseln sollten

Kurz was ist passiert…

Warum das für dich wichtig ist

Die Entlastung

Drei Nerd-Bonbons für Ungeduldige

Unser Take: Deine Arbeitsweise ist wichtiger als das neueste Modell

Die AInauten Journey: So können wir dir helfen!

⭐️ Wie hat dir diese Ausgabe gefallen?

Weiterlesen

AINAUTEN

AI EXPLORER

AI POWER USER

AI AUTOMATION EXPERT

KONTAKT

TESTIMONIALS

IMPRESSUM