- AINAUTEN
- Posts
- 👨🚀 OpenAI experimentiert mit neuem Modell herum - und holt Gold!
👨🚀 OpenAI experimentiert mit neuem Modell herum - und holt Gold!
PLUS: Solltest du den neuen ChatGPT Agent bereits nutzen?

Moin AInauten,
Willkommen zur neuen Ausgabe deines Lieblingsnewsletters!
Heute gibt’s wieder einmal ein OpenAI-Spezial, das es in sich hat. Zwischen Mathe-Wunder, Agenten-Hype und einer Prise AI-Entertainment fragen wir uns: Werden wir gerade Zeugen der Geburt echter Superintelligenz? Oder sind das nur smarte Marketing-Stunts?
Das haben wir heute für dich im Gepäck:
🐳 OpenAIs Geheimwaffe - ein Modell-Experiment holt Gold
🔥 OpenAIs ChatGPT agent: Viel Lärm um nichts oder echter Durchbruch?
😁 AI-Fun: Die lustigsten Homevideos, AI-Edition
Let’s dive in, es wird wild!
🐳 OpenAIs Geheimwaffe - ein Modell-Experiment, das zufällig die Goldmedaille holt
OpenAI hat diese Woche wieder mehrfach von sich reden gemacht.
Zum einen war da der Release des neuen OpenAI Agents (dazu unten mehr).
Zum anderen soll GPT-5 “sehr bald” released werden, mit automatischer Modellwahl.
Ein ehemaliger Mitarbeiter gibt Einblicke, wie es ist, bei OpenAI zu arbeiten.
Und OpenAI erreicht den 2. Platz in einem internationalem Code-Wettbewerb.
Aber richtig spannend wird es beim Thema der Internationalen Mathe Olympiade (IMO), denn dieses Mal gab es eine saftige Überraschung: ein neues Modell von OpenAI hat die Goldmedaille abgeräumt!
Was auf den ersten Blick nur wie ein weiterer Haken in einer langen Liste an geknackten Benchmarks ausschaut, hat eine größere Tragweite. Steigen wir ein…
Science is just "fuck around, find out" but you write it down.
OpenAI just FAFO'd so hard they won math.
— David Shapiro ⏩ (@DaveShapi)
4:45 PM • Jul 19, 2025
Der Paukenschlag: AI erobert die mathematische Elite und holt Gold!
Warum ist das so krass? Die Mathe Olympiade fordert kreatives Denken und lange Beweise, nicht nur stumpfes Rechnen.
Sam tweetet: "Das ist ein Meilenstein für allgemeine Intelligenz - wir releasen GPT-5 bald, aber das hier ist experimentell und kommt nicht sofort."
Früher haben AI-Modelle bei sowas kläglich versagt. Aber OpenAI hat mit Reinforcement Learning und mehr "Denk-Zeit" (Test-Time Compute Scaling) nachgelegt - und damit den Sprung vom Grundschul-Mathe-Niveau zum Olympia-Podestplatz mit Goldmedaille in unter zwei Jahren realisiert.
Diese Leistung ist einem neuen experimentellen Reasoning-Modell zu verdanken. Angetreten ist das Modell unter denselben Regeln wie die menschlichen Teilnehmer: Kein Internet, keine Tools, nur 4,5 Stunden pro Session, und volle natürliche Sprach-Beweise - und hat dabei 5 von 6 Problemen gelöst, 35 von 42 Punkten geholt!
Sogar die OpenAI Researcher waren überrascht von den Ergebnissen. Wer im Detail nachrechnen will, kann das hier auf Github tun.

Beispiel einer gelösten Aufgabe - wir verstehen Bahnhof …
“One Model to rule them all …”
Das Beeindruckende dabei ist, dass es sich um ein neues, nicht öffentliches, nicht-spezialisiertes Modell handelt - das somit auf alle möglichen Domänen angewendet werden kann! Nicht nur AI selbst basiert auf Mathe, sondern Mathe ist auch der Grundstein für STEM (Science, Technology, Engineering, Math).
Eine AI, die das meistert, kann theoretisch auch Quantenphysik knacken, neue Theorien erfinden oder riesige Datenmengen aus Experimenten analysieren - und uns dabei helfen, die Geheimnisse des Universums noch schneller und tiefer zu erkunden.
Nächstes Jahr werden wir vielleicht sehr wahrscheinlich bereits von AI neu entdeckte Theoreme sehen. Auch AI-Kritiker Gary Marcus gibt zähneknirschend zu: “Das ist beeindruckend.”
Selbst die Prediction-Markets wie Manifold hat es auf dem linken Fuss erwischt: vor der Ankündigung lag die Einschätzung für eine Goldmedaille bei lediglich 20 % - jetzt ist sie bei 95 %! Das zeigt, dass AI schnell und oftmals auch unter Ausschluss der Öffentlichkeit voranschreitet.

via Manifold.markets
Google DeepMind war letztes Jahr bereits gut aufgestellt und hat angeblich dieses Jahr auch Gold-Niveau erreicht, aber das noch nicht verkündet. Grok-4 hingegen schafft es noch nicht auf Gold.
Unser Take: Wie geht es weiter? Exp…ohhhh…nentiell!
Das ist kein Nischensieg – es beschleunigt den Weg zu ASI (Artificial Superintelligence) vor 2027. Das Krasse dabei: es geht nur noch exponentiell weiter von hier - und das beschäftigt uns gerade schwer …
🥇 OpenAI has achieved gold-level at the International Math Olympiad
(People used to say they'd consider this AGI, btw.)
Why this matters:
50% chance of fast takeoff? Paul Christiano - inventor of RLHF, certified genius, and arguably the most respected alignment researcher in
— AI Notkilleveryoneism Memes ⏸️ (@AISafetyMemes)
8:25 AM • Jul 19, 2025
Dabei ist es für unsere peace of mind auch nicht gerade förderlich, dass über 40 führende Forscher von OpenAI, Google Deepmind und Anthropic sich zusammenschließen, um eine wichtige Warnung auszusprechen (PDF hier): “Wir verlieren die Fähigkeit, AI zu verstehen!“
Auf der anderen Seite wird die mahnende Stimme in Hinterkopf dann mit Meldungen wie dieser zu einem “universellen Krebs Impfstoff” wieder kurzzeitig ruhiggestellt…

via ChatGPT
🔥 OpenAIs ChatGPT agent: Viel Lärm um nichts oder echter Durchbruch?
OpenAI hat ChatGPT agent gelauncht und (fast) alle flippen aus. Aber mal ehrlich: Ist das wirklich der Game-Changer, für den sie es verkaufen? Spoiler: Eher nein.
Nach wochenlangem Hype um Agents liefert OpenAI endlich ab. ChatGPT agent soll dabei alles können: Webseiten bedienen, recherchieren, Präsentationen erstellen, sogar einkaufen. Klingt nicht schlecht - bis man genauer hinschaut.
Was der Agent wirklich kann (und was nicht)
Ja, das System kombiniert Operator, Deep Research und ChatGPT zu einer Einheit. Ja, es kann theoretisch komplexe Workflows abarbeiten. Ja, du kannst es bald in deinem ChatGPT Plus Account testen.
Der technische Werkzeugkasten ist durchaus beeindruckend und das System soll automatisch das beste Tool für jede Aufgabe wählen:
Visueller Browser für grafische Oberflächen,
textbasierter Browser für einfache Web-Abfragen,
Terminal-Zugriff und
direkter API-Zugang.
Plus Konnektoren zu Gmail, GitHub und Co.
OpenAI LiveStream | Research & Action |
Slideshows | Spreadsheets |
Es kann mit einer Tastatur und Maus alles machen, was du auch kannst. Kreditkarten-Eingaben, Banking, E-Mails verschicken. Und das führt natürlich auch zu einem erhöhten Risikoprofil.
Es scheint fast, als hätte OpenAI Angst vor dem, was sie da gebaut haben. Die Hälfte der Ankündigung drehte sich um Prompt Injections, und der Agent wurde als "High Biological Risk" eingestuft - ob das eine Einstufung war, um mehr Medienwirksamkeit zu erreichen, oder ob es echte Risiken gibt? Who knows…
Alternative Agents wie Genspark und Co. sind um einiges besser
Aber die Realität hat noch ein paar Überraschungen parat: wer auf X nach “ChatGPT agent vs. …” sucht, dem wird schnell klar: der einzige Agent, den ChatGPT hier überrundet hat, ist der Operator aus dem $200-Dollar-OpenAI-Plan…
ChatGPT agent ist langsam, unzuverlässig, bleibt stecken und liefert unterdurchschnittliche Resultate. Alternativen wie Genspark, Manus, etc. haben hier aktuell klar die Nase vorn.
Erst vor zwei Wochen hat OpenAI GenSparks Super Agent ins Rampenlicht gerückt, der in nur 1,5 Monaten satte 36 Millionen Dollar Umsatz gemacht hat. “Danke für die Werbung”, hat sich Genspark wohl gedacht - und setzt noch einen obendrauf…
Sie wetten rund $1 Million Preisgeld, dass ihre Resultate besser sind als die von ChatGPT agent! Wir lieben solche Guerilla-Marketing-Aktionen - keep ‘em coming, das ist Entertainment pur.
P.S. Wir sind schon lange Fans von Genspark und ChatLLM. Letztlich geht es vor allem darum, ordentliche Prozesse zu haben - und dafür bewährte und zuverlässige Automatisierungen mit AI zu bauen (sehen wir uns in der AInauten Community?).
🚨 $1 MILLION GENSPARK SIDE-BY-SIDE AI SHOWDOWN 🚨
Battle 1: Slides Generation
👊 Genspark vs ChatGPT Agent
💵 $100K on the lineSame prompt. One shot. Side-by-side results.
We think we're pretty good, but we're hunting for more cases where ChatGPT might have an edge—help us
— Genspark (@genspark_ai)
10:39 PM • Jul 18, 2025
ChatGPT agent ist in der EU natürlich noch nicht verfügbar …
Ach ja, natürlich ist das neue Feature für den DACH-Raum nicht zugänglich. Es soll aber in den nächsten Tagen auf alle Plus-User ausgerollt werden.
Wenn du also einen kostenpflichtigen ChatGPT-Account hast, gilt wie immer in solchen Fällen: VPN aktivieren und mit einer amerikanischen IP-Adresse testen!
Oder du kannst auch mal Mistral eine Chance geben. Dort ist Deep Research neu auch eine Option, und du kannst Magistral (Download) für Reasoning, Devstral (Download) für Coding und Voxstral (Download) für Voice nutzen.
Der nächste logische Schritt liegt auch für Mistral auf der Hand: alles in einen Agenten zu packen!
Unser Take: Abwarten und Tee trinken
Agent ist eine beeindruckende Tech-Demo. Aber ein Tool, das dich produktiver macht? Hmm… irgendwie scheint es noch nicht in allen Bereichen ready for prime time.
Es zeigt uns einen Vorgeschmack auf die Zukunft, auch wenn sie bei OpenAI noch 1-2 Jahre ein paar Monate entfernt ist.
Das Positive ist auf jeden Fall auch, dass OpenAI durch den großflächigen Rollout unglaublich viele Daten erhält, mit denen das System verbessert werden kann.
Und sicher ist auch, dass je mehr ChatGPT selbst machen kann (👋 hello, GPT-5!), desto weniger brauchst du andere Tools. Und dass OpenAI bald einen eigenen Browser (Codename “Aura”) rausbringt, ist kein Zufall. Es bleibt spannend!
😁 AI-Fun: Die lustigsten Homevideos, AI-Edition
Zum Abschluss auch noch etwas Spaß: Da soll mal einer sagen, AI-Videos seien langweilig.
AI is getting out of hand 😂
America's Funniest AI Home Videos AI-made bloopers that never happened
— Min Choi (@minchoi)
3:53 AM • May 14, 2025
Geschafft! Bis zur nächsten Ausgabe.
Reto & Fabian von den AInauten
Wann immer du bereit bist, so können wir dir helfen:
👨🚀 AINAUTEN CRASHKURS + WÖCHENTLICHE UPDATES: Der wohl schnellste und einfachste Einstieg in die Welt der AI. Im Crashkurs lernst du schnell, wie du AI für dich wirklich anwenden kannst. In weniger als zwei Wochen wirst du damit zum AI-Experten. Von Prompts, zu Bildern und Videos, bis zu AI im Office ist alles mit dabei. Und mit AInauten Premium erhältst du jede Woche neue wichtige Deep-Dives. Klicke hier!
🔥 AI + AUTOMATION: Erlerne die wohl wichtigste Fähigkeit für die nächsten Jahre und kombiniere KI mit Automatisierungen. Automatisiere dich selbst, dein Team oder biete es als Service für Unternehmen an. Dieses Wissen ist aktuell extrem gefragt. Unser Accelerator bringt dich von 0 auf 100. Keine Programmierkenntnisse nötig. Klicke hier!
⭐️ Wie hat dir diese Ausgabe gefallen? |
Login oder Abonnieren um an umfragen teilzunehmen. |