Moin AInauten,

Willkommen zur neuen Ausgabe deines Lieblingsnewsletters!

Wir haben kurz überlegt, über das OpenAI-Elon-Gerichtsdrama zu schreiben. Dann ist uns eingefallen: Du willst ja arbeiten, nicht Popcorn essen.

Also heute: warum alte Prompts GPT-5.5 schlechter machen (und wie du das umgehst), warum /goal in Codex ziemlich cool ist und was Microsofts neue Ausweispflicht für AI-Agenten bedeutet.

Das haben wir für dich im Gepäck:

  • 🙀 Warum alte Prompt-Templates GPT-5.5 schlechter machen

  • 🤑 /goal: Codex verfolgt deine Ziele und der Ralph-Loop wird Mainstream

  • 🔐 Microsoft baut die Ausweiskontrolle für AI-Agenten

Los geht’s!

präsentiert dir diese Ausgabe

Zur AI Search Masterclass

🙀 Warum alte Prompt-Templates GPT-5.5 schlechter machen

Wir haben GPT-5.5 jetzt eine Weile im normalen Arbeitschaos benutzt. Newsletter-Ideen, Recherche, Strategie, Supportanfragen, Dokumente.

Und dabei ist etwas Komisches passiert: Einige unserer alten Prompt-Vorlagen haben GPT-5.5 nicht besser gemacht, sondern steifer.

Alte Prompts funktionieren nicht mehr richtig

Das Modell lieferte zwar brav Resultate. Aber die klangen so, als würde es erst ein Formular ausfüllen und dann nach Schema F denken. Der Text hatte diesen „Ich arbeite jetzt eine Checkliste ab“-Geruch. Alles richtig. Aber nichts lebendig.

Im Nachhinein war der Fehler ziemlich offensichtlich… Wir haben GPT-5.5 behandelt wie ein älteres Modell, dem man jeden Handgriff erklären muss.

Denke Schritt für Schritt. Zuerst analysieren und strukturieren. Bitte freundlich, aber präzise. Nicht halluzinieren. Und ganz wichtig: zuerst 2x tief durchatmen. Danke. 😁

Das waren echte Prompting-Hacks - aber vor einem Jahr… Heute ist das ungefähr so, als würdest du einen A-Player einstellen und ihm erklären, wo die Enter-Taste ist.

Alexander hat uns vor ein paar Tagen geschrieben: “... ihr schreibt, dass dem Prompting mittlerweile nicht mehr so viel Gewicht beigemessen wird. Lohnt es sich, die RAFT-Regeln etc. zu verinnerlichen oder wollt ihr mir hier an dieser Stelle eine andere Empfehlung mit auf den Weg geben?” Ja, machen wir gerne!

Kürzere, ergebnisorientierte Prompts funktionieren oft besser.

OpenAI sagt es deutlich in ihrem neuen GPT-5.5-Prompting-Guide: Fang wieder klein an! Bau nicht einfach deinen alten Prompt-Turm um, sondern starte stattdessen auf der grünen Wiese (ja, echt).

Unser Alltagsprompt sieht inzwischen eher aus wie ein direkter Arbeitsauftrag, zielorientiert. Und damit kommst du weiter, als man denkt.

Hier ist dein Kontext. Mach daraus ein Entscheidungsbriefing.
Zielgruppe: Unternehmer mit wenig Zeit.
Gut ist die Antwort, wenn sie eine klare Empfehlung, belegte Fakten und offene Risiken zeigt.
Wenn etwas unklar ist, markiere es.
Maximal 7 Bulletpoints.

Fokussiere auf den Outcome

Der wichtige Punkt ist nicht die Kürze, sondern die Abnahmekriterien. Das Modell muss wissen, woran du seine Antwort misst.

Für schnelle Aufgaben reicht: Was soll rauskommen? Für wen? Wie umfangreich? In welchem Format? Und für größere Aufgaben kommt Material (also Kontext) dazu.

Das klingt banal, bringt dich aber schneller zum Ziel.

Nutze das Meeting-Protokoll für Entscheidungen.
Nutze die Kundenmail für Einwände.
Nutze die Produktseite für harte Fakten.
Baue daraus eine Empfehlung mit Risiken und To-dos.

Du ersparst dir schlechte Antworten und langes Ping-Pong, weil das Modell nicht mehr erraten muss, was dir wichtig ist. Stattdessen legst du die (F)Akten auf den Tisch und sagst, wofür sie da sind.

Der kleine Nebeneffekt: Man merkt beim Prompten schneller, ob man selbst überhaupt weiß, was man will. Das kann unangenehm sein. Aber auf jeden Fall sehr hilfreich. 😄

Claude hält sich genau an deine Vorgaben

GPT-5.5 und Claude Opus 4.7 ziehen beide am gleichen Strang: alte Prompt-Türme runter, neue Klarheit rauf. Aber sie ticken trotzdem anders.

Bei GPT-5.5 funktioniert "weniger ist mehr" am besten: Outcome, Erfolgskriterien, Kontext und Format reichen meist; lange Schritt-für-Schritt-Anleitungen produzieren mechanische Antworten.

Claude Opus 4.7 dagegen folgt Anweisungen auffallend wörtlich. Was du nicht sagst, macht er auch nicht. Wer Opus 4.7 ein Format vorgeben will, muss den Scope explizit ausschreiben ("auf jeden Abschnitt anwenden, nicht nur den ersten") und vage Aussagen durch klare Befehle ersetzen.

Faustregel für deinen Alltag: GPT-5.5 willst du wie einen Senior briefen mit klarem Ziel und Erwartung. Opus 4.7 hingegen eher wie einen sehr pingeligen Junior: präzise Befehle und Schritte, klarer Scope, nichts "implizit" lassen.

Auf was beide verzichten können: alte Prompts mit "atme tief durch", "denk Schritt für Schritt" und drei Schichten Sicherheitsgeländer. Bei GPT-5.5 wird's mechanisch, bei Opus 4.7 bekommst du genau diese Bürokratie zurückgespiegelt.

Unser Take: GPT-5.5 Prompting ist gutes Delegieren

Die Arbeit mit GPT-5.5 fühlt sich weniger nach Zauberformel und Tricksen an, sondern mehr nach Goal-Setting. Ein guter Prompt sagt: „Das ist der Job. Daran messe ich das Ergebnis. Dort ist die Grenze. So will ich es zurückhaben.“

Bevor du also deinen nächsten GPT-5.5-Prompt schreibst, frag dich kurz: Woran würde ich sofort erkennen, dass die Antwort brauchbar ist? Dann schreib genau das als Anforderung rein!

🧑‍🏫 AI SEARCH-TIPPS MIT UNSEREM PARTNER: yoyaba

In 3 Tagen: Wie deine Website für ChatGPT, Perplexity & Co sichtbar & bedienbar wird.

Kleine Erinnerung: diesen Donnerstag, 7. Mai, läuft die kostenlose AI Search Masterclass von unserem Partner yoyaba.

Wir hatten das Thema vor zwei Wochen ausführlich im Newsletter (Stichwort: Sichtbarkeit war gestern, Handlungsfähigkeit ist die neue Disziplin).

Die Resonanz war super, der Webinar-Link war der meistgeklickte in der ganzen Ausgabe. Falls du es verpasst hast oder noch unentschlossen warst:

  • 60 Min Frameworks + 30 Min Q&A

  • Konkrete Checkliste zum Mitnehmen

Präsentiert von:

  • Oliver Kuttruff (yoyaba, arbeitet mit TeamViewer, Proof, voize)

  • Crystal Carter (Wix, 20 Jahre Erfahrung, McDonald’s & TripAdvisor)

Wenn deine Website künftig nicht nur gefunden, sondern von AI-Systemen verstanden und bedient werden soll, ist das ein guter 90-Minuten-Shortcut. See you there!

Hinweis: Das Webinar ist auf Englisch.

🤑 /goal: Codex verfolgt deine Ziele und der Ralph-Loop wird Mainstream

Ok… wir haben Samstagnacht einen simplen Auftrag an Codex CLI gegeben:

/goal Baue mir eine Datenschutz-App, die sensible Daten vor dem Einfügen in AI-Tools maskiert. 
Beispiel-Daten, Export, klare Grenzen, Landingpage in unserem AInauten-Design. Repo: github.com/openai/privacy-filter 
Veröffentliche die App unter privacy.ainauten.com.

Dann sind wir schlafen gegangen. Und haben am nächsten Morgen gestaunt, weil das Ding live war - und nach zwei weiteren Prompts so aussieht: privacy.ainauten.com (das Ganze hat Codex weniger als 15 Minuten gekostet … war wohl zu simpel gedacht)

Anonymisiere deine Daten mit https://privacy.ainauten.com

Cool, oder? Genau dahin geht es jetzt mit Codex und dem neuen /goal-Befehl! Weg von "Schreib mir den perfekten Prompt" zu "Hier ist dein Ziel, ich schau am Morgen rein".

Das funktioniert übrigens nicht nur mit Software-Entwicklung, sondern mit allen möglichen Tasks!

Karpathy hat den Loop populär gemacht

In der Szene spricht man schon länger über den Ralph Loop: Ziel definieren → Setup prüfen → Loop starten → Fortschritt überwachen.

Andrej Karpathy hat im März sein 630-Zeilen-Skript autoresearch auf GitHub gestellt und damit auf X ein virales Phänomen gestartet. Shopify-CEO Tobi Lütke hat das Pattern direkt aufs eigene Templating-System losgelassen und 53% Speedup aus 93 Auto-Commits rausgeholt.

Witzig: Karpathy hat im selben Atemzug öffentlich angemerkt, dass das in Codex sadly nicht funktioniert und einen OpenAI-Kontakt gepingt: "Need a /loop equivalent or something like that". Sechs Wochen später: /goal ist da. Und wird zum Werkzeug statt Spielzeug.

Tibo von OpenAI: „/goal könnte das folgenreichste Feature sein, das wir in Codex ausgeliefert haben.“

Tibo vom Codex-Team macht deutlich, dass sich agentisches Arbeiten weg von einzelnen Prompts, hin zu langfristig denkenden, eigenständig handelnden Systemen entwickelt.

Mit /goal kann Codex jetzt stunden- bis tagelang an einem Auftrag arbeiten, pausieren, fortsetzen, ein Budget einhalten und am Ende statt "fertig!" einen prüfbaren Stand hinterlegen.

Wir haben schon sooo viele Ideen - zuerst Newsletter fertig machen, dann zurück ins Rabbithole!

Und Cloudflare gibt Agenten jetzt eigenes Geld

Damit der Agent nicht nur Code, sondern auch Realität anfassen kann, kam letzte Woche der passende zweite Schritt: Cloudflare und Stripe haben das Agent Provisioning Protocol gelauncht.

Ein Agent kann jetzt selbstständig ein Cloudflare-Konto eröffnen, Domains kaufen, Subscriptions starten und Apps deployen. Er kriegt dafür einen Stripe-Token und ein Default-Budget von $100/Monat pro Anbieter.

Plötzlich ergibt das Bild Sinn, das wir bei Polsia (btw, Polsia rückwärts = AI-Slop 😁) und in der Solopreneur-Welle gezeichnet haben: eine Person, ein klares Ziel, eine Armada von Agenten, die Code schreiben, Domains kaufen, Marketing betreiben und nachts weiterarbeiten.

Unser Take: Vom Prompt-Schreiben zum Goal-Briefing

/goal und Cloudflares Agent-Budgets sind nicht zufällig jetzt gelandet. Sie sind die zwei Hälften derselben Bewegung: Agenten, die nicht nur reden, sondern handeln, einkaufen und liefern. Autonom.

So testest du es heute Abend:

  • Codex CLI installieren (via Desktop App scheint noch nicht zu funktionieren)

  • Im Terminal “codex” eingeben, gefolgt von “codex --enable goals”

  • Prompt erstellen und mit /goal starten, Budget-Limit vorgeben, schlafen gehen

  • Am Morgen schauen, was prüfbar auf der Platte liegt

Starte mit einem Outcome pro Goal. Wenn du mehrere Dinge willst, formuliere sie als Sequenz: „erst Diagnose, dann sichere Fixes, dann Verifikation“.

Das hier ist die Struktur - Codex hilft dir beim ausformulieren.

/goal 
Ziel: [konkretes Ergebnis]
Kontext: [Projekt/Pfad/Warum]
Erfolgskriterium: [woran wir erkennen, dass es fertig ist]
Grenzen: [was nicht gemacht werden soll]
Verifikation: [Tests/Build/Live-Check/Datei prüfen]

Wenn der Agent etwas Greifbares hinterlässt, auch wenn's nicht 100% ist: du hast dein erstes Ralph-Loop-Pattern installiert, Gratulation! Wenn nicht, war dein Goal zu unscharf. Der Lerneffekt ist in beide Richtungen garantiert.

🔐 Microsoft baut die Ausweiskontrolle für AI-Agenten (plus Prompt für lokalen Security Audit bei dir)

Die stärkste AI-News der letzten Tage sitzt in einer Admin-Konsole 😁... Nicht sexy. Dafür nah an der Frage, die viele Firmen noch nicht sauber beantworten können: Wer sieht eigentlich, welche AI-Agenten schon bei uns mitarbeiten?

Microsoft Agent 365 beantwortet diese Frage - und ist nun allgemein verfügbar.

Jaja, das klingt nach Verwaltung. Was es auch ist. Aber genau deshalb ist es wichtig! Denn die Agentenfrage beginnt selten mit einem großen AI-Programm, sondern viel banaler.

Das Marketing testet n8n. Sales nutzt ChatGPT. IT aktiviert Copilot. Ein Entwickler probiert Claude Code. Jemand hängt OpenClaw an Discord. Lokal laufen MCP-Server, Browser-Agents, kleine Helper-Tools, Cronjobs, LaunchAgents und irgendwelche Skills, die vor drei Wochen noch praktisch klangen.

Plötzlich hast du nicht mehr nur Software. Du hast kleine digitale Mitarbeiter. Manche lesen Dateien. Manche greifen auf Browser-Sessions zu. Manche haben Tokens. Manche starten beim Login. Manche dürfen eingehende Verbindungen annehmen.

Und niemand hat ihnen je einen Ausweis ausgestellt.

Früher war es die “Shadow IT”, jetzt ist es die ”Shadow AI” im Unternehmen - inklusive OpenClaw und Claude Code.

Agent 365 ist Microsofts Ansatz, dafür einen Empfang zu bauen: Agenten registrieren, Identitäten zuweisen, Rechte sehen, Risiken bewerten, blockieren, überwachen.

Microsoft kassiert an den unsichtbaren Stellen

Zoom kurz raus: Agent 365 ist nicht einfach ein weiteres AI-Tool, das zufällig noch eine Lizenz braucht. Es ist ein Hinweis darauf, wie Microsoft mit der nächsten AI-Welle Geld verdient: nicht mit dem Modell selbst, sondern mit allem drumherum.

Der neue Legal Agent in Word zeigt, wohin Microsoft will: Agents wandern direkt in Arbeitsprozesse. Dokumente, Mails, Meetings, Support, Sales, Code. Das ist praktisch. Aber je näher Agents an echte Arbeit kommen, desto wichtiger wird die Betriebserlaubnis.

Denn die eigentliche Frage in jedem Unternehmen lautet: Wer verkauft am Ende die Infrastruktur, die Identität und die Kontrolle rund um AI?

Microsoft sitzt genau auf dieser Position und bietet alles in einer schönen Enterprise-Verpackung. Der Konzern verkauft die Cloud darunter, die Identität daneben, die Sicherheitskontrolle darüber und die Office-Oberfläche davor. Und lässt sich jedes Element einzeln bezahlen.

Wenn AI in Firmen größer wird, wächst nicht nur die Nutzung. Es wächst auch der Bedarf an Kontrolle. Microsoft nennt OpenClaw und Claude Code ausdrücklich als Beispiele für “Shadow AI” auf Endgeräten.

Der Mittelstand kennt dieses Spiel: Erst nutzt man Word und Teams, dann kommt Sicherheit dazu, dann Compliance, dann Copilot, dann Agent-Governance. Und Zack, aus einem Tool wird eine Budgetposition, die immer weiter wächst.

Wir haben uns dieselbe Frage gestellt: Was läuft da eigentlich alles?

Das Spannende ist: Das Thema ist nicht nur in Unternehmen relevant, sondern auch für Solo-Operator und kleine Teams.

Wir haben uns diese Woche gefragt: Was läuft eigentlich bei uns eigentlich alles auf meinem Rechner? Welche Agents, Skills, Tools und lokalen Dienste haben Zugriff auf Dateien, Netzwerk, Browser, GitHub, Google Drive, Discord oder API-Keys?

Also haben wir Codex beauftragt, den eigenen Rechner zu analysieren. Dabei kamen typische Dinge hoch: Firewall-Regeln mit zu vielen erlaubten Verbindungen, Full-Disk-Access-Einträge für Tools, LaunchAgents beim Login, OpenClaw-Gateway-Secrets und alte Einträge, bei denen man sich fragt: Brauchen wir das noch oder bieten wir hier unnötig digitale Angriffsfläche mit zu viel Berechtigungen?

Vieles war völlig legitim. Aber wir haben auch aufgeräumt - und das fühlt sich gut an, wie ein digitaler Frühlingsputz.

Der lokale Security Assessment-Audit Prompt für dich

Wenn du Claude Code, Codex oder ein anderes lokales Coding-Tool nutzt, kannst du auch so eine erste Analyse mit unserem Prompt durchführen.

Das ist kein Ersatz für professionelle Security-Beratung. Aber es bringt die blinden Flecken an die Oberfläche und sensibilisiert.

Die langweiligen Best Practices gelten sowieso: Installiere keine unbekannten Tools, Skills, MCPs oder Agents aus Quellen, denen du nicht vertraust.

Unser Take: Microsoft verdient an Kontrolle, OpenAI an Intelligenz

OpenAI-Mitgründer Greg Brockman hat OpenAIs Geschäftsmodell brutal einfach beschrieben: „We buy, rent, build compute, and we resell it at a margin. That's it.“ (War wieder ein weiteres starkes Interview mit Greg - siehe unten).

Während OpenAI die Intelligenz liefert, baut Microsoft die Steuerung drumherum: Cloud, Identität, Sicherheit, Office, Compliance. Jede Ebene eine eigene Lizenz, jede Lizenz ein eigener Seat, jeder Seat ein wiederkehrendes Abo. Und der Mittelstand wird's bezahlen, weil AI ohne Governance in Kürze ein unvertretbares Risiko ist.

Passend dazu haben Microsoft und OpenAI ihre Partnerschaft gerade neu sortiert. Beziehungsstatus: kompliziert, aber profitabel.

Die Alternative heißt: selbst verstehen, wie Agents arbeiten, was sie dürfen und wie man sie sauber aufzieht. Das sind genau solche Themen, mit denen wir uns in der AI AUTOMATION Community beschäftigen.

Geschafft! Bis zur nächsten Ausgabe.

Reto & Fabian von den AInauten

Die AInauten Journey: So können wir dir helfen!

AI EXPLORER: Der schnelle Einstieg in die AI-Welt, perfekt zum Reinschnuppern, wenn du noch keine Erfahrung hast. Mehr erfahren » 

⭐⭐⭐ AI POWER USER: Werde zum AI-Profi in 30 Tagen. ChatGPT Masterclass, Prompting Pro Bootcamp, 50+ Deep-Dives mit wöchentlichen Updates. Spare 10+ Stunden pro Woche. Kein Abo. Mehr erfahren »

⭐⭐⭐⭐⭐ AI AUTOMATION EXPERT: Die Königsklasse. Alle unsere Trainings aus AI EXPLORER und AI POWER USER! Plus Community mit Support. Baue Systeme, die 24/7 für dich arbeiten - mit Zapier, Make, n8n Trainings, Vibe Coding, 50+ Use Cases und Tool-Rabatte. Mehr erfahren »

Weiterlesen