👨‍🚀 Token-Maxxing: 7 Regeln für ChatGPT, Claude, Codex und Co.

Moin AInauten,

Willkommen zur neuen Ausgabe deines Lieblingsnewsletters!

AI fühlt sich gerade grenzenlos an. Mehr Modelle, mehr Agenten, mehr Tools, mehr Automationen. Gleichzeitig entstehen neue Grenzen: dein Kontextfenster ist voll, dein Abo limitiert, dein Lieblingsmodell ist nicht verfügbar oder der Zugang wird plötzlich politisch verhandelt.

Diese Ausgabe dreht sich genau um diese neue Knappheit. Wir zeigen dir, wie du dein Token-Budget besser nutzt, warum Claude im Teamchat mehr verändert als nur Slack-Komfort und weshalb GPT-5.6 Sol ein Vorgeschmack darauf sein könnte, wie Frontier-Modelle künftig verteilt werden. Sounds good?

Das haben wir heute für dich im Gepäck:

🐳 7 Token-Maxxing-Regeln: So holst du das Beste aus deinem Abo
🤖 Claude @: Warum der nächste Agent im Teamchat sitzt
🥲 GPT-5.6 ist da. Die Frage ist, wann du es nutzen darfst?

Los geht’s!

🐳 7 Token-Maxxing-Regeln: So holst du das Beste aus deinem Abo

Wenn dein AI-Abo zu früh limitiert, liegt es selten am einen großen Prompt. Meist frisst dein Setup den Kontext in kleinen Bissen leer.

In der Praxis sehen wir zwei Gruppen, die mit demselben Problem kämpfen:

Die Power User: Wer ein großes Abo bezahlt, will sein verfügbares Token-Budget auch ausreizen.
Die Gelegenheitsnutzer: Wer kostenlos unterwegs ist oder ein kleineres Abo nutzt, will nicht genau dann ins Limit laufen, wenn die AI endlich verstanden hat, was zu tun ist.

Ein Fall aus der Praxis… Entweder upgraden oder anderes Modell nutzen.

Dein AI-Limit wird selten von einem einzigen Chat aufgefressen. Es wird von alten Chats, riesigen Uploads, unklaren Aufträgen, aktivierten Tools, Korrekturschleifen und Premium-Modellen, die Kleinkram erledigen, laufend angeknabbert.

Wir haben die 7 wichtigsten Regeln zusammengestellt, damit dein Abo länger hält und du mehr damit rausholst.

Hinweis: Bei Desktop-Apps wie Claude Desktop und Codex profitierst du am meisten von diesen Tipps, weil lokale Dateien/Ordner sowie Tools etc. einbezogen werden - genau, das Files-over-Tools-Prinzip.

ChatGPT oder Claude im Web können viele der Prinzipien nutzen, aber sehen deine Festplatte nicht automatisch. Du musst Dateien hochladen, Connectors/Plugins aktivieren oder relevante Inhalte gezielt mitgeben.

1. Trenne Planung und Umsetzung

Der Fehler ist nicht immer das falsche Modell. Oft ist es ein Modell für alles.

Wenn du viel Material hast und erst Orientierung brauchst, reicht oft ein günstigeres Modell zum Scouten. Es findet Hebel, sortiert Optionen und bewertet Aufwand.

Wenn die Entscheidung selbst hart ist, drehe es um: Lass ein starkes Modell planen. Die sauber beschriebenen Einzelschritte kann danach ein günstigeres Modell ausführen.

Kurzer Planungs-Prompt:

Trenne diese Aufgabe in Planung und Umsetzung.
Sag mir, welche Ebene ein starkes Modell braucht.
Schlage eine günstige und eine starke Modellstufe vor.
Umsetzung erst nach Freigabe.

Die Modellnamen wechseln je nach Oberfläche. Als Orientierung:

Instant-, Medium- oder Sonnet-Level reicht oft für Scouting, Struktur, Entwurf und Fleißarbeit.
High-, Extra-High-, Opus- oder Ultracode-Level gehört an die Stellen, an denen eine falsche Entscheidung Konsequenzen hat.
Pro-Extended- oder Max-Modi sind kein Standardgang. Die nutzt du, wenn der Input schwierig ist, der Fehler teuer wäre oder das Ergebnis direkt Wert schafft.

Modellauswahl in ChatGPT

Modellauswahl in Codex

Modellauswahl in Claude

Merksatz: Teuer denken, billig ausführen. Oder billig scouten, teuer lösen.

Hauptsache: nicht alles mit derselben Modellstufe durchballern.

2. Gib ein klares Ziel vor, kein “Mach mal!”

Schwache Aufträge kosten Tokens, Zeit und Nerven - das Modell muss erst erraten, was zählt. Wir geben es zu, "Mach das besser!" war letztes Jahr nach Auswertung von ChatGPT eines unserer beliebtesten Prompts. Aber wir haben daraus gelernt.

Gib deshalb diese vier Zeilen mit und streng deine grauen Zellen kurz an, das sauber zu formulieren. (Und wenn du Hilfestellung benötigst, dann bitte den Agenten einfach, dir für jede Frage passende Antwortmöglichkeiten als Auswahl zu formulieren.)

Ziel: [Was soll besser werden?]
Material: [Welche Dateien oder Links zählen?]
Ergebnis: [Was soll am Ende vorliegen?]
Grenze: [Was soll nicht angefasst werden?]

3. Kleiner Kontext schlägt großen Kontext

Tokens sind die Währung des Modells. Deine Frage kostet Tokens. Die Antwort kostet Tokens. Ältere Nachrichten, Dateien, Tools und Outputs kosten ebenfalls Tokens.

Das geht sogar so weit, dass bei jeder Interaktion im Chat die ganze Historie mitgeschickt wird und damit auch Token frisst!

Frag dich deshalb: Was braucht der Chat, bevor er arbeiten kann? Wenn die Antwort "alles" lautet, wird es langsam, teuer und ungenau.

Besser ist: Gib nur den relevanten Kontext mit, nicht dein ganzes Archiv.

4. Mach Dateien zur Arbeitsfläche

Speicher ist günstig. Kontext ist teuer.

Sprich: Eine Datei auf deiner Festplatte kostet keine Tokens, solange das Modell sie nicht einliest. Teuer wird sie erst, wenn du sie in den Chat kopierst, hochlädst oder aktiv auswerten lässt. Wenn du sie aber in den Chat hochlädst, füllen sie dein Kontextfenster.

Darum: Files-over-Tools!

Hole dein Wissen immer aus den Chats und speichere es lokal in Markdown-Dateien ab (du kannst dafür den Prompt aus Tipp 5 nutzen).

Desktop- und CLI-Agenten wie OpenAIs Codex oder die Claude Desktop App können sehr gut mit lokalen Markdown-Dateien arbeiten (Stichwort: Second Brain - haben wir im AI Mitarbeiter-Bootcamp gezeigt). Mit einem Slash-Command (bspw. /save) kann man sogar automatisch alle relevanten Chat-Inhalte lokal abspeichern.

5. Starte früher frisch oder fasse deinen Chat sauber zusammen

Lange Chats fühlen sich bequem an, aber irgendwann werden sie träge.

Wenn ein Chat mehrere Themen, alte Entscheidungen und Korrekturschleifen enthält, steigt der Kontextverbrauch. Gleichzeitig antwortet das Modell oft schwammiger.

Mache deshalb lieber eine saubere Übergabe und starte einen neuen Chat!

Wir haben dir dafür hier einen Prompt zusammengestellt, um einen beliebigen Chat zusammenzufassen, damit du den relevanten Kontext für einen neuen Start hast.

Das spart Tokens und verhindert, dass veraltetes Wissen reinrutscht.

6. Lade Tools nur, wenn du sie brauchst

Connectoren, MCPs, Plugins und Browser-Tools sind mächtig. Aber sie kosten Tokens im Kontextfenster.

Oder anders gesagt: Wenn du nur einen Text schreiben willst, brauchst du keinen ganzen Werkzeugkasten mit 27 anderen Tools.

Prüf deshalb den Grundverbrauch. In Claude Code zeigt /usage, was ein leerer Chat schon frisst. In Codex siehst du mit /status, wie viel Kontext bereits belegt ist.

In ChatGPT im Web und Claude Cowork kannst du manuell prüfen, welche Tools, Plugins und Connectoren aktiv sind.

Die Regel bleibt: Was aktiv ist, sollte einen Job haben. Deaktiviere, was du nicht brauchst.

Fortgeschrittene können aus manchen MCPs eine CLI machen. Dann bleibt das Tool draußen und wird nur bei Bedarf aufgerufen.

Prüfe meine aktiven Tools, MCPs, Plugins und Connectoren.
Teile sie ein: ständig gebraucht, selten gebraucht, aktuell unnötig.
Empfiehl, was ich deaktivieren oder als CLI auslagern sollte,
damit mehr Kontext für die eigentliche Aufgabe bleibt.

Schau dir dafür MCPorter und mcp2cli an. Wir haben die Hintergründe in unserer AInauten Knowledgebase genauer erklärt: CLI oder MCP: Wann nutzt du was?

7. AI ist eine Slotmachine - nutze das!

AI ist manchmal eine Slot Machine: Ein Lauf trifft, der nächste verrennt sich komplett.

Nutze das bewusst. Wenn das Modell sichtbar in die falsche Richtung läuft, füttere den Chat nicht mit fünf Reparaturrunden. Das ist wieder Kontext, den du mitschleifst. Und der ist auch noch fehlerhaft.

Editiere ein Prompt in ChatGPT

Editiere ein Prompt in Codex

Stoppe früh, editiere den ursprünglichen Prompt oder starte einen neuen Chat mit sauberem Briefing. Damit vermeidest du Context Contamination: falsche Annahmen, halbe Korrekturen und misslungene Versuche bleiben sonst im Kontext und ziehen den nächsten Lauf mit.

Du kannst übrigens auch verschiedene Pfade parallel ausprobieren, indem du das Branch/Fork-Feature nutzt.

Erstelle einen “Branch” in ChatGPT

“Forke” einen Chat in Claude Desktop

Der beste Abo-Hack ist bessere Führung

Wenn du ständig an dein Limit kommst, präge dir diese Tipps ein. Sie sind deine Checkliste.

Wenn du nie an dein Limit kommst, sind sie dein Qualitätshebel.

In der AI-Automation-Community geht es genau um solche Themen: weniger mit AI herumchatten, mehr Arbeitsumgebungen bauen, in denen Modelle gezielt Aufgaben erledigen. See you on the inside!

🤖 Claude @: Warum der nächste Agent im Teamchat sitzt

Das neue Claude Tag-Feature wirkt auf den ersten Blick wie eine weitere Slack-Integration (Beta für Claude Team und Enterprise). In Teams richtet ein Owner oder Admin Claude für Slack ein, danach kann der Agent in freigegebenen Kanälen markiert werden.

Aber es ist viel mehr als ein simpler Bot im Chat, denn mit dem kleinen @ passiert etwas: Der private Prompt bekommt Publikum.

Der Chat erhält Zeugen

Bislang war AI-Arbeit oft unsichtbar. Jemand öffnet seinen Chatbot, erfasst ein Prompt mit Kontext, lässt etwas bauen und bringt das Ergebnis zurück ins Team. Der Output ist da. Der Weg dahin bleibt verborgen.

Mit @Claude wird dieser Prozess plötzlich transparent. Prompting bekommt Zeugen. Delegation bekommt Zeugen. Fehler bekommen Zeugen. Aus dem privaten Superassistenten wird ein Teammitglied mit Chatverlauf.

Andrej Karpathy, der frühere OpenAI-Mitgründer und Tesla-AI-Chef, ist seit Kurzem bei Anthropic für Pre-Training verantwortlich und schwärmt vom neuen Teammitglied.

— # (#)

Du teilst deine Arbeitsflächen neu mit permanenten Agenten

Das passt in einen größeren Trend: AI wandert aus dem Chatfenster in die Oberflächen, in denen wir ohnehin arbeiten.

Gemini in Gmail fasst Threads zusammen, schlägt Antworten vor und zieht Drive-Dateien heran.
Microsoft 365 Copilot steckt in Word, Excel, PowerPoint, Outlook und Teams.
Meta rollt Meta AI in WhatsApp, Instagram, Facebook und Messenger aus.

Claude Tag ist die Teamchat-Version davon. Der Agent sitzt dort, wo Status, Abkürzungen, Missverständnisse und Büro-Politik sowieso schon wohnen.

Slack ist kein neutrales Tool. Slack ist Büroflur mit Suchfunktion. Wenn dort ein Agent auftaucht, landen Output, Sichtbarkeit, Vertrauen und Zuständigkeit im selben Thread.

Im privaten Chat gehört Claude dir. Im Teamkanal gehört Claude dem Raum.

Drei Leute schreiben mit, zwei haben Datenzugriff, eine Person sieht Kundendaten, jemand anderes ist nur Gast. Wessen Kontext darf Claude nutzen? Wessen Grenzen gelten? Wer räumt auf, wenn der Agent etwas Falsches in den Thread legt?

Anthropic adressiert das mit einem Agent-Identity-Modell. Claude bekommt eigene Zugänge, Erinnerungen und Regeln pro Workspace oder Kanal. Laut Docs folgt der Zugriff dem Kanal, nicht der Person, die gerade fragt.

Die neue Frage lautet: Wer darf AI in welchen Arbeitsraum holen, und wer ist verantwortlich, wenn der Raum dadurch anders funktioniert?

Unser Take: AI verschwindet in der Oberfläche und wird allgegenwärtig

Claude Tag ist ein Signal, das ziemlich gut zeigt, wohin die Reise geht: Der hilfreichste Agent sitzt dort, wo der nächste Handgriff passiert.

Die Chatbots lernen dich und das Unternehmen kennen, Nachricht für Nachricht. Das ist der Nutzen. Das ist bequem. Und es ist eine Machtverschiebung.

Und das ist auch der Grund, warum sich manche Teams damit komisch fühlen werden.

🥲 GPT-5.6 ist da. Die Frage ist, wann du es nutzen darfst?

Letzte Woche klang es noch nach: GPT-5.6 kommt, Anschnallen bitte.

Jetzt ist GPT-5.6 Sol da. Nur eben nicht für uns.

Der Zugriff startet begrenzt, nach Rücksprache mit der US-Regierung. Keine öffentliche Warteliste. Keine normalen Nutzer. Ausprobieren dürfen erst ausgewählte Partner.

Das ist mehr als Bürokratie. Bisher war „Partner zuerst, Rest später“ normale Release-Logik. Jetzt sitzt die US-Regierung sichtbar mit am Hebel. OpenAI schreibt selbst, dass dieser Prozess nicht zum Dauerzustand werden sollte, weil er die besten Werkzeuge von Nutzern, Entwicklern, Unternehmen und Cyber-Verteidigern fernhält.

Und OpenAI ist nicht allein. Claude Mythos 5 darf nach Verhandlungen wieder an bestimmte US-Organisationen aus kritischer Infrastruktur und Cyber-Defense gehen. Fable 5 hängt weiter fest. Genau hier beginnt die unbequeme Frage: Sehen normale Nutzer künftig überhaupt noch die stärksten Modelle, oder nur die öffentliche, sauber begrenzte Variante?

Das Meme dazu: Anthropic-Boss Dario Amodei hat es für alle verdorben. Wenn die Labs selbst sagen, dass ihre Modelle gefährlich werden könnten, darf sich niemand wundern, wenn irgendwann Beamte am Release-Knopf stehen und die neuesten Supermodelle unter Verschluss bleiben und nur für staatlich abgesegnete Zwecke zur Verfügung stehen.

Aber gut, wenn wir schon kein neues Modell bekommen, dann wenigstens gutes AI-Drama und die Hoffnung, dass Fable 5 noch vor dem 1. Juli wieder verfügbar ist (zumindest wenn man den Gamblern auf Polymarket glaubt).

Unser Take: Dein AI-Stack braucht einen Plan B

Die wichtigste Frage ist nicht: Wann bekomme ich GPT-5.6?

Wir sind gespannt auf GPT-5.6 und werden testen, sobald es geht. Natürlich. Schließlich soll es laut Benchmarks in einigen Bereichen sogar vor Fable liegen.

Die wichtigere Frage lautet aber: Kann mein Workflow wechseln, wenn mein Lieblingsmodell morgen nicht mehr verfügbar ist?

Darum: Kontext in Dateien speichern und aus den Chatbots herausholen. Setups modellneutral halten. Offline-Pipelines bauen (siehe unseren Beitrag hier).

Wenn wir schon kein neues Modell kriegen, bekommen wir zumindest mehr Klarheit darüber, warum Sam Altman von OpenAI gefeuert wurde und wie er wieder zurück im Chefsessel gelandet ist. „You should, unfortunately, be worried about Sam Altman“ ist ein sehr sehenswerter Film mit vielen Hintergründen.

Hier geht es zum Video

Geschafft! Bis zur nächsten Ausgabe.

Reto & Fabian von den AInauten

Die AInauten Journey: So können wir dir helfen!

⭐ AI EXPLORER: Der schnelle Einstieg in die AI-Welt, perfekt zum Reinschnuppern, wenn du noch keine Erfahrung hast. Mehr erfahren »

⭐⭐⭐ AI POWER USER: Werde zum AI-Profi in 30 Tagen. ChatGPT Masterclass, Prompting Pro Bootcamp, 50+ Deep-Dives mit wöchentlichen Updates. Spare 10+ Stunden pro Woche. Kein Abo. Mehr erfahren »

⭐⭐⭐⭐⭐ AI AUTOMATION EXPERT: Die Königsklasse. Alle unsere Trainings aus AI EXPLORER und AI POWER USER! Plus Community mit Support. Baue Systeme, die 24/7 für dich arbeiten - mit Zapier, Make, n8n Trainings, Vibe Coding, 50+ Use Cases und Tool-Rabatte. Mehr erfahren »

👨‍🚀 Token-Maxxing: 7 Regeln für ChatGPT, Claude, Codex und Co.

🐳 7 Token-Maxxing-Regeln: So holst du das Beste aus deinem Abo

1. Trenne Planung und Umsetzung

2. Gib ein klares Ziel vor, kein “Mach mal!”

3. Kleiner Kontext schlägt großen Kontext

4. Mach Dateien zur Arbeitsfläche

5. Starte früher frisch oder fasse deinen Chat sauber zusammen

6. Lade Tools nur, wenn du sie brauchst

7. AI ist eine Slotmachine - nutze das!

Der beste Abo-Hack ist bessere Führung

🤖 Claude @: Warum der nächste Agent im Teamchat sitzt

Der Chat erhält Zeugen

Du teilst deine Arbeitsflächen neu mit permanenten Agenten

Unser Take: AI verschwindet in der Oberfläche und wird allgegenwärtig

🥲 GPT-5.6 ist da. Die Frage ist, wann du es nutzen darfst?

Unser Take: Dein AI-Stack braucht einen Plan B

Die AInauten Journey: So können wir dir helfen!

⭐️ Wie hat dir diese Ausgabe gefallen?

Weiterlesen

AINAUTEN

AI EXPLORER

AI POWER USER

AI AUTOMATION EXPERT

KONTAKT

TESTIMONIALS

IMPRESSUM