AIHOY und happy Weekend, liebe AInauten!

Vielleicht hast du letzte Woche nicht alle spannenden News, Tools und Hacks rund um das Thema AI mitbekommen oder bist erst neu bei uns gelandet. Kein Grund zur Sorge!

Wir haben dir unsere Highlights der vergangenen Woche zusammengefasst:

Zum Abschluss gibt es noch die wichtigsten Quick News für dich – so hast du alle relevanten Entwicklungen mit einem Klick im Blick! Ready? Let’s go!

🔥 Die AINAUTEN Journey - Dein Weg zum AI-Profi 🔥

3 Stufen. Ein Ziel: AI wirklich meistern. Alles Schritt für Schritt erklärt.

AI AUTOMATION EXPERT - Die Königsklasse. Baue Systeme, die 24/7 für dich arbeiten. Lerne Automation, 50+ Use Cases, exklusive Community mit 1000+ Experten. Plus: Exklusive Tool-Rabatte im Wert von 2.000€+/Jahr.

AI POWER USER - ChatGPT Masterclass, 50+ Deep-Dives, 10+ Stunden pro Woche sparen. Für alle, die AI im Alltag produktiv nutzen wollen.

AI EXPLORER - Der schnelle Einstieg mit Jumpstart Guide & Basics.

Manchmal wird AI besser, wenn du sie nicht freundlich weiter promptest, sondern in den Prüfmodus zwingst. Der Trick ist nicht, Claude oder ChatGPT anzupöbeln. Der Trick ist: Lass das Modell begründen, begrenzen und belegen, statt dir den nächsten hübschen Entwurf hinzulegen.

Wir haben daraus einen skeptischen Senior-Reviewer-Prompt gebaut. Er sucht echte Schwachstellen, aber nur mit Stelle, Risiko und kleinstem Fix. Genau diese Bremse ist wichtig, sonst erfindet die AI Probleme, nur weil du ihr gesagt hast, sie soll welche finden. Funktioniert für Texte, Strategien, Code und ziemlich viele halbfertige Ideen.

Agents werden nützlicher. Damit werden sie auch angreifbarer. Versteckte Befehle können heute in Texten, Bildern, Audios, Videos, PDFs oder Webseiten stecken. Solange ein Agent nur liest, ist das unangenehm. Sobald er E-Mails, Kalender, CRM, Drive, GitHub oder Browser bedienen darf, wird es schnell ernst.

Unser Take: Agenten nicht abschalten, aber konservativer bauen. Trenne Lesen und Handeln. Behandle externe Inhalte als untrusted. Gib Agents weniger Rechte, als bequem wäre. Ja, das nervt. Aber Sicherheit ist fast immer der Tausch gegen Komfort. Vorher war es bequemer, danach ist es sicherer.

AI-Automation fühlt sich nach Befreiung an: weniger Klicks, weniger Routine, mehr Output. Dann produziert sie Bedeutung: Rohtexte, Entscheidungen, Zusammenfassungen, Kundenantworten, Research. Und genau dort beginnt die Arbeit wieder: Stimmt das überhaupt?

Der neue Flaschenhals ist Urteil. Du prüfst nicht mehr nur, ob der Flow läuft. Du prüfst, ob der Output passt, aktuell ist, nach dir klingt und an echte Menschen raus darf. Wer alles automatisiert und niemanden mehr wirklich entscheiden lässt, baut keine Produktivitätsmaschine. Er baut eine schnellere Slop-Maschine.

Microsoft und NVIDIA haben auf der Build die Hardware-Seite des Agenten-Shifts gezeigt: neue Windows-PCs mit RTX Spark, bis zu 128 GB Speicher und genug lokaler AI-Leistung, um große Modelle direkt auf dem Gerät laufen zu lassen. Cloud bleibt wichtig, aber der Alltag wandert langsam zurück auf den eigenen Rechner.

Das ist letztlich weniger Gadget-News als Setup-Frage. Wenn AI lokal läuft, wird Datenschutz leichter, Dauerbetrieb günstiger und Files-over-Tools noch wertvoller. Der Rechner hört auf, nur Werkzeug zu sein. Er wird eher Mitarbeiter mit eigener Werkbank. Nice.

Pip Klöckner liefert uns den Reality-Check: AI-Content ist billig, Bot-Traffic frisst Websites leer und Owned Channels werden wichtiger. HubSpot zeigt die operative Antwort: AEO messen, Creator sinnvoll nutzen und Newsletter nicht als nettes Nebenprodukt behandeln.

Für dich ist die wichtigste Zahl fast beruhigend: Wenn du AI wirklich nutzt und schon einmal dafür gezahlt oder etwas damit gebaut hast, bist du ziemlich weit vorne. Aber genau deshalb reicht Ausprobieren nicht mehr. Der nächste Schritt ist nicht der nächste Prompt-Trick, sondern ein eigener Kanal, ein eigener Prozess und ein eigener Standpunkt.

Wir sehen bei Teams immer wieder dieselbe Lücke: Viele nutzen zwar AI - aber wenige wissen, was wirklich möglich wäre. Für uns gibt es gerade drei brauchbare Stufen: AI neben dir, AI arbeitet - du prüfst und AI arbeitet ohne dich. Die meisten hängen auf Stufe eins. Das ist okay, aber es erklärt auch, warum sich AI oft noch wie ein besserer Chatbot anfühlt.

Spannend werden die Stufen zwei und drei: Files-over-Tools, Codex, Claude Cowork, lokale Modelle, erste Always-On-Agents. Hermes von Nous Research macht gerade besonders Spaß, weil er lokal denkt, über Sessions lernt und endlich als Desktop-App testbar wird. Nicht jede Aufgabe braucht die obere Etage. Aber du solltest wissen, dass diese Möglichkeiten dir offen stehen.

📰 AI-News-Quickie: Die HAI-lights aus der Branche

AI never sleeps! Diese Woche war eine Infrastruktur-Woche: lokale AI-PCs, Desktop-Agents, Dynamic Workflows, neue Microsoft-Modelle, Anthropic-Security, Codex-Plugins, Robotik und die nächste Runde AEO-Realität.

Kurz: Die Tools rutschen tiefer in Betriebssysteme, Hardware und echte Prozesse.

OpenAI und Codex schieben in Richtung Arbeitsplattform

  • Codex bekommt mehr Rollen statt nur Coding: OpenAI beschreibt Plugins für verschiedene Workflows und shareable Sites. Codex wird damit weniger Terminal-Spielzeug und mehr Arbeitsfläche für Teams.

  • Codex kann laut Release-Notes inzwischen Windows-Anwendungen bedienen und Remote-Zugriff vom Handy aus nutzen. Wenn das stabil wird, verschiebt sich Debugging vom Schreibtisch in den Review-Modus.

  • OpenAI-Modelle und Codex landen auf AWS. Je mehr Clouds Frontier-Modelle hosten, desto weniger zählt der einzelne Chatbot-Tab.

  • OpenAI rollt mit Dreaming eine neue ChatGPT-Memory-Schicht für Plus- und Pro-Nutzer aus. Der wichtige Punkt: Memory wird nicht mehr nur gespeichert, sondern im Hintergrund verdichtet und aktuell gehalten.

  • Passend zu unserem Biosecurity-Beitrag pusht OpenAI Biodefense weiter und erweitert mit GPT-Rosalind den Zugang für vertrauenswürdige Partner. Mit LifeSciBench wird gegen echte Forschungsworkflows gemessen.

  • OpenAI baut in Michigan den nächsten Stargate-Baustein: Ein 1-GW-Data-Center-Campus entsteht mit Oracle, Related Digital und Crusoe.

  • Florida verklagt OpenAI rund um einen tragischen ChatGPT-Fall. Die Frage dahinter: wo Assistenz endet und Verantwortung beginnt.

  • Bernie Sanders will große AI-Firmen per öffentlicher Beteiligung stärker ans Gemeinwohl binden und stößt damit einen politischen Reflex an. Unrealistisch? Vielleicht. Aber AI-Kapital wird endgültig Regierungsthema.

Anthropic, Claude und Security werden operativer

  • Anthropic erweitert Project Glasswing auf rund 150 Organisationen in 15+ Ländern. Kritische Infrastruktur wird zum Testfeld für AI-gestützte Verteidigung.

  • Claude Code bekommt Dynamic Workflows und baut sich für komplexe Aufgaben selbst ein Harness mit Subagents. Das macht den Unterschied zwischen Chat und Arbeitsmaschine! Aber Achtung, kann teuer werden

  • Anthropic hat vertraulich einen Antrag bei der SEC eingereicht. IPO-Option offen, Timing offen, aber das Signal ist klar: Claude will Infrastruktur, Vertrieb und Kapitalmarkt gleichzeitig spielen.

  • Mythos findet sehr viele Sicherheitslücken. Das Finden ist nicht mehr der harte Teil, sondern das Schließen - und der Engpass verschiebt sich gerade zu Kosten und Patch-Kapazität.

  • Die USA stoßen per Executive Order einen AI-Cybersecurity-Push an, um Safety stärker in staatliche Infrastruktur einzubeziehen: härtere Bundes-Systeme, AI-gestützte Verteidigung und freiwillige Frontier-Model-Reviews.

Microsoft, GitHub und Windows wollen Agenten-Zentrale werden

  • Microsoft AI startet gleich sieben MAI-Modelle und ein Superintelligence Lab. Die Redmonder wollen weniger Wrapper sein und mehr eigenes Modell-Fundament zeigen.

  • Microsoft bringt mit Scout einen Always-On-Agent für Microsoft 365. CEO Satya Nadella hat intern ein Memo kritisiert, das Scout als „addictive app“ rahmte.

  • Work IQ APIs kommen am 16. Juni und öffnen Microsoft-365-Kontext für Agents. Genau daran hängt der nächste Enterprise-Schritt: Firmenwissen sauber anbinden.

  • Microsofts Web IQ liefert Grounding-APIs auf Basis des Bing-Index. Suchresultate werden damit mehr zum Rohstoff für Agenten.

  • Frontier Tuning geht in Private Preview und soll Modelle firmenspezifisch arbeiten lassen. Der Satz klingt harmlos, ist aber der Traum jedes Ops-Teams.

  • GitHub startet eine Copilot Desktop App als agent-native Schaltzentrale. Mehrere Sessions, PRs, Sandboxes, Review. GitHub will die IDE nicht ergänzen, sondern umdrehen.

  • Microsoft und Mayo Clinic entwickeln ein Frontier-Modell für Healthcare. Medizinische AI wird noch stärker zur Datenvertrauensfrage als Modellfrage.

  • Microsoft zeigt mit Majorana 2 einen skalierbaren Quantum-Prozessor. AI und Quantum rücken damit im Enterprise-Stack näher zusammen.

  • Microsoft stellt mit Project Solara eine Plattform für agent-first devices vor. Das ist der spannendere Hardware-Subtext der Woche: Geräte werden nicht mehr um Apps herum gedacht, sondern um Agents.

  • Build 2026 brachte Windows-Developer-News rund um Trusted Development und eine breitere Windows-AI-Welle. Das ist die Sicherheitsbasis, wenn Agents am Rechner handeln.

Lokale Modelle, Hardware und Developer-Tools werden ernst

Ok, dieser Block ist etwas nerdiger als sonst 😄… unter dem Strich: neue Hardware und neue lokale Modelle machen es einfacher, autonome AI-Infrastruktur zu bauen. Ideal für alle, die Datenschutzbedenken haben oder einfach die eigene Hoheit haben wollen.

  • Hermes Desktop geht in eine Public Preview und machen damit lokale Agents weniger zum Terminal-Spielzeug sondern zugänglich für uns Normalos.

  • Google veröffentlicht Gemma 4 12B als laptopfreundliches multimodales Modell. Lokale AI wird größer und alltagstauglicher.

  • Google legt mit Gemma 4 QAT quantisierte Checkpoints nach. Sprich: On-Device-Modelle werden nicht nur kleiner, sondern gezielt für Handys, Laptops und Consumer-GPUs trainiert.

  • MiniMax bringt M3 als Open-Weight-Modell mit 1M Kontext, Multimodalität und starken Coding-/Agenten-Fähigkeiten. Wenn die Claims halten, ist das ein ernstes Signal für offene Agentenmodelle.

  • Perplexity kündigt einen Hybrid-Ansatz an, bei dem das Data Center auf deine Maschine rückt. Das ist genau der Cloud-lokal-Mix, den viele wollen.

  • Factory.ai startet den Factory Router für günstigeres Frontier-Coding. Routing wird zur neuen Kostenbremse: Es muss nicht immer Opus oder GPT sein, sondern das passende Modell für den jeweiligen Task.

  • Die E-Mail-Lösung-Resend (we love it!) bringt ein offizielles Claude-Code-Plugin. Es ist ein kleiner Baustein, aber genau solche Anschlüsse machen Agents im Alltag hilfreicher.

  • NVIDIA und Microsoft stellen RTX Spark als neue PC-Klasse für Personal AI Agents vor. Die Surface RTX Spark Dev Box ist eine Entwickler-Kiste für lokale AI-Workloads.

  • Microsofts Surface Laptop Ultra kombiniert RTX Spark und lokale AI-Leistung. Der Laptop wird damit wieder zur Frage: Was läuft bei dir, was läuft in der Cloud?

  • NVIDIA bringt DGX Station für Windows als Desk-Supercomputer. Trillion-Parameter auf dem Enterprise-Schreibtisch? Klingt verrückt - und ist teuer.

  • NVIDIA Vera ist die neue CPU für Agents. Selbst CPUs werden jetzt nicht mehr für Apps erzählt, sondern für Agenten!

  • NVIDIA veröffentlicht mit Nemotron 3 Ultra ein 550B-MoE-Modell für schnellere und günstigere Agents. Dazu kommen Safety- und ASR-Modelle für Guardrails und Voice-Agenten. Infrastruktur wird wieder breiter als nur GPU.

  • JetBrains veröffentlicht Mellum2 auf Hugging Face als schnelles 12B-Mixture of Experts-Modell für Text und Code.

Roboter, Bildgenerierung & kreative Maschinen

  • NVIDIA stellt Cosmos 3 als World Model für Physical AI vor. Roboter sollen damit vor dem Handeln besser sehen, planen und simulieren.

  • NVIDIA zeigt ein offenes Isaac-GR00T-Design für humanoide Robotik. Wenn Referenzdesigns offen werden, wandert Robotik aus dem Hochglanzlabor Richtung Entwickler-Community.

  • OpenAI Robotics sucht wieder Leute für nützliche Roboter. Physical AI ist kein Nebenschauplatz mehr, sondern dort, wo Frontier-Modelle Körper bekommen.

  • TwelveLabs bringt Rodeo als AI-Copilot für Video-Editing. Video-Editoren bekommen damit Suche, Schnitt und Assembly nahe am Agenten-Workflow.

  • Reve 2.0 arbeitet mit layoutbasierter Bildgenerierung statt nur Textprompt-Magie. Wenn Layouts zum Backbone werden, bekommen Designer endlich mehr Kontrolle über Komposition statt nur hübsche Zufälle.

  • Ideogram 4.0 kommt als Open-Weight-Bildmodell mit starkem Text-Rendering und 2K-Ausgabe. Open Weights im Designbereich setzen geschlossene Tools unter Druck.

  • Krea 2 Turbo liefert 2-Sekunden-Bilder mit Style References und LoRAs. Das ist weniger "wow, ein Bild" und mehr "schnell genug für echte Design-Iteration".

  • Runway bringt Aleph 2.0 in ein neues Edit Studio. Zielgenaue Video-Edits sind genau der Teil, an dem AI-Video bisher oft nervt.

Medien, Märkte und Gesellschaft sortieren die Folgen

  • Geminis neue Avatar-Funktion wird breiter ausgerollt. Persönliche AI-Avatare bleiben Spielerei, bis sie in Sales, Support und Learning sehr ernst werden.

  • Google verpflichtet sich zu neuen Water-Stewardship-Zielen für Data Center, während New Yorks Parlament ein einjähriges Moratorium für neue große Data Center beschlossen hat. Jetzt muss die Gouverneurin entscheiden.

  • UK-Medien dürfen sich aus Googles AI Overviews ausklinken. Wenn Publisher Kontrolle zurückfordern, wird der Suchfrieden wacklig.

  • Black Forest Labs holt Martin Scorsese als Advisor für Visual AI, während Amazons AI-Animationsserie nach Spott wieder zurückgezogen wurde.

  • The Guardian warnt vor Smartglasses und Prüfungsbetrug. Schulen werden nicht um bessere Kontrollen herumkommen, aber was prüft man noch sinnvoll?

  • Amazons AI-generierte Produktbilder tauchen in der Suche auf. Shopping wird zwar immer wie visueller, aber auch weniger vertrauenswürdig.

  • Box berichtet, dass AI 13 neue Job-Typen geschaffen hat. Gute Erinnerung: Jobdebatten sind selten nur Wegfall, oft auch Re-Sortierung.

Geschafft! Aber kein Grund zum traurig sein. Die AInauten sind schon bald wieder zurück, mit neuem Futter für dich.

Bis am Montag, mit einer frischen Runde News, Hacks und Insights für dich!

Deine AInauten
Fabian & Reto

P.S.: Folge uns auf den Socials! X, LinkedIn, Facebook, Insta, YouTube, TikTok

Die AInauten Journey: So können wir dir helfen!

AI EXPLORER: Der schnelle Einstieg in die AI-Welt, perfekt zum Reinschnuppern, wenn du noch keine Erfahrung hast. Mehr erfahren » 

⭐⭐⭐ AI POWER USER: Werde zum AI-Profi in 30 Tagen. ChatGPT Masterclass, Prompting Pro Bootcamp, 50+ Deep-Dives mit wöchentlichen Updates. Spare 10+ Stunden pro Woche. Kein Abo. Mehr erfahren »

⭐⭐⭐⭐⭐ AI AUTOMATION EXPERT: Die Königsklasse. Alle unsere Trainings aus AI EXPLORER und AI POWER USER! Plus Community mit Support. Baue Systeme, die 24/7 für dich arbeiten - mit Zapier, Make, n8n Trainings, Vibe Coding, 50+ Use Cases und Tool-Rabatte. Mehr erfahren »

Du musst kein Technikprofi sein, um mit AI richtig Zeit zu sparen. Im AI AUTOMATION EXPERT zeigen wir dir Schritt für Schritt, wie du wiederkehrende Aufgaben abgibst, Content schneller produzierst, Leads sauber nachfasst und Prozesse automatisch laufen lässt.

Hier lernst du konkret auch als absoluter Anfänger und Nicht-Techie, wie du deine Prozesse automatisieren kannst. Verständlich erklärt, mit Vorlagen, die sofort funktionieren, und einer Community, die dir den Rücken stärkt.

Noch unsicher? Starte mit dem AI POWER USER oder schau dir die komplette Journey an.

Klingt gut, aber was sagen andere? Schau dir unsere “Wall of Love” an.

Weiterlesen