
Moin AInauten,
Willkommen zurück zur neuen Ausgabe deines Lieblingsnewsletters!
Wie schnell dreht sich die AI-Welt gerade? So schnell, dass du diese Woche gleichzeitig einen Song aus deinem Urlaubsfoto machen kannst und einen persönlichen AI-Agenten per QR-Code bekommst - während der mächtigste Tech-CEO der Welt uns alle warnt, dass wir dringend eine Atombehörde für AI brauchen…
Das haben wir heute für dich im Gepäck:
⚠️ Sam warnt: “Nur noch zwei Jahre bis zur Superintelligenz!”
🎵 Gemini macht Musik und Voicebox klont deine Stimme
👀 Persönliche Agenten: Der Hummer vs. Zuck
🤖 Die Roboter sind los … aber wie!
Los geht’s!
⚠️ Sam warnt: “Nur noch 2 Jahre bis zur Superintelligenz! Wir haben keine Notbremse.”
Letzte Woche trafen sich die mächtigsten Menschen der AI-Bubble Welt in Neu-Delhi. Alles, was Rang und Namen hat, stand auf einer Bühne. Es war aber alles andere als eine weitere Tech-Konferenz, an der sich die Tech-Bros feiern lassen.
Nachdem Dario Amodei von Anthropic (Claude) bereits am WEF in Davos die Alarmglocken geläutet hatte, lieferte nun auch Sam von OpenAI die deutlichste Warnung seiner Karriere - schau dir die 10-Minuten-Keynote und das Interview an:
„Auf unserem derzeitigen Kurs sind wir nur noch wenige Jahre von den ersten Versionen echter Superintelligenz entfernt. Bis Ende 2028 könnte ein Großteil der weltweiten intellektuellen Kapazität in Rechenzentren liegen und nicht mehr außerhalb davon.“
Zwei Jahre. Nicht zehn. Nicht mehr "irgendwann" in ferner Zukunft. Zwei.
Und sie machen ernst, denn die Dimensionen in der AI-Ökonomie sind absurd: OpenAI schließt gerade eine $100-Milliarden-Finanzierungsrunde bei einer Bewertung von $850 Milliarden ab. NVIDIA plant, $30 Milliarden in diese Runde zu investieren.
Auch Anthropic sammelt weitere $30 Milliarden ein, bei einer Bewertung von $380 Milliarden. Nicht schlecht für ein Startup, das gerade mal drei Jahre alt ist.
Es braucht mehr Regulierung - und weniger Kindergarten.
Und Sam legte nach: Die Welt brauche so “etwas wie die internationale Atomenergieagentur, nur für AI”. Dass der CEO des wertvollsten AI-Unternehmens der Welt nach internationaler Regulierung ruft, ist bemerkenswert - aber auch nichts Neues. Nur tut sich in dem Bereich so überhaupt gar nichts. Und das finden wir beunruhigend…
Dass es nicht nur um Diplomatie ging, zeigte ein viraler Moment: Als Modi alle Speaker aufforderte, gemeinsam die Hände zu heben, standen Sam Altman und Anthropic-CEO Dario Amodei demonstrativ getrennt. Kein Handschlag. Kein gemeinsames Foto.
Die zwei mächtigsten AI-CEOs der Welt, auf einer Bühne, und sie können sich nicht mal mehr die Hand geben. C’mon boys, wir sind hier nicht im Kindergarten …
Der Hintergrund: Nachdem Anthropic beim Super Bowl Werbung gegen OpenAIs Ads-Pläne geschaltet hatte, fand Sam das unehrlich.
Die Warnungen kommen auch von anderer Seite. Am selben Tag sprach der amerikanische Senator Bernie Sanders an der Stanford University und mahnte: „Die Regierung und das Volk sind auf den bevorstehenden Tsunami völlig unvorbereitet.“
Sie bauen ‘Gott’ und haben keinen Plan B … Er fordert deshalb ein Moratorium für den Ausbau von AI-Rechenzentren und nennt es den gefährlichsten Moment der modernen Geschichte. Ändern wird das aber nichts, denn alle AI-Labs rasen mit Vollgas voraus ...
Unser Take: It’s happening…
Du kennst uns: Wir sind beeindruckt von den neuen Möglichkeiten, nutzen sie den ganzen Tag. Trotzdem werden wir manchmal bereits etwas nostalgisch und erinnern uns an die Zeiten zurück, wo wir nur von den heutigen Möglichkeiten träumen konnten.
Kim’s Tweet fasst die aktuelle Stimmungslage gut zusammen: “It’s happening…”
Sam sagte auf dem Summit noch etwas, das bei uns im Hinterkopf hängen geblieben ist: "Es wird sehr schwer, eine GPU im Arbeiten zu schlagen." No sh*t, Sherlock!
Wir können nichts anderes tun als immer wieder dasselbe predigen: Du musst dich mit den neuen Möglichkeiten auseinandersetzen.
Wenn du dich praktisch vorbereiten willst, statt nur zuzuschauen: Im AI AUTOMATION EXPERT zeigen wir Schritt für Schritt, wie du mit AI arbeitest und immer am Puls der Zeit bleibst.
🎵 Gemini macht Musik und Voicebox klont deine Stimme
AI-Musik ist nichts Neues. Udio und Suno kennst du. Jetzt hat Google nachgelegt - und ein Feature mitgebracht, dass die beiden anderen nicht haben.
Auch deine eigene Stimme zu klonen ist seit gefühlten Ewigkeiten möglich. Allen voran hat sich hier das Unternehmen ElevenLabs die Pole Position gesichert. Doch es gibt auch hier Alternativen, die wir dir vorstellen wollen.
Gemini Lyria 3: Musik auf Knopfdruck
Google bringt Lyria 3 in die Gemini-App und macht damit AI-Musik für die Allgemeinheit zugänglich. Es funktioniert super simpel: Prompt eingeben und 30 Sekunden später hast du einen Track mit Gesang, Instrumenten und Coverbild.

Du musst nicht mal die Texte liefern, Lyria kann selber dichten. Du steuerst dabei so viel oder wenig wie du willst, von Genre, Stimmung, Tempo, Gesangsstil bis hin zur Sprache - ja, das geht auch auf Deutsch. Und es ist kostenlos in Gemini verfügbar.
Wir haben getestet: Deutsche Prompts funktionieren solide. Die Lyrics sind grammatisch korrekt, die Aussprache überraschend natürlich. Und der Clou für die DACH-Region: Wir haben es auch mit Dialekt-Prompts versucht … und es klappt sogar besser als erwartet (siehe unten)!
Unsere Experimente: 6 Prompts zum Sofort-Testen
Öffne gemini.google.com/music und probier diese Prompts aus - wir finden #4 ganz witzig und haben #6 speziell für die 🇨🇭 gemacht.
1. Der Büro-Klassiker: Ein ironischer deutscher Reggae-Song über den Montag im Großraumbüro. Langsames Tempo, dramatische Streicher, ein Bariton-Sänger der über Druckerstaus, Bullshit-Bingo-Meetings und leere Kaffeemaschinen klagt.
2. Foto-Song (Bild hochladen!): [Newsletter-Coverbild] Mach daraus einen epischen deutschen Song. Beschreibe, was du siehst und verwandle die Stimmung in Musik.
3. Der Geburtstags-Hit: Ein energetischer deutscher Pop-Song zum Geburtstag von Nauti. Er hat jedes AI-Tool getestet bevor es cool war und hat immer 47 Tabs offen. Upbeat, mit Händeklatschen und Trompeten, in breitem Bayerisch.
4. Podcast-Intro: Mitreissende deutsche Hymne. Kampfjet-Dröhnen über Stadion, Crowd tobt. Arena-Ansager mit Hall ruft: "Hello World! [Dein Text]" Dreimal Boxglocke, dann ein monströser Dubstep-Drop mit Stadion-Claps. 4 Sekunden Chaos, harter Cut.
5. Das Haustier-Epos: Ein epischer Yacht-Rock-Song über eine Katze, die glaubt sie wäre ein Löwe. Deutsche Lyrics, Growl-Vocals, E-Gitarren-Solo. Die Katze heißt [Name].
6. Schweizer-Diminutiv: Ein fröhlicher Volksmusik-Song über Schweizer die alles verniedlichen. "Es Käffeli, es Bierli, es Autöli, es Hüsli". Eingängiger Ohrwurm-Beat.
Klar, die Clips sind nicht immer perfekt, aber ziemlich gut und in unter einer Minute erstellt. Für Social Media Reels, Geburtstagswünsche, persönliche Grußbotschaften, Podcast-Intros oder einfach für Fun reicht das allemal.
Profi-Tipps aus Googles offiziellem Prompt-Guide
Google hat eine detaillierte Anleitung veröffentlicht, wie du gute Resultate erzielst.
Genre + Ära zuerst: "80er Synth-Pop", "Indie Folk", "Bayerische Blasmusik"
Tempo + Rhythmus beschreiben: "Langsame Ballade", "Treibender Beat"
Instrumente: "Akustische Gitarre, sanftes Piano, leichte Percussion"
Stimme: "Weiblicher Sopran, hauchig" oder "Tiefer männlicher Bariton, rau"
Lyrics steuern: Thema beschreiben, personalisierte Details einbauen, oder eigene Texte mit [Verse 1], [Chorus] Tags liefern
Voicebox: Dein eigenes Voice-Cloning-Studio, offline und gratis
Und dann ist da Voicebox. Open Source auf Github. MIT-Lizenz. Läuft komplett lokal auf deinem Rechner.
Das Modell basiert auf Alibabas Qwen3-TTS und ist "das Ollama für Audio". Es gibt Desktop-Apps für Mac und Windows, und die Installation ist simpel.
Du gibst dem Tool ein paar Sekunden Audio einer beliebigen Stimme, und es erstellt ein Voice-Profil. Ab dann kann es diese Stimme in 10 Sprachen beliebigen Text sprechen lassen. Es wirkt natürlich und klingt nicht wie eine TTS-Roboterstimme, sondern fast schon menschlich.

Attraktiv daran: Du kannst es kostenlos nutzen. Bei ElevenLabs zahlst du $5-$99/Monat für Voice-Cloning und schickst deine Daten auf fremde Server. In unserem ersten Test war das Resultat auf Deutsch zwar sehr gut und verständlich, aber es klang nicht wie unsere Stimme.
Und natürlich gibt es eine Schattenseite: Was lokal und kostenlos funktioniert, funktioniert auch für Deepfakes. Der Geist ist aus der Flasche...
👀 Persönliche Agenten: Der Hummer vs. Zuck
Was für ein Monat es war für den Hummer! 🦞
OpenClaw ist immer noch das Thema Nummer 1 in unserer X-Timeline - kein Wunder, bei weit über 200.000 GitHub-Stars. (Wenn du nur Bahnhof verstehst, hier nachlesen.)
Leute bauen sich damit persönliche Betriebssysteme, die ihr Business im Schlaf betreiben. Wir erleben es in der AInauten-Community hautnah: Die Begeisterung ist real, der Frust aber auch. OpenClaw ist mächtig. Es ist ein wahrhaftiges Power-Tool, aber für die meisten Endnutzer aktuell noch mit zu viel Tech und Risiko behaftet.
Das OpenClaw-Phänomen
Der Entwickler von OpenClaw, Peter Steinberger, wurde letzte Woche von OpenAI angeworben. Das Projekt wird nun in eine unabhängige Open-Source-Stiftung überführt. Pete meinte im Lex-Fridman-Interview: "Ich mache das nicht fürs Geld. Ich will Spaß haben und Impact." Das ist ihm auf jeden Fall schon mal gelungen.
Super sehenswert und sympathisch.
Es gibt viele begeisterte Nutzer, wie Jason Calacanis, der allen seinen Mitarbeitenden OpenClaw aufs Auge drückt (siehe diese inspirierende Folge seines Podcasts).
Aber die Schattenseiten sind nicht einfach wegzureden ... OpenClaw hat vollen Zugriff auf deinen Computer, und die Sicherheitsarchitektur ist, sagen wir mal: work in progress. Meta hat OpenClaw auf Firmen-Laptops verboten - und ist damit nicht allein.
Zuck’s Antwort: Manus Agents
Und genau hier kommt Manus ins Spiel! Manus war ein AI-Agent-Startup aus Singapur, das letztes Jahr mit einem autonomen Agenten viral ging. Letzten Dezember hat Mark Zuckerberg in die Meta-Portokasse gegriffen und sich das für über 2 Milliarden Dollar unter den Nagel gerissen.
Und letzte Woche kam dann der erste große Launch: Manus Agents in Telegram! Das Setup? QR-Code scannen. Fertig. Kein Terminal. Kein Git. Kein Mac-Mini nötig.
Es ist erstaunlich einfach! Danach hast du einen vollwertigen AI-Agenten in deinem Chat. Nicht einfach einen Chatbot. Sondern einen Agenten, der für dich arbeitet.
Social Media-Beiträge vorbereiten, Wohnungen suchen, Hotels buchen, Websites erstellen, PDFs generieren, Research machen, Meeting-Vorbereitungen erledigen und Videos aus einer einzigen Nachricht erstellen.
Das ist erst der Anfang. Co-Founder Zhang Tao kündigte auf X an, dass Integrationen mit WhatsApp, Slack und Discord sehr bald folgen werden. Du kannst auch viele deiner Apps direkt integrieren: von Gmail zu Drive zu Outlook zu Notion zu Slack zu Hubspot zu Airtable zu Github zu HeyGen zu tldv zu Stripe zu PayPal zu Make zu Zapier zu …

Dazu kommen praktische Features wie:
du kannst direkt per E-Mail mit Manus kommunizieren
es gibt vordefinierte Skills zur Auswahl oder du lädst eigene hoch/via GitHub
du kannst dein Wissen/Memory mitgeben
du hast einen Cloud Browser (auf Wunsch mit deinen Logins/Cookies)
du kannst wiederkehrende Tasks schedulen
OpenClaw vs. Manus: Eine kurze Übersicht
Es gibt nicht richtig oder falsch, nicht besser oder schlechter. Am Ende werden verschiedene Modelle koexistieren.
Die entscheidende Frage lautet aber nicht “welches”, nicht “ob”, sondern “wann”. Und die Antwort ist 2026 klar: Ja, du wirst einen persönlichen AI-Agenten brauchen - egal, ob OpenClaw, Manus, Claude Cowork, irgendwas Neues von ChatGPT - it’s happening!
Feature | OpenClaw | Manus Agents |
|---|---|---|
Setup | Komplex (Terminal, Config, API-Keys) | QR-Code scannen, einloggen, fertig |
Kontrolle | Maximal - läuft lokal, du konfigurierst alles | Minimal - Meta entscheidet |
Power | Extrem mächtig, voll konfigurierbar | Stark, weniger flexibel, aber viele Connectors |
Sicherheit | Du bist verantwortlich, eine Baustelle | Cloud-basiert, Meta hat deine Daten |
Für wen | Techies, Power-User, Entwickler | Alle, die sofort starten wollen |
Kosten | via API (nutzungsbasiert) oder OAuth (pauschal) | Pauschaler Abopreis plus optionale Credits |
Wenn du mit uns zusammen deine eigenen AI-Agenten richtig aufsetzen und ins Rennen schicken willst, komm ins AI AUTOMATION EXPERT-Programm. Wir freuen uns auf dich!
🤖 Die Roboter sind los … aber wie!
Ok, zum Abschluss noch ein Blick in die Zukunft. Nee, Moment: Das ist ja bereits Realität! Da bleiben uns echt die Worte weg. Unitrees Roboter tanzen, rennen, breakdancen, rennen die Wände hoch und machen Salti… Aber schau selbst!
Zum Vergleich: So sah es letztes Jahr aus… krass, was sich da getan hat! Und die Roboter haben einen Vorteil: sobald einer etwas kann, können es alle 🤯 ...
Geschafft! Bis zur nächsten Ausgabe.
Mehr AI-Praxis, weniger Hype, wie immer. Bis dahin!
Reto & Fabian von den AInauten
Die AInauten Journey: So können wir dir helfen!
⭐ AI EXPLORER: Der schnelle Einstieg in die AI-Welt, perfekt zum Reinschnuppern, wenn du noch keine Erfahrung hast. Mehr erfahren »
⭐⭐⭐ AI POWER USER: Werde zum AI-Profi in 30 Tagen. ChatGPT Masterclass, Prompting Pro Bootcamp, 50+ Deep-Dives mit wöchentlichen Updates. Spare 10+ Stunden pro Woche. Kein Abo. Mehr erfahren »
⭐⭐⭐⭐⭐ AI AUTOMATION EXPERT: Die Königsklasse. Alle unsere Trainings aus AI EXPLORER und AI POWER USER! Plus Community mit Support. Baue Systeme, die 24/7 für dich arbeiten - mit Zapier, Make, n8n Trainings, Vibe Coding, 50+ Use Cases und Tool-Rabatte. Mehr erfahren »

