- AINAUTEN
- Posts
- 🔥 Top KI-Voice Bot spricht Deutsch und kostet nix!
🔥 Top KI-Voice Bot spricht Deutsch und kostet nix!
PLUS: Ist das neue GPT 4.5 Top oder Flop?

Moin AInauten,
Holy GPT, letzte Woche ging ja die Post ab! Erst hat Elon Grok 3 vom Stapel gelassen, dann hat Anthropic mit Claude Sonnet 3.7 alle ins Staunen versetzt, und als wäre das nicht genug, hat Papa Sam noch schnell GPT 4.5 hinterhergeworfen (und das Videomodell Sora für ChatGPT-Plus-User in der EU freigeschaltet).
Unser Weekend? Speed-Dating im digitalen Rabbithole mit Voice-Chatbots, die sich gegenseitig zu übertreffen versuchten - mit Ergebnissen zwischen Wow! und Wat? …
Das haben wir heute für dich im Gepäck:
🐳 ChatGPT 4.5: OpenAIs neuer Gigant im Realitätscheck
🔥 Voice-Chatbot-Vergleich: Wer spricht Deutsch, kostenlos & unzensiert?
💎 AI-Fun: Krypto war gestern, Tokens sind der neue Flex
Los geht’s!
🐳 ChatGPT 4.5: OpenAIs neuer Gigant im Realitätscheck
Ist das neueste Modell von OpenAI wirklich der versprochene Game-Changer? Während Sam Altman von “AGI-Momenten” schwärmt, fragen wir uns, ob es nur ein überteuertes Upgrade mit mehr Vibes als Substanz ist.
Der Koloss mit mehr Gehirn und mehr Bauchgefühl
Kurz zu den Fakten:
GPT 4.5 (Codename “Orion”) ist das bisher größte und rechenintensivste Modell mit etwa 10x mehr Trainingsaufwand als GPT-4.
GPT-4.5 ist kein Reasoning Modell. Der Fokus liegt auf emotionaler Intelligenz, menschenähnlichen Gesprächen, Kreativität und breitem Allgemeinwissen, nicht auf tiefem logischem Denken. Hier der beliebte “Zeichne mir ein Einhorn”-Test:

In einer detaillierten Benchmark-Analyse zeigt sich ein differenziertes Bild. Fazit: Nicht schlecht, aber auch nicht gerade mind-blowing.
Die Halluzinationsrate sank von 61,8% auf "nur noch" 37,1%. Ein Fortschritt, aber mal ehrlich: Wenn dein Assistent immer noch in mehr als einem Drittel der Fälle Unsinn erzählt, ist das nicht gerade beruhigend ...
Aktuell ist das Modell nur mit dem 200 Dollar teuren Pro-Zugang nutzbar. Es soll demnächst auch für ChatGPT Plus Nutzer ausgerollt werden.
Es unterstützt Uploads sowie das Canvas-Tool, aber eine realistische Zwei-Wege-Voicefunktion fehlt bisher - ein überraschendes Manko für ein Modell, das auf natürliche Konversation setzt.
Was aber richtig heftig ist, ist der API-Preis: für eine Million Token (etwa 750.000 Wörter) kostet der Input $75 und der Output $150. Zum Vergleich: GPT-4o kostet nur $2,50, resp. $10! Das ist ein 30-facher bzw. 15-facher Unterschied - so teuer, dass fast niemand es nutzen wird.
Auch interessant: Der Knowledge Cutoff ist Oktober 2023 - warum wohl? Vermutlich, weil das Internet bereits mit ChatGPT Content “verseucht” ist.
Unser Take: Das war meh ...
Die Reaktionen auf Twitter, pardon, X sind ein Mix aus Euphorie, Gleichgültigkeit und Enttäuschung. GPT-4.5 ist weder der versprochene Durchbruch noch ein kompletter Flop - bleibt aber deutlich hinter den hochgesteckten Erwartungen zurück.
Auch die Demo von OpenAI war großes Kino, aber nicht im Positiven… Der erste Use Case: “UGHHH! Mein Freund hat mir schon wieder abgesagt!!! Schreibe eine SMS, dass ich IHN HASSE!!!!” Echt jetzt?
Today we’re releasing a research preview of GPT-4.5—our largest and best model for chat yet.
Rolling out now to all ChatGPT Pro users, followed by Plus and Team users next week, then Enterprise and Edu users the following week.
— OpenAI (@OpenAI)
9:08 PM • Feb 27, 2025
🔥 Der große Voice-Chatbot-Vergleich: Wer spricht Deutsch und ist kostenlos & unzensiert?
Die AInfluencer auf X überbieten sich mit Superlativen zum neuen Sprachmodell von sesame.com. Ein Journalist meinte sogar, das sei der erste Sprachassistent, mit dem er mehr sprechen wollte.
Und in der Tat fühlt es sich an, als würdest du mit einer echten Person sprechen!
Klicke hier, probiere es aus (mit Deutsch hapert es noch im Moment) - oder höre einfach rein:
This is by far the most human-like AI voice model I’ve listened & tried!
@sesame is simply incredible and is truly the “Her” AI moment! 😮
— Derya Unutmaz, MD (@DeryaTR_)
2:49 PM • Mar 1, 2025
Will Sesame nun ChatGPT und Co. Konkurrenz machen? Nein, denn das Modell soll demnächst als Open Source (!) zur Verfügung gestellt werden. Stattdessen hat sich Sesame Funding von a16z gesichert, um einen Voice Companion für eine Brille zu bauen. Bis dahin geben wir uns mit Maya und Miles zufrieden - really well done!
Was sind die besten Voice-Bots?
Die Interaktion mit Voice wird immer wichtiger, und wir haben ja schon des Öfteren darüber berichtet, wie wir den ChatGPT Advanced Voice Mode zusammen mit unseren Ray-Ban Glasses nutzen. Und auch als Psychologe kommen Voicebots immer mehr zum Einsatz.
Aber was gibt es sonst noch für Alternativen? Wir haben, ehrlich gesagt, auch ein bisschen den Überblick verloren - und dementsprechend mal recherchiert.
Grok 3’s voice mode has no censorship. It’s quite surprising.
Grok Voice Chat with ChatGPT
— CHOI (@arrakis_ai)
8:47 AM • Feb 21, 2025
ChatGPT Advanced Voice Mode: Der Branchenstandard mit Grenzen
ChatGPT hat mit der Einführung des Advanced Voice Mode letztes Jahr wirklich die Barrieren zwischen Mensch und Maschine durchbrochen.
Viele Sprachen, natürliche Stimmen, flüssige Gespräche, geringe Latenz, Unterbrechungen mitten im Satz - passt! Du kannst auch in den textbasierten Chat-Modus wechseln, und dann wieder im Voice-Modus weiterfahren.
Seit Kurzem ist der Advanced-Voice-Mode auch für kostenlose Nutzer verfügbar - aber leider nur sehr beschränkt. Selbst Plus-Abonnenten sind aktuell auf 45-60 Minuten limitiert - aber haben zumindest Video- und Bildschirmfreigabe dabei. Gut ist auch das Erinnerungsvermögen (Kontext).
Sobald das Limit erreicht wurde, kann der reguläre Voice Mode genutzt werden.
Diskussionen über nicht jugendfreie Themen sind nur mit Jailbreaks möglich.
Fazit: Tolle Sprachqualität, und wenn du schon ein ChatGPT Plus Abo hast, ist das auf jeden Fall eine gute Option.
Microsoft Copilot Voice: Der großzügige Demokratisierer
Microsoft hat den Copilot Voice Mode gerade mit unbegrenztem kostenlosen Zugang für alle Nutzer freigegeben (Microsoft-Login erforderlich).
Copilot Voice bietet vier verschiedene Stimmen in 40 Sprachen. Super praktisch wenn du auf Reisen bist oder eine neue Sprache lernen willst. Bonus: du kannst den Speed auf 1.5x stellen, und bald gibt’s auch Characters.
Du kannst die App fürs Mobile oder Desktop hier herunterladen. Wenn du den Edge Browser nutzt, steht der Voice Copilot auch direkt darüber zur Verfügung.
Zudem hast du über den “Think Deeper” Button unlimitierten Zugang zum o1-Modell, für das du bei OpenAI zahlst - really cool!
Fazit: Die beste kostenlose und unbegrenzte Alternative zu ChatGPT, vor Allem wenn du eine Quasselstrippe bist. Integriert sich ideal in die Microsoft-Welt.
Google Gemini & NotebookLM: Keine Limits und überall verfügbar
Google Gemini Voice Mode lässt sich kostenlos nutzen auf Android und iPhone - aber nicht auf dem Desktop. Neu auch mit Memory für alle User.
Dafür musst du das Google AI Studio nutzen. Das Live-Feature ist der ideale Assistent für alles, was du am Bildschirm machst (unbedingt ausprobieren!).
Auch Gemini ist unbeschränkt kostenlos nutzbar und spricht über 40 Sprachen.
Wenn du spezifisch mit Inhalten chatten möchtest, dann ist auch NotebookLM eine gute Alternative (unser Playbook mit Prompts hier).
Du kannst einen Podcast aus den Inhalten erstellen, und dich dann auch direkt dazwischen schalten und mit den Hosts/Experten über die Inhalte philosophieren. Btw, bald soll es auch ein neues Mindmap-Feature geben.
Fazit: Ähnlich vom Funktionsumfang wie Microsoft Co-Pilot, kostenlos und unbegrenzt, integriert sich ideal in die Google-Welt.
#Gemini interviewing #ChatGPT about #AI
I'm a #fan of @GeminiApp Voice Mode, but that additional '#breathing' touch in @ChatGPTapp made it feel like more human. Yet Gemini Voice remains one of my favorites.
#ChatGPT#Gemini#ArtificialIntelligence#AIEdu@GoogleAI @OpenAI#Tech— Abdel IG (@Abdell390)
12:48 AM • Feb 27, 2025
Grok 3 Voice Mode: Wild, unzensiert, kostenpflichtig & nur auf dem iPhone
Grok 3, die Antwort von Elon Musks xAI auf ChatGPT, verfolgt einen radikal anderen Ansatz. Er verzichtet bewusst auf Zensur und ermöglicht Diskussionen über nicht jugendfreie Themen - du kannst hier mit ihm chatten.
Das Herzstück sind seine verschiedenen Persönlichkeitsmodi, darunter der "Unhinged"-Modus, der flucht und beleidigt, aber auch schreien kann. Andere Modi umfassen "Storyteller", "Romantic", "Meditation", "Conspiracy" (der gerne über Verschwörungstheorien, UFOs und Bigfoot spricht), "Unlicensed Therapist", "Grok Doc", "Sexy" (als "18+" gekennzeichnet) und "Professor".
Die Qualität bleibt noch hinter der von ChatGPT zurück, Grok wiederholt sich oft und bleibt in Schleifen stecken - und spricht erstmal nur Englisch.
Fazit: Wenn du einen englischsprachigen Voice-Bot mit Ecken und Kanten suchst, der auch mal sagt, wo es lang geht, dann bist du bei Grok richtig …
Weitere Anbieter, die wir auf dem Radar haben
Alexa+ - Amazon hat gerade ein Upgrade vorgestellt, powered by ElevenLabs
ElevenLabs Agents - du kannst dir damit eigene Sprach-Assistenten bauen
AI-Friends - mit Replika und Character.ai kannst du ebenfalls sprechen
Meta AI Voice - der Voice Chat steht auf WhatsApp, Insta und Facebook zur Vefügung - aber die Nutzung war in unseren Tests umständlich …
Unser Take: Du hast die Qual der Wahl
Die Landschaft der Voice-Chatbots zeigt klare Unterschiede in Qualität, Verfügbarkeit und Freiheitsgrad.
Modell | Qualität | Zensur-Level | Kostenlos | Sprachen |
---|---|---|---|---|
Sesame | 👌 Mensch | ⚡ Unklar | ✅ Kostenlos | Nur 🇺🇸 |
ChatGPT | 🤝 Sehr gut | 🚫 Hoch | 🔓 Limitiert | 🇩🇪, 🇺🇸, … |
Copilot | 🤖 Gut | 🚫 Hoch | ✅ Kostenlos | 🇩🇪, 🇺🇸, … |
Gemini | 🤖 Gut | 🚫 Hoch | ✅ Kostenlos | 🇩🇪, 🇺🇸, … |
Grok 3 | 😏 Ok | ⚠️ Gering | 🔓 X Premium | Nur 🇺🇸 |
Die Wahl hängt letztlich davon ab, was für dich am wichtigsten ist:
👉 Wenn du maximale Qualität willst: ChatGPT oder Sesame.
👉 Wenn du etwas Kostenloses ohne Zeitlimit suchst: Microsoft Copilot & Gemini.
👉 Wenn du unzensierte Gespräche auf Englisch willst: Grok 3.
P.S. Und solange die Bots sich noch in einer für uns Menschen verständlichen Sprache unterhalten, ist ja alles gut …
Today I was sent the following cool demo:
Two AI agents on a phone call realize they’re both AI and switch to a superior audio signal ggwave
— Georgi Gerganov (@ggerganov)
4:11 PM • Feb 24, 2025
💎 AI-Fun: Krypto war gestern, Tokens sind der neue Flex
Investieren? Hodln? Ne, vergiss Bitcoin - mit GPT 4.5 zählt nur noch, wie viele Tokens du dir leisten kannst.
Geschafft! Bis zur nächsten Ausgabe.
Reto & Fabian von den AInauten
Wann immer du bereit bist, so können wir dir helfen:
1. AINAUTEN CRASHKURS: Der wohl schnellste und einfachste Einstieg in die Welt der AI. Im Crashkurs lernst du in über 50+ Videos, wie du AI für dich wirklich anwenden kannst. In weniger als zwei Wochen wirst du so zum AI-Experten. Von Prompts, zu Bildern und Videos, bis zu AI im Office ist alles mit dabei. Klicke hier!
2. AINAUTEN PREMIUM: Die Themen aus dem Newsletter tiefer aufgearbeitet. Jede Woche neue AI Praxis-Videos, Tutorials, Tool-Tests, Prompt-Vorlagen, Experimente u. v. m. Wöchentliche Podcasts und News-Zusammenfassungen. Und stelle uns direkt deine Fragen und nutze den direkten Zugang zu uns. Klicke hier!
🔥 3. AI + AUTOMATION: Erlerne die wohl wichtigste Fähigkeit für die nächsten Jahre und kombiniere KI mit Automatisierungen. Automatisiere dich selbst, dein Team oder biete es als Service für Unternehmen an. Dieses Wissen ist aktuell extrem gefragt. Unser Accelerator bringt dich von 0 auf 100. Keine Programmierkenntnisse nötig. Klicke hier!
⭐️ Wie hat dir diese Ausgabe gefallen? |
Login oder Abonnieren um an umfragen teilzunehmen. |