- AINAUTEN
- Posts
- 🎧 OpenAI spricht jetzt Dialekt – und klingt verblüffend echt!
🎧 OpenAI spricht jetzt Dialekt – und klingt verblüffend echt!
PLUS: Neue Superkräfte für Claude und Aufruhr in Hollywood

Moin AInauten,
Willkommen zur neuen Ausgabe deines Lieblingsnewsletters!
Es gibt einige Updates, die vor allem im größeren Kontext sehr spannend sind: die neuesten OpenAI Text-zu-Speech-Modelle sind echt stark, Claude zieht mit ChatGPT gleichauf, China mischt mit Kampfpreisen den Wettbewerb auf und Hollywood ist in heller Aufregung, weil die Silicon Valley-Bosse lockerere Copyright-Regeln wollen …
Exciting times! Das haben wir heute für dich im Gepäck:
🗣️ Die besten Text-zu-Speech-Modelle - jetzt testen!
🔥 Claude erhält zwei neue Superkräfte
🇨🇳 Billigste China-KI eskaliert Streit zwischen Silicon Valley und Hollywood
😸 AI-Fun: Strickjacken-Katze
Los geht’s!
🗣️ Die besten Text-zu-Speech-Modelle - jetzt testen!
OpenAI hat in den letzten Wochen einige Neuerungen in die API gebracht, wie das Agenten-SDK und drei neue Audiomodelle: Zwei Voice-zu-Text-Modelle, die sogar Whisper übertreffen, und ein neues Text-zu-Speech-Modell.
Unter openai.fm kannst du es direkt ausprobieren und das Resultat als MP3 downloaden - sehr cool! Und noch cooler fanden wir, dass ein Schweizerdeutscher Text im besten Berner Dialekt wiedergegeben wurde. Oder auch ein Bayerischer.
OpenAI sagt dem Marktführer ElevenLabs den Kampf an
OpenAI hat die neuen Modelle zu extrem attraktiven Preisen veröffentlicht!
Es ist viel günstiger als der Marktführer ElevenLabs - und das sogar ohne Abo!
Während du bei ElevenLabs für 10 Stunden Audio zwischen 72 und 132 Dollar hinblätterst, will OpenAI nur 36 Dollar.

Aber warum überhaupt bezahlen, wenn das Modell mit der natürlichsten Sprachausgabe nun sogar als Open Source veröffentlicht wurde? Wir haben Sesame.com vor einigen Wochen vorgestellt - jetzt kannst du es in deine Apps integrieren.
Unser Lieblingstool: Jetzt endlich auch für Windows!
Quizfrage: Was ist unser liebstes AI-Tool? Du denkst bestimmt, dass es ChatGPT, Claude oder etwas in die Richtung ist. Falsch gedacht, es ist Flow von Wispr!
Wenn du in der Microsoft Windows-Welt unterwegs bist, gibt es nun gute Neuigkeiten: Das Tool ist endlich auch dafür verfügbar.
In den letzten Monaten hat dieser kleine Voice-to-Text-Helfer bei uns für einen echten Produktivitätsboost gesorgt. Die Worte, die du hier liest, wurden damit eingesprochen - und wir “schreiben” fast alles damit. Super hilfreich und empfehlenswert!
🔥 Claude erhält zwei neue Superkräfte
Anthropic rüstet ENDLICH nach und gibt Claude das, was bei anderen schon seit langem Standard ist: Echtzeit-Websuche!
Claude antwortet mit einem kurzen Text und zeigt darunter die Links zu den verwendeten Quellen. Auch direkte Zitate werden integriert, was die Überprüfung erleichtert - so ähnlich, wie wir das von Perplexity und ChatGPT Search gewohnt sind.
Claude can now search the web.
Each response includes inline citations, so you can also verify the sources.
— Anthropic (@AnthropicAI)
4:51 PM • Mar 20, 2025
Aktuell steht das Feature nur als Preview für zahlende Claude-Nutzer in den USA zur Verfügung und funktioniert nur mit Claude 3.7 Sonnet. Sprich: wenn du ein Pro-Abo hast, VPN aktivieren! Im Hintergrund kommt scheinbar der Brave Search-Index zum Einsatz. Eine Ausweitung auf andere Länder und kostenlose Accounts ist geplant.
Warum ist es relevant?
Zum einen hat Claude damit sein größtes Manko im Vergleich zu ChatGPT adressiert. Zum anderen arbeitet Anthropic auch an einer Voice-Funktionalität für Claude, und wird damit noch stärker mit den Features der Mitbewerber gleichziehen.
Es gibt Hinweise im Code auf weitere Funktionen und sogar einen Agenten mit dem Namen Harmony! Der neue “Denk”-Befehl macht das Modell auf jeden Fall schon mal schlauer.
Die nächsten Wochen dürften spannend werden. OpenAI hat die Zeichen erkannt und als kleines Zückerchen schon mal das Credit System für Sora aufgehoben - du kannst nun unlimitiert Videos (10 Sekunden und 720p) generieren.
Anthropic hat übrigens auch gerade eine große Finanzierungsrunde abgeschlossen und 3,5 Milliarden Dollar frisches Kapital erhalten, bei einer Bewertung von 61,5 Milliarden Dollar. Übrigens, Amazon hält über 35%, Google 14% und die Gründer kommen zusammen auf 17,5%.
Websuche in Chatbots wird zum Standard - das bedeutet es für Google
Da der Web-Zugang nun eigentlich ein Standard-Feature der wichtigsten Chatbots ist, wirft das die Frage auf, was das für die Zukunft der Web-Suche bedeutet.

Google selbst kontert zwar mit dem “AI Mode” (aktuell nur auf Englisch - war in unseren ersten Tests ok, aber wir bleiben trotzdem bei Perplexity), aber Webseitenbetreiber verlieren trotzdem Werbeeinnahmen und Besucher – das klassische Suchmaschinen-Geschäftsmodell implodiert in Zeitlupe vor unseren Augen.
Doch selbst wenn Chatbots wie Perplexity und ChatGPT viel weniger Besucher an Websites weiterleiten als traditionelle Suchmaschinen, so ist der Traffic oftmals besser qualifiziert - und ein Großteil der Nutzer bemüht nach wie vor primär Google.
Apropos Chatbots: Schau dir auch mal https://duck.ai an! Da stehen dir einige starke Modelle kostenlos und anonym zur Verfügung - oder direkt über den DuckDuckGo Browser für Android, iOS, MacOS und Windows nutzen.

via Duck.ai
🇨🇳 Billigste China-KI eskaliert Streit zwischen Silicon Valley und Hollywood
Nach DeepSeek R1 und Manus hat der chinesische AI-Gigant Baidu mit ERNIE 4.5 und ERNIE X1 nachgelegt.
“Ja, und … halt wieder zwei neue chinesische Modelle?”
We've just unveiled ERNIE 4.5 & X1! 🚀
As a deep-thinking reasoning model with multimodal capabilities, ERNIE X1 delivers performance on par with DeepSeek R1 at only half the price. Meanwhile, ERNIE 4.5 is our latest foundation model and new-generation native multimodal model.
— Baidu Inc. (@Baidu_Inc)
1:53 AM • Mar 16, 2025
Was macht die neuen chinesischen Modelle interessant?
Ja, aber … sie sind laut Benchmarks State-of-the-art, und spottbillig im Vergleich:
ERNIE 4.5 (man beachte die Version!) ist ein neues multimodales Modell, das Text, Bilder, Video und Audio versteht. Und es soll in etwa GPT 4.5 entsprechen, aber kostet lediglich 1% davon. EIN PROZENT!
ERNIE X1 ist mit dem Reasoning Modell DeepSeek R1 vergleichbar - es löst ebenfalls komplexe Probleme, ist aber nur halb so teuer wie DeepSeek R1.
Der ERNIE Bot ist kostenlos für alle nutzbar, und Baidu hat auch angekündigt, die Modelle Ende Juni als Open Source anzubieten.
Preiszerfall der Intelligenz, aber Benchmarks ≠ Praxiseinsatz
Die Modelle stehen zwar in den Benchmarks ganz weit oben, aber in den Praxistests scheitern sie manchmal an den einfachsten Aufgaben (was nicht zuletzt am unglaublich kleinen Kontextfenster von 8k Tokens liegen könnte)… Zudem ist der API-Zugang für nicht-chinesische Nutzer sehr umständlich.
Aber selbst wenn diese Modelle nicht eins zu eins mit denen von OpenAI und Co. vergleichbar sind, so machen diese dramatischen Preisunterschiede doch vor allem eins deutlich: Intelligenz wird von Woche zu Woche billiger, und wir befinden uns in einem Preiskampf!
Das neue o1-pro Modell ist 270x (!) teurer als das DeepSeek R1 Modell (oder dementsprechend über 500x teurer als ERNIE X1). Baidu hat aber trotz der angeblich vergleichbaren Leistung Schwierigkeiten, eine breite Akzeptanz zu finden, und kämpft mit einer begrenzten Marktdurchdringung.
Nichtsdestotrotz sind Chinas Ambitionen ungebrochen, den USA die Pole Position im AI-Rennen abzunehmen. Am Freitag wurde das Hunyuan-T1-Modell veröffentlicht, das ebenfalls in verschiedenen Benchmarks brilliert. Und in den nächsten Wochen wird DeepSeek R2 ins Haus stehen, was vermutlich auch wieder für Furore sorgen wird…
Der Preis geht nur in eine Richtung: nach unten! Die Intelligenz auf der anderen Seite zeigt steil nach oben.
What will happen when DeepSeek R2 comes out in April and is open-sourced again?
— AshutoshShrivastava (@ai_for_success)
3:15 AM • Mar 15, 2025
Es werden deshalb immer mehr Stimmen laut, chinesische Modelle ganz zu verbieten… Was bei einem Open Source Modell, das auf der eigenen Hardware läuft, irgendwie lächerlich erscheint.
Hollywood vs. Silicon Valley - Copyright wird zum Streitthema
Wenn da nur nicht noch das Thema Copyright wäre: OpenAI und Google haben aufgrund der Copyright-Verletzungsklagen letzte Woche die Trump-Administration aufgefordert angebettelt, das Training von AI als “fair use” zu erklären - sonst sei laut OpenAI der Wettlauf mit China vorbei, weil: Regulierung bremst Innovation!
Demgegenüber steht die Prominenz aus Hollywood. Über 400 Persönlichkeiten haben einen offenen Brief an das Weiße Haus unterzeichnet und warnen davor, dass dies die kreative Industrie bedrohen könnte. Ihre Botschaft: Auch AI-Unternehmen müssen für die Nutzung urheberrechtlich geschützter Werke zahlen, genau wie alle anderen.
Sicher ist: Die Entscheidungen zum Thema Copyright werden weitreichende Folgen auf die Zukunft der (amerikanischen) AI-Branche haben!

via imgflip.com
😸 AI-Fun: Strickjacken-Katze
Gut, nach all den Feature Updates und dem Gerangel, das hinter den Kulissen abgeht, wollen wir heute mit dieser Perle abschließen, die wir auf Reddit gefunden haben. Have a nice day!
Geschafft! Bis zur nächsten Ausgabe.
Reto & Fabian von den AInauten
Wann immer du bereit bist, so können wir dir helfen:
1. AINAUTEN CRASHKURS: Der wohl schnellste und einfachste Einstieg in die Welt der AI. Im Crashkurs lernst du in über 50+ Videos, wie du AI für dich wirklich anwenden kannst. In weniger als zwei Wochen wirst du so zum AI-Experten. Von Prompts, zu Bildern und Videos, bis zu AI im Office ist alles mit dabei. Klicke hier!
2. AINAUTEN PREMIUM: Die Themen aus dem Newsletter tiefer aufgearbeitet. Jede Woche neue AI Praxis-Videos, Tutorials, Tool-Tests, Prompt-Vorlagen, Experimente u. v. m. Wöchentliche Podcasts und News-Zusammenfassungen. Und stelle uns direkt deine Fragen und nutze den direkten Zugang zu uns. Klicke hier!
🔥 3. AI + AUTOMATION: Erlerne die wohl wichtigste Fähigkeit für die nächsten Jahre und kombiniere KI mit Automatisierungen. Automatisiere dich selbst, dein Team oder biete es als Service für Unternehmen an. Dieses Wissen ist aktuell extrem gefragt. Unser Accelerator bringt dich von 0 auf 100. Keine Programmierkenntnisse nötig. Klicke hier!
⭐️ Wie hat dir diese Ausgabe gefallen? |
Login oder Abonnieren um an umfragen teilzunehmen. |