AI-HOI und happy Weekend, liebe AInauten!
Vielleicht hast du letzte Woche nicht alle News, Tools & Hacks rund um das Thema AI mitgekriegt, oder bist erst seit Kurzem dabei. Deshalb hier unser Recap mit allen Headlines aus unserem Newsletter β auf einen Klick!
Hier die wichtigsten News der letzten Woche
π§βπ Jede Woche mehr neue Inhalte im AI-Vault!
(50+ Videos, von ChatGPT zu Bildern, Videos, Automation, Prompts und mehr!)
β Auswahl der Top-BeitrΓ€ge der letzten Woche β
π₯ OpenAI lΓ€sst Sora-Bombe platzen: Diese Video-Revolution stellt alles andere in den Schatten!
Dass du aus einem simplen Textprompt ein kurzes Video generieren kannst, ist hinlΓ€nglich bekannt. Und auch die damit verbundenen EinschrΓ€nkungen: nur kurze Sequenzen, beschrΓ€nkte KontrollmΓΆglichkeiten, nicht immer realistisch, etc.
Doch das gehΓΆrt dank OpenAIs Sora bald der Vergangenheit an!
Bevor wir hinter die Kulissen schauen, haben wir dir ein Video mit all den OpenAI Demos zusammen gestellt - einfach mal durchskippen. Holy moly! β¦ und das ist nur die Spitze des Eisbergs, die OpenAI mit der Γffentlichkeit teilt.
Folgende 10 Themen erwarten dich in diesem Deep-Dive:
π Erschreckend gute AI-Videos, besser als alles andere
π«₯ Angst um Jobs und GeschΓ€ftsmodelle
π₯ Die Krux mit den AI-Imperfektionen
π₯ Text-zu-Video - Sora hΓ€ngt die Konkurrenz locker ab
πͺ© Sora ist ein Welten-Simulator und versteht den 3D-Raum
π€ Sora + Roboter = die perfekte Kombo?
β οΈ Das enorme Risiko, das von Sora & Co. ausgeht β¦
β Rechtliche Probleme am Horizont
π Social Media Plattformen kΓ€mpfen gegen WindmΓΌhlen
π AInauten, watt nu β¦?
π Erschreckend gute AI-Videos, besser als alles andere
Sora tritt damit in eine Arena ein, in der bereits andere Player wie Google mit seinem Lumiere-Modell und Startups wie Runway und Pika mitwirken, und hebt den Wettbewerb auf ein neues Level. Die Γbersicht der Mitbewerber findest du am Ende des Beitrags.
Und es ist nicht einfach ein weiteres Tool; es ist eine echte Meisterleistung der AI-Technologie. Stell dir vor: Videos, die direkt aus Text entstehen, mit einer LΓ€nge von bis zu einer Minute, detaillierten Szenen, komplexen Kamerabewegungen und Charakteren, die vor Emotionen nur so sprΓΌhen!
Und wie wΓ€re es, die Videos auch direkt mit einer Soundkulisse zu untermalen? Unser liebster AI-Voice Generator ElevenLabs zeigt, wie das aussieht (und nutzt dabei den Sora-Hype geschickt, um das neue Feature βAI Sound Effectsβ anzuteasern).
Aktuell ist Sora erstmal nur einer ausgewΓ€hlten Gruppe von kreativen Profis und Testern zugΓ€nglich, um Feedback zu sammeln und das Modell weiter zu verfeinern. Und das aus gutem Grund (dazu spΓ€ter mehr)!
π«₯ Angst um Jobs und GeschΓ€ftsmodelle
Ein Quantensprung: gestern war das hΓΆchste der GefΓΌhle ein 3-4 Sekunden Clip, heute kannst du ganze 60 Sekunden Meisterwerke in einem Rutsch generieren, oder die Szene anpassen lassen (wie der untestehende Tweet anschaulich zeigt). Und das alles basierend auf einer einzigen Texteingabe!
Damit erΓΆffnen sich neue MΓΆglichkeiten in der Videoproduktion, im Storytelling, in der visuellen Kunst, β¦ Das wird einige kreative Berufsgruppen und GeschΓ€ftsmodelle (Stockvideos, anyone?) dazu zwingen, sich weiter zu entwickeln.
Aufnahmen, die heute teuer und zeitaufwendig produziert werden, sind bald preiswert und praktisch sofort verfΓΌgbar (Lizenzierung vorausgesetzt).
Filmemacher, Werbetreibende, Unternehmen und Co. kΓΆnnen ihre Ideen mit synthetischem Video storyboarden oder sogar β wenn es die Gewerkschaften zulassen β komplette Programme damit produzieren.
Ungewohnte kreative und heute schwer vorstellbare AuswΓΌchse werden entstehen β zur Unterhaltung, Bildung und Ablenkung. Es werden Welten generiert, die wir uns noch gar nicht ausmalen kΓΆnnen.
π₯ Die Krux mit den AI-Imperfektionen
Klar, die aktuellen Videos haben kleine MΓ€ngel und sind noch nicht perfekt. Sora kann Schwierigkeiten haben, die Physik komplexer Szenen zu simulieren oder bestimmte Ursache-Wirkungs-ZusammenhΓ€nge zu verstehen.
Zum Beispiel kΓΆnnte ein Charakter in einen Keks beiΓen, aber danach fehlt mΓΆglicherweise die Bissmarkeβ. Oder Tiere und Menschen replizieren sich spontan, wie in diesem Rudel Wolfswelpen β¦
Sam Altman hat die Community dazu eingeladen, Prompt-VorschlΓ€ge zu machen, um die FΓ€higkeiten von Sora zu demonstrieren. Zum Beispiel:
Verschiedene Kreaturen, die auf dem Meer Fahrrad fahren,
ein Lehrvideo ΓΌber Gnocchi, das von einer GroΓmutter in einer toskanischen KΓΌche prΓ€sentiert wird,
ein futuristisches Drohnenrennen auf dem Mars und
mehrere Enten-Drachen-Hybriden,
die einen abenteuerlustigen Hamster durch den Himmel tragen.
Schauen wir uns das Affen-Video etwas genauer an. Es strahlt eine AutoritΓ€t und RealitΓ€t aus, obwohl diese Szene nie stattgefunden hat.
Der Knackpunkt ist hier nicht der Affe, sondern das Schachspiel selbst: dort stehen drei KΓΆnige auf/neben einem 7x7 Brett, anstelle des universellen 8x8 Musters.
Bestimmt hat aber keiner der TrainingsdatensΓ€tze jemals ein solches Brett oder eine solche Position enthalten!
Was offenbart uns dieser Fehler? An unzureichender Rechenleistung und einem Mangel an Daten kann es nicht liegen. Stattdessen versucht das System, die Welt anzunΓ€hern - aber versteht sie noch nicht perfekt.
π₯ Text-zu-Video - Sora hΓ€ngt die Konkurrenz locker ab
Aber im direkten Vergleich zu den anderen Text-zu-Video-Anbietern gibt es keine Zweifel, dass OpenAI trotz dieser Imperfektionen hier etwas ganz GroΓes gelungen ist!
Das sind die wichtigsten Mitbewerber in der Text-zu-Video-Arena:
RunwayML hat mit seinem Gen-2-Update und dem βMotion Brushβ-Feature die Aufmerksamkeit auf sich gezogen. βGame onβ, war dann auch der Kommentar von Co-Founder CristΓ³bal Valenzuela.
Stability AI, bekannt fΓΌr seine Arbeit in der Bildgenerierung, hat vor Kurzem ein Videomodell namens Stable Video Diffusion vorgestellt, das derzeit fΓΌr Forschungszwecke verfΓΌgbar ist.
Pika Labs hat sein Tool Pika 1.0 fΓΌr alle Nutzer verfΓΌgbar gemacht.
Meta hat ein Tool namens Make-A-Video eingefΓΌhrt und das Emu Video Modell angekΓΌndigt, das in soziale Netzwerke integriert werden soll.
Google hat vor wenigen Tagen das multimodale Gemini 1.5 vorgestellt und arbeitet an Lumiere-Modellen, deren VerΓΆffentlichungsdatum noch ungewiss ist.

Die wichtigsten Player, deren Text-zu-Video-Generatoren du bereits nutzen kannst
xAI von Elon Musk hat bisher keinen Text-zu-Video-Generator angekΓΌndigt, aber Bestrebungen in diese Richtung wΓΌrden uns nicht ΓΌberraschen.
Amazon hat den Lex-Chatbot und Titan-Bildgenerator vorgestellt, jedoch noch keine Informationen ΓΌber Videogeneratoren verΓΆffentlicht.
Last, but not least: Midjourney! Anfangs Jahr hat der Platzhirsch unter den Bildgeneratoren angekΓΌndigt, dass man mit dem Training eines Text-zu-Video-Modells starte. Wir sind gespannt, sehr sogar.
Interessant ist auch, dass die Sora-Prompts bei Midjourney Γ€hnliche Resultate bringen. Wir sind ja gespannt, was aus dieser KΓΌche kommen wird, die Messlatte ist nun definitiv hoch angesetzt!
πͺ© Sora ist ein Welten-Simulator und versteht den 3D-Raum
Ok, es gibt einen wichtigen Punkt bei Sora, der uns aufhorchen lΓ€sst und die Synapsen zum Feuern gebracht hat: OpenAI sagt nΓ€mlich, dass das Modell die 3D-Welt simulieren kann!
Unter der Haube wird eine Transformer-Architektur genutzt, wie sie auch bei den GPT-Sprachmodellen zum Einsatz kommt, und mit den MΓΆglichkeiten der Bildgeneratoren kombiniert.
Sprich: Sora manipuliert nicht nur Pixel (wie das die Diffusion-Modelle tun, um Bilder zu generieren), sondern entwickelt eine Konzeptualisierung von dreidimensionalen Szenen, die sich ΓΌber die Zeit entfalten!
Unser Gehirn macht wahrscheinlich etwas Γhnliches; wenn wir uns Szenen und Orte ausmalen, stellen wir uns nicht nur vor, wie sie aussehen, sondern was sie sind.
Und das bedeutet wiederum, dass Sora nicht nur ein System zur Erzeugung von Videos ist.
Es ist ein Schritt hin zur Entwicklung von universellen Simulatoren der physischen Welt. Diese bieten eine realistische Darstellung dessen, wie Objekte in der realen Welt interagieren, und was fΓΌr Emotionen die Charaktere zeigenββ kΓΆnnten.
π€ Sora + Roboter = die perfekte Kombo?
Lass uns nicht um den heiΓen Brei herum reden: Sora ist auf dem besten Weg, den Menschen in Sachen WeltverstΓ€ndnis alt aussehen zu lassen.
Und was passiert, wenn diese Superintelligenz auf Beine (oder RΓ€der) trifft? Genau, Sora-Androiden werden nicht lange auf sich warten lassen und unsere Welt erkunden und uns zur Hand gehen, als wΓ€ren sie schon immer Teil davon gewesen.
Im Krankenhaus, in der Fabrik, zu Hause, bei RettungseinsΓ€tzen oder im Klassenzimmer - halt ΓΌberall da, woβs brenzlig wird oder UnterstΓΌtzung gebraucht wird.
Letztendlich wird die Kombination von AI und Robotik zu massiven Innovationen fΓΌhren, die unser Leben auf unvorstellbare Weise bereichern.
OpenAI sieht Sora auch als ein Basismodell auf dem Weg zu AGI, der allgemeinen kΓΌnstlichen Intelligenz, die uns praktisch in allen Belangen ΓΌberlegen sein wird β¦
Ok, die Sora-Robo-Kombo ist definitiv ein freaky Trip in Richtung Zukunft, der uns alle ein bisschen mehr Sci-Fi im Hier und Jetzt erahnen lΓ€sst.
Es ist eine aufregende, aber auch herausfordernde Zukunft, die eine enge Zusammenarbeit zwischen Technologen, Ethikern, Politikern und der breiten Γffentlichkeit erfordert, um sicherzustellen, dass die Technologie der Menschheit dient und nicht schadet.
Wie stellen wir sicher, dass diese Androiden sicher und verantwortungsbewusst handeln?
Wie bewahren wir die menschliche Autonomie und Kontrolle in einer Welt, in der Maschinen zunehmend menschenΓ€hnliche FΓ€higkeiten erlangen?
Fragen ΓΌber Fragen β¦ auf die wir auch keine Antwort haben.
β οΈ Das enorme Risiko, das von Sora & Co. ausgeht β¦
OpenAI ist sich bewusst, dass mit groΓer Macht auch groΓe Verantwortung kommt, insbesondere im Hinblick auf Risiken wie die Verbreitung von Fehlinformationen und Erstellung von Deepfakes.
Der WEF Global Risks Report 2024 listet die grΓΆΓten Risiken, unter anderem:
die negativen Folgen kΓΌnstlicher Intelligenz
gesellschaftliche und politische Polarisierung
CyberkriminalitΓ€t
Und das sind alles Risiken, die mithilfe der OpenAI Modelle eine ganz neue Dimension annehmen β¦

Der technologische Fortschritt erhΓΆht das Missbrauchspotenzial akut. Die Fortschritte bei Videogeneratoren werden solche Videoinhalte glaubwΓΌrdiger machen und auch deren Erkennung erschweren.
Die Sorge von OpenAI ist berechtigt, und wird praktisch von jedem Unternehmen in diesem Bereich geteilt.
Deshalb wurden fΓΌr das Testing von Sora auch sogenannte βRed Teamerβ engagiert - Experten in Bereichen wie Desinformation, hasserfΓΌllte Inhalte und Bias, die potenzielle Risiken und Schwachstellen im Modell identifizieren sollenββ.
Das ist aber nur eines der Problemfelder, mit denen sich OpenAI befassen muss.

β Rechtliche Probleme am Horizont
Auch rechtlich kΓΆnnte es herausfordernd werden, denn worauf das Modell trainiert wurde, geht aus dem technischen Paper nicht hervor β¦
NVIDIAβs Jim Fan vermutet, dass das Model (unter anderem) mit hochwertigen synthetischen Trainingsdaten gefΓΌttert wurde, wie man sie von Game Engines her kennt.
Aber so genau weiΓ es noch keiner β¦ Diese fehlende Transparenz spiegelt einen wachsenden Trend in der AI-Branche wider. VerstΓ€ndlich, vor dem Hintergrund zahlreicher Klagen gegen AI-Unternehmen - aber nicht hilfreich fΓΌr die Sache.
Die Debatte ΓΌber die Grenzen des fairen Gebrauchs und Urheberrechte in der AI-Γra wird uns weiter beschΓ€ftigen. Besonders betroffen davon sind visuelle KΓΌnstler und Schauspieler.
Letztere haben aus Angst vor Ersetzbarkeit durch AI bereits gestreikt, und auch OpenAI selbst ist in einige Streitigkeiten verwickelt, zum Beispiel mit der New York Times.

OpenAI hat seine Richtlinien bereits geΓ€ndert und betont, die Rechte von Inhaltschaffenden zu respektieren. Man will sogar mit ihnen zusammenarbeiten, damit sie von den neuen MΓΆglichkeiten profitieren kΓΆnnen.
Doch trotz dieser BemΓΌhungen bleibt die Spannung zwischen dem Bedarf an umfangreichen Trainingsdaten fΓΌr die Entwicklung leistungsfΓ€higer AI-Modelle und dem Schutz geistigen Eigentums bestehen.
In der Vergangenheit wurden Meta, Twitter/X, YouTube & Co. beschuldigt, nicht genug zu tun, um die riesigen Mengen an Falschinfos und Hassreden auf ihren Plattformen zu bekΓ€mpfen.
Nun kollidiert der technologische Fortschrit mit einem ohnehin herausfordernden Wahljahr, in dem die HΓ€lfte der WeltbevΓΆlkerung wΓ€hlt β¦ (Social) Media Unternehmen stehen mehr denn je unter Druck, Falschinfos zu unterbinden.

via Time.com
An der MΓΌnchner Sicherheitskonferenz haben deshalb am letzten Freitag 20 wichtige Unternehmen eine ErklΓ€rung unterzeichnet, worin sie sich verpflichten, die Risiken im Zusammenhang mit kΓΌnstlicher Intelligenz und WahlintegritΓ€t zu verringern.
Die Unterzeichner sind: OpenAI, Microsoft, Meta, Google, Adobe, Amazon, Anthropic, Arm, ElevenLabs, IBM, Inflection AI, LinkedIn, McAfee, Nota, Snap, Stability AI, TikTok, TrendMicro, Truepic und X.

π AInauten, watt nu β¦?
Du siehst, diese Entwicklungen zeigen deutlich, wie dynamisch und vielschichtig die Welt der kΓΌnstlichen Intelligenz ist - und wie sie immer weiter in verschiedenste Bereiche unseres Lebens vordringen wird.
OpenAI spielt zweifellos eine SchlΓΌsselrolle in diesem epischen Abenteuer und treibt Innovationen voran, die nicht nur die technologische Landschaft verΓ€ndern, sondern auch tiefgreifende Auswirkungen auf unsere Gesellschaft und Zukunft haben werden.
Wohin die Reise fΓΌhrt, wissen auch wir nicht. Deshalb, im ΓΌbertragenen Sinne: immer schΓΆnen einen Fuss vor den anderen setzen, und dabei den Blick auf die Landkarte und das Wetter am Horizont nicht aus den Augen verlieren. Auf gehtβs!
π€ Integriere tl;dv in deinen Workflow β ein echter Gamechanger fΓΌr deine Meetings
Hast du genug von endlosen Meetings, die sich anfΓΌhlen wie ein Marathon ohne Ziel? Wir kennen das (aus der Vergangenheit, glΓΌcklicherweise). Aber wir haben ein Tool fΓΌr alle, die eben smarter, nicht hΓ€rter arbeiten wollen.
Die Rede ist von tl;dv.
Diese LΓΆsung ist nicht einfach nur ein Meeting-Recorder. Es ist dein persΓΆnlicher Meeting-Assistent, der alles automatisch aufnimmt und transkribiert β und das in ΓΌber 30 Sprachen. Von Zoom ΓΌber Google Meet bis hin zu Microsoft Teams funktioniert alles kompromisslos gut!
Und das funktioniert so gut, dass wir uns eine Pro-Subscription gekauft haben (du kannst es aber auch kostenlos nutzen und ausgiebig testen).
Die wichtigsten Features:
Automatische Aufzeichnung: Funktioniert wie gesagt mit Zoom, Google Meet, Microsoft Teams in ΓΌber 30 Sprachen. Dein Assistent hΓ€ngt sich einfach als stiller ZuhΓΆrer mit ins Meeting, und stellt dir direkt danach die Aufzeichnung zur VerfΓΌgung. Kein Wunder, dass es bereits fast eine Million Nutzer verbuchen kann!

Transkription und Notizen: Es gibt viele Tools, die Meetings aufzeichnen. Wo tl;dv aber wirklich brilliert, ist beim Transkript und der Zusammenfassung! Das Transkript in Deutsch ist sehr akkurat, und die Notizen/Zusammenfassung hilfreich und ausfΓΌhrlich.
Momentaufnahmen auf den Punkt: Mit nur einem Klick oder einer Tastenkombination kannst du SchlΓΌsselmomente direkt markieren, wΓ€hrend du dich voll und ganz auf das GesprΓ€ch konzentrierst. Kein Multitasking mehr, kein Mittippen nΓΆtig!
Clips aus Aufnahmen erstellen: Wenn du magst, kannst du auch bestimmte Meeting-Momente im Handumdrehen mit Kollegen oder Kunden teilen (oder sogar auf Social Media verwenden). Schnell, effizient und ohne Kopfschmerzen!
No-Code ready: Zapier oder Make sind keine FremdwΓΆrter fΓΌr dich, sondern Arbeitskollegen? Dann kannst du das perfekt mit tl;dv verbinden, und Inhalte direkt nach Notion, ein Slack, Salesforce oder das Tool deiner Wahl ΓΌbergeben β oder vice-versa! (Wir lassen zum Beispiel neue AI-Vault-Videos darΓΌber transkribieren und eine Themenliste erstellen).
Keyword Suche: Mit der fortschrittlichen Suchfunktion kannst du Themen durchsuchen und Zusammenfassungen aller Diskussionen erhalten, die fΓΌr dich relevant sind.
Deutsche Firma: Ja, dahinter steckt tatsΓ€chlich eine deutsche Firma aus Aachen! β¦ und wir interpretieren das mal so, dass damit auch den Auflagen der DSGVO Rechnung getragen wird und das Tool somit auch im Unternehmen rechtssicher genutzt werden kann
Basis-Version immer kostenlos: tl;dv hΓ€lt sein Versprechen, immer einen kostenlosen Plan anzubieten, mit unbegrenzten Aufzeichnungen und Transkripten (die du beim nachtrΓ€glichen Upgrade natΓΌrlich vollumfΓ€nglich mit AI-UnterstΓΌtzung durchsuchen/befragen kannst). FΓΌr die Profis gibt es den Pro-Plan, $25/Monat oder $240/Jahr kostet.

π€ So verkaufst du deinen Chatbot als Abo
Chatbots sind ein sehr, sehr beliebtes Thema in der Community und auch bei uns.
Wir haben ja auch schon viel geschrieben ΓΌber einfache Tools, wie z.Β B. Chatbase bis hin zum absoluten Profi-Tool wie FlowiseAI.
Eine Frage, die wir hΓ€ufig bekommen: Gibt es eine einfache MΓΆglichkeit, meine Chatbots oder meine kleine AI-App als Abo zu verkaufen? Ohne viel technisches Know-how?
Heute die Antwort: JA! Mit dem Tool MindStudio.
MindStudio ist ein Chatbot bzw. AI-App-Builder, der extrem mΓ€chtig ist. Du kannst damit sehr komplexe und coole Workflows erstellen, die direkt gehostet werden. Also keine technische Friemelei, sondern Fokus auf den Benutzer.
Das sind die wichtigsten Features von MindStudio:
Chatbots & Apps bauen, ohne Programmierkenntnisse
AI mit deinen eigenen Daten trainieren
Zugriff auf alle wichtigen Modelle auch Open Source wie Mistral etc.
Einfache Verbindung zu vielen wichtigen Apps wie Zapier, Google etc.
Abo UmsΓ€tze generieren mit Bezahlschnittstelle zu Stripe
Alles voll gehostet, kein technisches Setup notwendig

Das Bauen deines Bots ist extrem einfach. Es gibt viele Templates und du kannst dir einfache Flows in wenigen Minuten zusammenklicken.
Und natΓΌrlich kannst du auch Daten und Wissen zu deinem Bot hochladen und das Tool erstellt daraus automatisch eine Vektordatenbank.

Du kannst damit wirklich eine Vielzahl von Bots und Apps erstellen, zum Beispiel AI-Persona Bots mit Erinnerungsfunktion, Blog-Generatoren, Logo Creators und vieles mehr. Es gibt auch jede Menge vorgefertigter Templates:

Auch das VerΓΆffentlichen deines Bots kΓΆnnte nicht einfacher sein, ΓΌber einen simplen Landing-Page-Designer. Keine Bange, es ist null Server Setup notwendig!

Wir haben dazu wie immer im AI-Vault ein Video gemacht und einen AInauten Bot erstellt.
Mehr Details findest du hier, viel SpaΓ beim Chatbot bauen!

Bis am Montag, mit einer frischen Runde News, Hacks und Insights fΓΌr dich!
Deine AInauten
Du willst mehr? So kΓΆnnen wir dir helfen:
Das AI-Bootcamp: Der wohl schnellste & einfachste Einstieg in die Welt der AI. Im Bootcamp lernst du in ΓΌber 50+ Videos, wie du AI fΓΌr dich wirklich anwenden kannst. In weniger als 2 Wochen wirst du so zum AI-Experten. Von Prompts, zu Bildern und Videos, bis zu AI im Office ist alles mit dabei.
Der AI-Vault: Jede Woche neue AI Praxis-Videos, Tutorials, Tool-Tests, Promptvorlagen, Experimente uvm. FΓΌr alle AI-Enthusiasten, die die Basics bereits drauf haben und noch tiefer in die Praxis einsteigen wollen. Oder einfach gemeinsam entdecken wollen.






π Social Media Plattformen kΓ€mpfen gegen WindmΓΌhlen