AI-HOI und happy Weekend, liebe AInauten!

Vielleicht hast du letzte Woche nicht alle News, Tools & Hacks rund um das Thema AI mitgekriegt, oder bist erst seit Kurzem dabei. Deshalb hier unser Recap mit allen Headlines aus unserem Newsletter โ€“ auf einen Klick!

Hier die wichtigsten News der letzten Woche

๐Ÿง‘โ€๐Ÿš€ Jede Woche mehr neue Inhalte im AI-Vault!
(50+ Videos, von ChatGPT zu Bildern, Videos, Automation, Prompts und mehr!)

โ†’ Auswahl der Top-Beitrรคge der letzten Woche โ†

๐Ÿ’ฅ OpenAI lรคsst Sora-Bombe platzen: Diese Video-Revolution stellt alles andere in den Schatten!

Dass du aus einem simplen Textprompt ein kurzes Video generieren kannst, ist hinlรคnglich bekannt. Und auch die damit verbundenen Einschrรคnkungen: nur kurze Sequenzen, beschrรคnkte Kontrollmรถglichkeiten, nicht immer realistisch, etc.

Doch das gehรถrt dank OpenAIs Sora bald der Vergangenheit an!

Bevor wir hinter die Kulissen schauen, haben wir dir ein Video mit all den OpenAI Demos zusammen gestellt - einfach mal durchskippen. Holy moly! โ€ฆ und das ist nur die Spitze des Eisbergs, die OpenAI mit der ร–ffentlichkeit teilt.

Folgende 10 Themen erwarten dich in diesem Deep-Dive:

  1. ๐Ÿ™€ Erschreckend gute AI-Videos, besser als alles andere

  2. ๐Ÿซฅ Angst um Jobs und Geschรคftsmodelle

  3. ๐ŸŽฅ Die Krux mit den AI-Imperfektionen

  4. ๐ŸฅŠ Text-zu-Video - Sora hรคngt die Konkurrenz locker ab

  5. ๐Ÿชฉ Sora ist ein Welten-Simulator und versteht den 3D-Raum

  6. ๐Ÿค– Sora + Roboter = die perfekte Kombo?

  7. โš ๏ธ Das enorme Risiko, das von Sora & Co. ausgeht โ€ฆ

  8. โš– Rechtliche Probleme am Horizont

  9. ๐Ÿ›‘ Social Media Plattformen kรคmpfen gegen Windmรผhlen

  10. ๐Ÿ‘€ AInauten, watt nu โ€ฆ?

๐Ÿ™€ Erschreckend gute AI-Videos, besser als alles andere

Sora tritt damit in eine Arena ein, in der bereits andere Player wie Google mit seinem Lumiere-Modell und Startups wie Runway und Pika mitwirken, und hebt den Wettbewerb auf ein neues Level. Die รœbersicht der Mitbewerber findest du am Ende des Beitrags.

Und es ist nicht einfach ein weiteres Tool; es ist eine echte Meisterleistung der AI-Technologie. Stell dir vor: Videos, die direkt aus Text entstehen, mit einer Lรคnge von bis zu einer Minute, detaillierten Szenen, komplexen Kamerabewegungen und Charakteren, die vor Emotionen nur so sprรผhen!

Und wie wรคre es, die Videos auch direkt mit einer Soundkulisse zu untermalen? Unser liebster AI-Voice Generator ElevenLabs zeigt, wie das aussieht (und nutzt dabei den Sora-Hype geschickt, um das neue Feature โ€œAI Sound Effectsโ€œ anzuteasern).

Aktuell ist Sora erstmal nur einer ausgewรคhlten Gruppe von kreativen Profis und Testern zugรคnglich, um Feedback zu sammeln und das Modell weiter zu verfeinern. Und das aus gutem Grund (dazu spรคter mehr)!

๐Ÿซฅ Angst um Jobs und Geschรคftsmodelle

Ein Quantensprung: gestern war das hรถchste der Gefรผhle ein 3-4 Sekunden Clip, heute kannst du ganze 60 Sekunden Meisterwerke in einem Rutsch generieren, oder die Szene anpassen lassen (wie der untestehende Tweet anschaulich zeigt). Und das alles basierend auf einer einzigen Texteingabe!

Damit erรถffnen sich neue Mรถglichkeiten in der Videoproduktion, im Storytelling, in der visuellen Kunst, โ€ฆ Das wird einige kreative Berufsgruppen und Geschรคftsmodelle (Stockvideos, anyone?) dazu zwingen, sich weiter zu entwickeln.

Aufnahmen, die heute teuer und zeitaufwendig produziert werden, sind bald preiswert und praktisch sofort verfรผgbar (Lizenzierung vorausgesetzt).

Filmemacher, Werbetreibende, Unternehmen und Co. kรถnnen ihre Ideen mit synthetischem Video storyboarden oder sogar โ€“ wenn es die Gewerkschaften zulassen โ€“ komplette Programme damit produzieren.

Ungewohnte kreative und heute schwer vorstellbare Auswรผchse werden entstehen โ€“ zur Unterhaltung, Bildung und Ablenkung. Es werden Welten generiert, die wir uns noch gar nicht ausmalen kรถnnen.

๐ŸŽฅ Die Krux mit den AI-Imperfektionen

Klar, die aktuellen Videos haben kleine Mรคngel und sind noch nicht perfekt. Sora kann Schwierigkeiten haben, die Physik komplexer Szenen zu simulieren oder bestimmte Ursache-Wirkungs-Zusammenhรคnge zu verstehen.

Zum Beispiel kรถnnte ein Charakter in einen Keks beiรŸen, aber danach fehlt mรถglicherweise die Bissmarkeโ€‹. Oder Tiere und Menschen replizieren sich spontan, wie in diesem Rudel Wolfswelpen โ€ฆ

Sam Altman hat die Community dazu eingeladen, Prompt-Vorschlรคge zu machen, um die Fรคhigkeiten von Sora zu demonstrieren. Zum Beispiel:

Schauen wir uns das Affen-Video etwas genauer an. Es strahlt eine Autoritรคt und Realitรคt aus, obwohl diese Szene nie stattgefunden hat.

Der Knackpunkt ist hier nicht der Affe, sondern das Schachspiel selbst: dort stehen drei Kรถnige auf/neben einem 7x7 Brett, anstelle des universellen 8x8 Musters.

Bestimmt hat aber keiner der Trainingsdatensรคtze jemals ein solches Brett oder eine solche Position enthalten!

Was offenbart uns dieser Fehler? An unzureichender Rechenleistung und einem Mangel an Daten kann es nicht liegen. Stattdessen versucht das System, die Welt anzunรคhern - aber versteht sie noch nicht perfekt.

๐ŸฅŠ Text-zu-Video - Sora hรคngt die Konkurrenz locker ab

Aber im direkten Vergleich zu den anderen Text-zu-Video-Anbietern gibt es keine Zweifel, dass OpenAI trotz dieser Imperfektionen hier etwas ganz GroรŸes gelungen ist!

Das sind die wichtigsten Mitbewerber in der Text-zu-Video-Arena:

  • RunwayML hat mit seinem Gen-2-Update und dem โ€œMotion Brushโ€-Feature die Aufmerksamkeit auf sich gezogen. โ€œGame onโ€, war dann auch der Kommentar von Co-Founder Cristรณbal Valenzuela.

  • Stability AI, bekannt fรผr seine Arbeit in der Bildgenerierung, hat vor Kurzem ein Videomodell namens Stable Video Diffusion vorgestellt, das derzeit fรผr Forschungszwecke verfรผgbar ist.

  • Pika Labs hat sein Tool Pika 1.0 fรผr alle Nutzer verfรผgbar gemacht.

  • Meta hat ein Tool namens Make-A-Video eingefรผhrt und das Emu Video Modell angekรผndigt, das in soziale Netzwerke integriert werden soll.

  • Google hat vor wenigen Tagen das multimodale Gemini 1.5 vorgestellt und arbeitet an Lumiere-Modellen, deren Verรถffentlichungsdatum noch ungewiss ist.

Die wichtigsten Player, deren Text-zu-Video-Generatoren du bereits nutzen kannst

  • xAI von Elon Musk hat bisher keinen Text-zu-Video-Generator angekรผndigt, aber Bestrebungen in diese Richtung wรผrden uns nicht รผberraschen.

  • Amazon hat den Lex-Chatbot und Titan-Bildgenerator vorgestellt, jedoch noch keine Informationen รผber Videogeneratoren verรถffentlicht.

  • Last, but not least: Midjourney! Anfangs Jahr hat der Platzhirsch unter den Bildgeneratoren angekรผndigt, dass man mit dem Training eines Text-zu-Video-Modells starte. Wir sind gespannt, sehr sogar.

Interessant ist auch, dass die Sora-Prompts bei Midjourney รคhnliche Resultate bringen. Wir sind ja gespannt, was aus dieser Kรผche kommen wird, die Messlatte ist nun definitiv hoch angesetzt!

๐Ÿชฉ Sora ist ein Welten-Simulator und versteht den 3D-Raum

Ok, es gibt einen wichtigen Punkt bei Sora, der uns aufhorchen lรคsst und die Synapsen zum Feuern gebracht hat: OpenAI sagt nรคmlich, dass das Modell die 3D-Welt simulieren kann!

Unter der Haube wird eine Transformer-Architektur genutzt, wie sie auch bei den GPT-Sprachmodellen zum Einsatz kommt, und mit den Mรถglichkeiten der Bildgeneratoren kombiniert.

Sprich: Sora manipuliert nicht nur Pixel (wie das die Diffusion-Modelle tun, um Bilder zu generieren), sondern entwickelt eine Konzeptualisierung von dreidimensionalen Szenen, die sich รผber die Zeit entfalten!

Unser Gehirn macht wahrscheinlich etwas ร„hnliches; wenn wir uns Szenen und Orte ausmalen, stellen wir uns nicht nur vor, wie sie aussehen, sondern was sie sind.

Und das bedeutet wiederum, dass Sora nicht nur ein System zur Erzeugung von Videos ist.

Es ist ein Schritt hin zur Entwicklung von universellen Simulatoren der physischen Welt. Diese bieten eine realistische Darstellung dessen, wie Objekte in der realen Welt interagieren, und was fรผr Emotionen die Charaktere zeigenโ€‹โ€‹ kรถnnten.

๐Ÿค– Sora + Roboter = die perfekte Kombo?

Lass uns nicht um den heiรŸen Brei herum reden: Sora ist auf dem besten Weg, den Menschen in Sachen Weltverstรคndnis alt aussehen zu lassen.

Und was passiert, wenn diese Superintelligenz auf Beine (oder Rรคder) trifft? Genau, Sora-Androiden werden nicht lange auf sich warten lassen und unsere Welt erkunden und uns zur Hand gehen, als wรคren sie schon immer Teil davon gewesen.

Im Krankenhaus, in der Fabrik, zu Hause, bei Rettungseinsรคtzen oder im Klassenzimmer - halt รผberall da, woโ€™s brenzlig wird oder Unterstรผtzung gebraucht wird.

Letztendlich wird die Kombination von AI und Robotik zu massiven Innovationen fรผhren, die unser Leben auf unvorstellbare Weise bereichern.

OpenAI sieht Sora auch als ein Basismodell auf dem Weg zu AGI, der allgemeinen kรผnstlichen Intelligenz, die uns praktisch in allen Belangen รผberlegen sein wird โ€ฆ

Ok, die Sora-Robo-Kombo ist definitiv ein freaky Trip in Richtung Zukunft, der uns alle ein bisschen mehr Sci-Fi im Hier und Jetzt erahnen lรคsst.

Es ist eine aufregende, aber auch herausfordernde Zukunft, die eine enge Zusammenarbeit zwischen Technologen, Ethikern, Politikern und der breiten ร–ffentlichkeit erfordert, um sicherzustellen, dass die Technologie der Menschheit dient und nicht schadet.

  • Wie stellen wir sicher, dass diese Androiden sicher und verantwortungsbewusst handeln?

  • Wie bewahren wir die menschliche Autonomie und Kontrolle in einer Welt, in der Maschinen zunehmend menschenรคhnliche Fรคhigkeiten erlangen?

Fragen รผber Fragen โ€ฆ auf die wir auch keine Antwort haben.

โš ๏ธ Das enorme Risiko, das von Sora & Co. ausgeht โ€ฆ

OpenAI ist sich bewusst, dass mit groรŸer Macht auch groรŸe Verantwortung kommt, insbesondere im Hinblick auf Risiken wie die Verbreitung von Fehlinformationen und Erstellung von Deepfakes.

Der WEF Global Risks Report 2024 listet die grรถรŸten Risiken, unter anderem:

  • die negativen Folgen kรผnstlicher Intelligenz

  • gesellschaftliche und politische Polarisierung

  • Cyberkriminalitรคt

Und das sind alles Risiken, die mithilfe der OpenAI Modelle eine ganz neue Dimension annehmen โ€ฆ

Der technologische Fortschritt erhรถht das Missbrauchspotenzial akut. Die Fortschritte bei Videogeneratoren werden solche Videoinhalte glaubwรผrdiger machen und auch deren Erkennung erschweren.

Die Sorge von OpenAI ist berechtigt, und wird praktisch von jedem Unternehmen in diesem Bereich geteilt.

Deshalb wurden fรผr das Testing von Sora auch sogenannte โ€œRed Teamerโ€ engagiert - Experten in Bereichen wie Desinformation, hasserfรผllte Inhalte und Bias, die potenzielle Risiken und Schwachstellen im Modell identifizieren sollenโ€‹โ€‹.

Das ist aber nur eines der Problemfelder, mit denen sich OpenAI befassen muss.

โš– Rechtliche Probleme am Horizont

Auch rechtlich kรถnnte es herausfordernd werden, denn worauf das Modell trainiert wurde, geht aus dem technischen Paper nicht hervor โ€ฆ

NVIDIAโ€™s Jim Fan vermutet, dass das Model (unter anderem) mit hochwertigen synthetischen Trainingsdaten gefรผttert wurde, wie man sie von Game Engines her kennt.

Aber so genau weiรŸ es noch keiner โ€ฆ Diese fehlende Transparenz spiegelt einen wachsenden Trend in der AI-Branche wider. Verstรคndlich, vor dem Hintergrund zahlreicher Klagen gegen AI-Unternehmen - aber nicht hilfreich fรผr die Sache.

Die Debatte รผber die Grenzen des fairen Gebrauchs und Urheberrechte in der AI-ร„ra wird uns weiter beschรคftigen. Besonders betroffen davon sind visuelle Kรผnstler und Schauspieler.

Letztere haben aus Angst vor Ersetzbarkeit durch AI bereits gestreikt, und auch OpenAI selbst ist in einige Streitigkeiten verwickelt, zum Beispiel mit der New York Times.

OpenAI hat seine Richtlinien bereits geรคndert und betont, die Rechte von Inhaltschaffenden zu respektieren. Man will sogar mit ihnen zusammenarbeiten, damit sie von den neuen Mรถglichkeiten profitieren kรถnnen.

Doch trotz dieser Bemรผhungen bleibt die Spannung zwischen dem Bedarf an umfangreichen Trainingsdaten fรผr die Entwicklung leistungsfรคhiger AI-Modelle und dem Schutz geistigen Eigentums bestehen.

๐Ÿ›‘ Social Media Plattformen kรคmpfen gegen Windmรผhlen

In der Vergangenheit wurden Meta, Twitter/X, YouTube & Co. beschuldigt, nicht genug zu tun, um die riesigen Mengen an Falschinfos und Hassreden auf ihren Plattformen zu bekรคmpfen.

Nun kollidiert der technologische Fortschrit mit einem ohnehin herausfordernden Wahljahr, in dem die Hรคlfte der Weltbevรถlkerung wรคhlt โ€ฆ (Social) Media Unternehmen stehen mehr denn je unter Druck, Falschinfos zu unterbinden.

via Time.com

An der Mรผnchner Sicherheitskonferenz haben deshalb am letzten Freitag 20 wichtige Unternehmen eine Erklรคrung unterzeichnet, worin sie sich verpflichten, die Risiken im Zusammenhang mit kรผnstlicher Intelligenz und Wahlintegritรคt zu verringern.

Die Unterzeichner sind: OpenAI, Microsoft, Meta, Google, Adobe, Amazon, Anthropic, Arm, ElevenLabs, IBM, Inflection AI, LinkedIn, McAfee, Nota, Snap, Stability AI, TikTok, TrendMicro, Truepic und X.

๐Ÿ‘€ AInauten, watt nu โ€ฆ?

Du siehst, diese Entwicklungen zeigen deutlich, wie dynamisch und vielschichtig die Welt der kรผnstlichen Intelligenz ist - und wie sie immer weiter in verschiedenste Bereiche unseres Lebens vordringen wird.

OpenAI spielt zweifellos eine Schlรผsselrolle in diesem epischen Abenteuer und treibt Innovationen voran, die nicht nur die technologische Landschaft verรคndern, sondern auch tiefgreifende Auswirkungen auf unsere Gesellschaft und Zukunft haben werden.

Wohin die Reise fรผhrt, wissen auch wir nicht. Deshalb, im รผbertragenen Sinne: immer schรถnen einen Fuss vor den anderen setzen, und dabei den Blick auf die Landkarte und das Wetter am Horizont nicht aus den Augen verlieren. Auf gehtโ€™s!

๐Ÿค Integriere tl;dv in deinen Workflow โ€“ ein echter Gamechanger fรผr deine Meetings

Hast du genug von endlosen Meetings, die sich anfรผhlen wie ein Marathon ohne Ziel? Wir kennen das (aus der Vergangenheit, glรผcklicherweise). Aber wir haben ein Tool fรผr alle, die eben smarter, nicht hรคrter arbeiten wollen.

Die Rede ist von tl;dv.

Diese Lรถsung ist nicht einfach nur ein Meeting-Recorder. Es ist dein persรถnlicher Meeting-Assistent, der alles automatisch aufnimmt und transkribiert โ€“ und das in รผber 30 Sprachen. Von Zoom รผber Google Meet bis hin zu Microsoft Teams funktioniert alles kompromisslos gut!

Und das funktioniert so gut, dass wir uns eine Pro-Subscription gekauft haben (du kannst es aber auch kostenlos nutzen und ausgiebig testen).

Die wichtigsten Features:

  • Automatische Aufzeichnung: Funktioniert wie gesagt mit Zoom, Google Meet, Microsoft Teams in รผber 30 Sprachen. Dein Assistent hรคngt sich einfach als stiller Zuhรถrer mit ins Meeting, und stellt dir direkt danach die Aufzeichnung zur Verfรผgung. Kein Wunder, dass es bereits fast eine Million Nutzer verbuchen kann!

  • Transkription und Notizen: Es gibt viele Tools, die Meetings aufzeichnen. Wo tl;dv aber wirklich brilliert, ist beim Transkript und der Zusammenfassung! Das Transkript in Deutsch ist sehr akkurat, und die Notizen/Zusammenfassung hilfreich und ausfรผhrlich.

  • Momentaufnahmen auf den Punkt: Mit nur einem Klick oder einer Tastenkombination kannst du Schlรผsselmomente direkt markieren, wรคhrend du dich voll und ganz auf das Gesprรคch konzentrierst. Kein Multitasking mehr, kein Mittippen nรถtig!

  • Clips aus Aufnahmen erstellen: Wenn du magst, kannst du auch bestimmte Meeting-Momente im Handumdrehen mit Kollegen oder Kunden teilen (oder sogar auf Social Media verwenden). Schnell, effizient und ohne Kopfschmerzen!

  • No-Code ready: Zapier oder Make sind keine Fremdwรถrter fรผr dich, sondern Arbeitskollegen? Dann kannst du das perfekt mit tl;dv verbinden, und Inhalte direkt nach Notion, ein Slack, Salesforce oder das Tool deiner Wahl รผbergeben โ€“ oder vice-versa! (Wir lassen zum Beispiel neue AI-Vault-Videos darรผber transkribieren und eine Themenliste erstellen).

  • Keyword Suche: Mit der fortschrittlichen Suchfunktion kannst du Themen durchsuchen und Zusammenfassungen aller Diskussionen erhalten, die fรผr dich relevant sind.

  • Deutsche Firma: Ja, dahinter steckt tatsรคchlich eine deutsche Firma aus Aachen! โ€ฆ und wir interpretieren das mal so, dass damit auch den Auflagen der DSGVO Rechnung getragen wird und das Tool somit auch im Unternehmen rechtssicher genutzt werden kann

  • Basis-Version immer kostenlos: tl;dv hรคlt sein Versprechen, immer einen kostenlosen Plan anzubieten, mit unbegrenzten Aufzeichnungen und Transkripten (die du beim nachtrรคglichen Upgrade natรผrlich vollumfรคnglich mit AI-Unterstรผtzung durchsuchen/befragen kannst). Fรผr die Profis gibt es den Pro-Plan, $25/Monat oder $240/Jahr kostet.

๐Ÿค– So verkaufst du deinen Chatbot als Abo

Chatbots sind ein sehr, sehr beliebtes Thema in der Community und auch bei uns.

Wir haben ja auch schon viel geschrieben รผber einfache Tools, wie z.ย B. Chatbase bis hin zum absoluten Profi-Tool wie FlowiseAI.

Eine Frage, die wir hรคufig bekommen: Gibt es eine einfache Mรถglichkeit, meine Chatbots oder meine kleine AI-App als Abo zu verkaufen? Ohne viel technisches Know-how?

Heute die Antwort: JA! Mit dem Tool MindStudio.

MindStudio ist ein Chatbot bzw. AI-App-Builder, der extrem mรคchtig ist. Du kannst damit sehr komplexe und coole Workflows erstellen, die direkt gehostet werden. Also keine technische Friemelei, sondern Fokus auf den Benutzer.

Das sind die wichtigsten Features von MindStudio:

  • Chatbots & Apps bauen, ohne Programmierkenntnisse

  • AI mit deinen eigenen Daten trainieren

  • Zugriff auf alle wichtigen Modelle auch Open Source wie Mistral etc.

  • Einfache Verbindung zu vielen wichtigen Apps wie Zapier, Google etc.

  • Abo Umsรคtze generieren mit Bezahlschnittstelle zu Stripe

  • Alles voll gehostet, kein technisches Setup notwendig

Das Bauen deines Bots ist extrem einfach. Es gibt viele Templates und du kannst dir einfache Flows in wenigen Minuten zusammenklicken.

Und natรผrlich kannst du auch Daten und Wissen zu deinem Bot hochladen und das Tool erstellt daraus automatisch eine Vektordatenbank.

Du kannst damit wirklich eine Vielzahl von Bots und Apps erstellen, zum Beispiel AI-Persona Bots mit Erinnerungsfunktion, Blog-Generatoren, Logo Creators und vieles mehr. Es gibt auch jede Menge vorgefertigter Templates:

Auch das Verรถffentlichen deines Bots kรถnnte nicht einfacher sein, รผber einen simplen Landing-Page-Designer. Keine Bange, es ist null Server Setup notwendig!

Wir haben dazu wie immer im AI-Vault ein Video gemacht und einen AInauten Bot erstellt.

Mehr Details findest du hier, viel SpaรŸ beim Chatbot bauen!

Bis am Montag, mit einer frischen Runde News, Hacks und Insights fรผr dich!

Deine AInauten

Du willst mehr? So kรถnnen wir dir helfen:

  1. Das AI-Bootcamp: Der wohl schnellste & einfachste Einstieg in die Welt der AI. Im Bootcamp lernst du in รผber 50+ Videos, wie du AI fรผr dich wirklich anwenden kannst. In weniger als 2 Wochen wirst du so zum AI-Experten. Von Prompts, zu Bildern und Videos, bis zu AI im Office ist alles mit dabei.

  2. Der AI-Vault: Jede Woche neue AI Praxis-Videos, Tutorials, Tool-Tests, Promptvorlagen, Experimente uvm. Fรผr alle AI-Enthusiasten, die die Basics bereits drauf haben und noch tiefer in die Praxis einsteigen wollen. Oder einfach gemeinsam entdecken wollen.

Weiterlesen