- AInauten
- Posts
- 𝕏 So erstellst du Bücher, Bilder & Videos im Turbo-Modus
𝕏 So erstellst du Bücher, Bilder & Videos im Turbo-Modus
PLUS: Die wichtigsten AI-News
Moinmoin AInauten,
wenn du denkst, die AI-Szene macht auch mal Urlaub … dann war das bestimmt nicht die letzten Tage! Richtig spannende Updates, über die wir gerne berichten - viel Spaß beim Ausprobieren!
Let’s dive in, das haben wir heute für dich im Gepäck:
📚 Praxis: So erstellst du ein Buch in einer Minute …
👀 𝕏 mit Grok-2: Unzensierte Bilder und loses Mundwerk
🎭 So generierst du ultra-realistische Bilder (und Videos)!
📰 AI-News-Quickie: Die HAI-lights aus der Branche
📚 Praxis: So erstellst du ein Buch in einer Minute …
Wir haben selbst schon viele Bücher von realen Autoren auf Amazon veröffentlicht. Und natürlich haben wir seit dem Aufkommen von AI auch rumexperimentiert, was damit möglich ist (und was nicht).
Zuerst haben wir uns an Google Sheets-basierten Tools, ChatGPT-Endloskonversationen und spezialisierten GPTs den Kopf zerbrochen, und dann versucht, das massive Kontextfenster von Gemini zu einem langen Output zu bewegen. Aber wirklich nutzbar war das nie ...
via Giphy
Sudowrite auf der anderen Seite war zwar sehr gut, aber halt auch mit einigem manuellem Aufwand verbunden. Doch nun sind wir auf eine neue Möglichkeit gestoßen, die wir dir heute vorstellen wollen.
Infinite Bookshelf - in Sekunden komplett neue Bücher
Entwickelt auf Basis der Llama3-Modelle von Meta und der leistungsstarken Groq-Hardware kannst du mit dieser App direkt im Browser mit einem einzigen Prompt dein Buch erstellen - und das schneller, als du “Simsalabim, schreib mein Buch!” sagen kannst.
Erstelle einen Account bei Groq (nicht mit Grok zu verwechseln, siehe unten!) und hole dir einen kostenlosen API-Key.
Öffne die App hier und fülle die Felder aus - die Advanced Version hat noch mehr Parameter (Github vom Macher Benjamin Klieger 🙏).
Gib einfach ein Thema vor, klicke unten auf “Generate“ - und die App generiert komplette Kapitel, die logisch aufeinander aufbauen.
Besonders für Sachthemen ist die App interessant, und Fiction-Inhalte sollen künftig auch besser unterstützt werden.
Nach der Generierung kannst du das Ergebnis als Textdatei oder gestyltes PDF exportieren.
Bald wird es auch möglich sein, Bücher direkt auf Google Drive zu speichern und Notizen als Grundlage für neue Projekte zu verwenden.
Und das war erst der Anfang, denn neue Ansätze stehen bereits ins Haus!
P.S.: Das Resultat ist auf keinen Fall publikationsreif - aber um eine umfassende Übersicht zu einem beliebigen Thema zu erhalten, finden wir das grandios.
👀 𝕏 mit Grok-2: Unzensierte Bilder und loses Mundwerk
Man kann von Elon halten, was man will (unser Index war in letzter Zeit eher im Sinkflug) … aber der reichste Mann der Welt gibt nicht nur mit Tesla, SpaceX und Neuralink den Takt vor, sondern hat nun mit xAI seiner X-Plattform mit Grok-2 eine richtig solide AI spendiert.
Der neueste Chatbot hat eine freche Persönlichkeit (we like it!) und kann mehr als nur chatten: er erzeugt auch kontroverse Bilder von Persönlichkeiten, Brands, etc. - und das praktisch ohne Filter …
Risiken und Nebenwirkungen: Bilder ohne Filter und Zensur
Bilder sind deshalb auch die am heißesten diskutierte neue Funktion von Grok-2. Fast jedes Prompt wird akzeptiert, auch kontroverse.
Dabei kommt unter der Haube gar nicht ein Grok-eigenes-Modell zum Zug, sondern das neue FLUX.1-Modell von Black Forest Labs, das für seine fotorealistischen Ergebnisse bekannt ist (unser Beitrag hier). Elon hat auch verkündet, dass man bereits an einer eigenen Bild-AI arbeite.
Das ist ein zweischneidiges Schwert: einerseits kannst du deine Kreativität entfesseln und in Sekundenschnelle maßgeschneiderte, (un)realistische Bilder erstellen. Auf der anderen Seite führen solche Bilder zu ... Chaos, Falschmeldungen, Propaganda, Verleumdung ,...
Flashback: Erinnerst du dich an das Bild der Pentagon Explosion, die einen kurzzeitigen Dip am Aktienmarkt verursacht hat? Das wird wieder passieren, da hilft auch keine halbherzige Policy …
Und wie gut ist das Grok-2 Sprachmodell?
Der Vorläufer Grok-1 war ein vollmundiges Versprechen, das in der Praxis im Vergleich mit anderen enttäuschte. Darüber konnte auch das Open Sourcing des Modells nicht hinwegtäuschen.
Aber Grok-2 macht Laune - und da der Bot auch Zugang zu aktuellen Informationen über X hat, könnte das vielseitig genutzt werden.
Das neueste Grok-2-Modell hat vor Kurzem unter dem Namen “sus-column-r” die Chatbot-Gladiatoren-Arena LMSYS betreten. Dort hat es sich gaaaanz weit vorne aufs Podest gestellt, auf Augenhöhe mit OpenAI und Anthropic. Viele dachten sogar, es handle sich dabei um ein neues ChatGPT Modell.
Neben dem großen Bruder gibt es auch noch Grok-2 mini. Diese Version wurde als erstes auf X released. Beide Modelle sollen in den kommenden Wochen via API für Unternehmen verfügbar sein, und Grok-3 soll sogar noch dieses Jahr released werden.
Einige Daten von europäischen Nutzern sind vom Training ausgeschlossen - wer auf Nummer sicher gehen will, kann das auch aktiv ausschalten.
Spannend in dem Kontext: das Feld der Sprachmodelle verändert sich rasend schnell, und die besten Modelle auf LMSYS haben eine immer kürzere Halbwertszeit.
Unser Take: Vielversprechend, mit Konfliktpotenzial
Dieses Mal hat Elon mit Grok-2 mehr als nur heiße Luft produziert. Wir haben uns einen Premium-Account geholt und spielen fleißig damit rum.
Spannend: Grok-2 ist nicht nur mega-smart, sondern auch up-to-date dank Echtzeit-Infos von X. Klar, die üblichen Verdächtigen wie OpenAI und Anthropic schlafen auch nicht. Aber mit dem Tempo, das xAI vorlegt, könnte es spannend werden. Das Ding hat echt Potential.
Ob die relativ unzensierten Bilder die Regulierungsbehörden auf den Plan rufen? Bestimmt. Aber wenn AI-generierte Inhalte die öffentliche Meinung und Demokratie beeinflussen, ist eine breitere Diskussion darüber auf jeden Fall zu begrüßen.
Alright, wenn du Grok-2 selbst mal auf den Zahn fühlen willst, dann ab auf X und für $8/Monat einen Premium-Account holen!
🎭 So generierst du ultra-realistische Bilder (und Videos)!
Bleiben wir bei visuellen Inhalten, denn da gab es auch bei einigen anderen Anbietern signifikante Neuerungen.
🖼️ Midjourney V6.1: Neuer Web-Editor für mehr Kontrolle
Das neueste Midjourney Update 6.1 bringt ein neues Tool, das viele Designer lieben werden: den Web-Editor!
We're releasing a new web editor today. This combines many previously separate image actions into a single unified interface. More coming soon.
— Midjourney (@midjourney)
12:49 AM • Aug 16, 2024
Er vereinfacht die Bearbeitung von Bildern direkt im Browser und integriert Funktionen wie "Reframe", "Repaint" und "Vary Region". Der neue virtuelle Pinsel gibt dir mehr Kontrolle, um jedes Detail deines Bildes perfekt hinzubekommen.
Midjourney verabschiedet sich auch langsam von seiner “Discord-Only”-Phase und öffnet sich immer mehr für die Web-Nutzung. Damit wird das kreative Arbeiten viel einfacher und intuitiver. Doch während wir den neuen Editor feiern, geht der Rechtsstreit mit Künstlern wegen angeblicher Urheberrechtsverletzungen in die nächste Runde ...
📸 Google Imagen 3: Not bad, pretty good!
Google hat die Version 3 von Imagen veröffentlicht, mit dem man auch detailreiche und fotorealistische Bilder mit präzisen Texturen und Beleuchtung generieren kann.
Google hat Imagen3 in der AI Test Kitchen veröffentlicht … und das Internet testet fleißig und vergleicht. Leider erstmal nur in den USA (oder mit VPN).
So, damit hätten wir das Thema “Bilder” mal erschlagen (… Mystic kommt dann wohl die Tage). Diese Bilder sind das perfekte Ausgangsmaterial für Videos. Und da hat einer von sich reden gemacht:
🎥 Gen-3 Alpha Turbo: 7x schneller, dafür zum halben Preis
Runways Gen-3 Alpha Turbo hat hier wieder mal die Mitbewerber an die Wand gespielt.
Nicht nur an Geschwindigkeit und Kosten wurde geschraubt, sondern auch an der Qualität. Die Videos sind realistischer, die Bewegungen flüssiger, und die Farben lebendiger.
Mit dem monatlichen Abo für $15 Dollar kannst du über 2 Minuten Video generieren - das sind immerhin 25 Fünf-Sekunden-Clips (und bei Bedarf kannst du Credits dazukaufen).
Das ist perfekt, um Flux-Bilder zu animieren (zumindest bis das neue Flux-Video-Modell ready ist).
📰 AI-News-Quickie: Die HAI-lights aus der Branche
Kurz und knackig zum Abschluss noch ein paar wichtige Infos:
Du nutzt auch Claude, oder? Dann installiere die doch gleich mal die App auf dem Desktop, das macht den Zugang einfacher.
Mit dem Claude for Sheets™ Prompt Engineering Template kannst du direkt in Tabellen Antworten generieren.
Und wenn du mit Claude entwickelst: das neue Prompt-Caching spart bis zu 90% Kosten und beschleunigt Prompts um 85%. Sprich: lade ganze Bücher oder Code-Repositories hoch, Cookbook hier.
Dieser neue AI-Scientist ist in der Lage ist, eigenständig Forschungsideen zu generieren, Experimente durchzuführen und Papers zu Kosten von weniger als 15 Dollar zu schreiben! Heftig, damit kommen wir der automatisierten Forschung näher - Video hier.
Das Github-Open-Source-Projekt "Deep-Live-Cam" tauscht Gesichter in Echtzeit in einem Video Live-Stream - basierend auf nur einem Input-Bild - Tests hier. Crazy, scary, brave new world.
Du kannst jetzt Hermes 3 kostenlos testen unter Lambda Chat oder via API - das erste feinabgestimmte Llama 3.1 405B Modell mit verbessertem Reasoning und kreativen Fähigkeiten. Richtig gut!
Dank AI könnte bald dein Selfie das Marfan-Syndrom diagnostizieren - mit 98,5% Genauigkeit und ohne Arztbesuch. Ob das auch für andere seltene Erkrankungen funktionieren wird?
Das neue SWE-bench Verified-Tool von OpenAI misst, wie gut AI reale (Software)probleme löst – mit menschlich validierten Tests, die faire und präzise Ergebnisse versprechen.
Coole neue Hivemind-App von Grimoire-Creator Nick Dobos fürs iPhone/iPad/Mac. Erstelle Apps, und publiziere sie mit einem Klick!
Geschafft! Aber kein Grund zum traurig sein. Die AInauten sind schon bald wieder zurück, mit neuem Futter für dich.
Reto & Fabian von den AInauten
P.S.: Folge uns auf den sozialen Medien - das motiviert uns, Gas zu geben 😁! Twitter, LinkedIn, Facebook, Insta, YouTube, TikTok
Wann immer du bereit bist, so können wir dir helfen:
1. AINAUTEN CRASHKURS: Der wohl schnellste und einfachste Einstieg in die Welt der AI. Im Crashkurs lernst du in über 50+ Videos, wie du AI für dich wirklich anwenden kannst. In weniger als zwei Wochen wirst du so zum AI-Experten. Von Prompts, zu Bildern und Videos, bis zu AI im Office ist alles mit dabei. Klicke hier!
2. AINAUTEN PREMIUM: Die Themen aus dem Newsletter tiefer aufgearbeitet. Jede Woche neue AI Praxis-Videos, Tutorials, Tool-Tests, Prompt-Vorlagen, Experimente u. v. m. Wöchentliche Podcasts und News-Zusammenfassungen. Und stelle uns direkt deine Fragen und nutze den direkten Zugang zu uns. Klicke hier!
⭐️ Wie hat dir diese Ausgabe gefallen? |
Login oder Abonnieren um an umfragen teilzunehmen. |
Reply