• AInauten
  • Posts
  • 👯‍♀️ So replizieren wir jedes Bild mit AI

👯‍♀️ So replizieren wir jedes Bild mit AI

PLUS: Google Gemini Test, Billion Dollar Man & Newsflash

AI-HOI und guten Morgen, AInauten!

Auch heute hast du wieder ein Rendezvous mit uns. Also, schnapp dir deinen Kaffee ☕️ … und dann springen wir gleich rein in die wichtigsten News, Praxis-Tipps, Tests und mehr - los geht’s!

Das haben wir heute für dich im Gepäck:

  • 📰 AI-News-Quickie: Die HAI-lights

  • 📸 Praxis-Tipp: Zwei Wege, wie du Bilder in wenigen Minuten replizierst

  • 🧑‍💻 Google's Gemini: Das Bard-Upgrade, auf das wir schon ewig warten

  • 🤴 Der “Billion-Dollar-Man” mit Chip-Vision - Genie oder Größenwahn?

  • 🤭 AI-Fun: World-Domination Meeting bei OpenAI

📰 AI-News-Quickie: Die HAI-lights

Zum warm werden eine Handvoll News-Häppchen:

So, das war die Vorspeise - jetzt geht es ans Eingemachte!

📸 Praxis-Tipp: Zwei Wege, wie du Bilder mit AI in wenigen Minuten replizieren kannst

Bilder mit AI erstellen kann ja inzwischen jeder.

Aber weißt du auch, wie du ein bestehendes Bild „nachbaust“, sodass es dem Original ähnlich sieht, aber nicht einfach eine billige Kopie ist?

Diesen Prozess wollen wir dir heute verraten. Wir haben zwei Wege getestet und ausführlich für unsere AI-Vault-Mitglieder Schritt für Schritt vorgestellt.

1) Nutze den „Image Edit, Recreate & Merge”-GPT (ChatGPT Plus)

ChatGPT Plus ist sicherlich der einfachste und schnellste Weg. Suche im GPT-Store nach „Image Edit …“ oder nutze diesen Link. (Voraussetzung: ChatGPT Plus Subscription für $20/Monat).

ChatGPT - Wie funktioniert es?

  • Du lädst ein Bild hoch, und der Rest läuft automatisch ab.

  • Im Hintergrund rattert ein ausgefeiltes Prompt, welches das Bild zuerst analysiert und mit GPT-4 Vision detailliert beschreibt (wir haben das Prompt, das unter der Haube läuft, im AI-Vault zur Illustration verlinkt).

  • Im nächsten Schritt wird die generierte Beschreibung automatisch dafür genutzt, um damit ein ähnliches Bild mit DALL-E zu generieren.

  • Et voilà, schon hast du dein neu kreiertes Bild!

Bonus-Tipp: Du kannst dem GPT sagen, dir die Beschreibung des Bilds zu geben, um es in anderen Tools nutzen zu können. Und das bringt uns auch gleich zum zweiten Ansatz.

2) Repliziere ein Bild in Midjourney

Auch unser Lieblings-Bild-Generator Midjourney hat eine coole Funktion, mit der du Bilder replizieren kannst - und die Resultate sind dabei überraschend gut! (Voraussetzung: Midjourney Subscription ab $10/Monat).

Midjourney: Wie funktioniert es?

  • Bild in Midjourney mit der /describe Funktion beschreiben lassen

  • Link zum hochgeladenen Bild kopieren

  • Eine der generierten Beschreibungen anklicken

  • Dort im Prompt den Link zum Originalbild einfügen

  • Und die Beschreibung erweitern

  • Sowie Parameter --iw 2 hinzufügen, um die Wichtigkeit des Originalbildes zu unterstreichen

  • Prompt abschicken und überraschen lassen!

Bonus-Tipp: Nutze die von ChatGPT erstellte Beschreibung als Ergänzung im Prompt, um noch bessere Resultate zu erhalten!

Fazit: Ziemlich gut, noch nicht perfekt

Wir haben verschiedene Bilder mit den oben genannten Möglichkeiten kopiert. Je komplexer das Bild, desto weniger genau das Resultat. Midjourney hat die Nase vorne und bietet aktuell die genaueren Outputs im Vergleich mit ChatGPT.

In unseren Marketing-Agenturen können wir damit zum Beispiel Bilder von Werbekampagnen auffrischen, oder auch mal eine Inspiration von anderen mitnehmen, um unsere Kreativität und Effektivität zu steigern.

Wir finden, dass AI-gestützte Bildreplikation ein echt hilfreiches Werkzeug ist, sowohl für kreative als auch für praktische Zwecke.

🧑‍💻 Google's Gemini: Das Bard-Upgrade, auf das wir schon ewig gewartet haben

Vor wenigen Tagen hat Google Bard mit einem mega Update von sich reden gemacht, und die Verfügbarkeit des Chatbots weltweit und mehrsprachig massiv ausgebaut. Neu kam auch die Möglichkeit dazu, Bilder zu erstellen.

Und da Google sich auf eine Zukunft vorbereitet, in der die Suche nicht mehr das A und O ist, wurde nun noch einmal kräftig mit dem neuen multimodalen Chatbot Gemini nachgedoppelt.

Was die Neuerungen genau sind, schauen wir uns gleich im Detail an.

Das Wichtigste im Überblick

  • 🪦 RIP Bard - Googles Chatbot heißt neu Gemini, und ist in zwei Ausführungen verfügbar: Gemini (kostenlos) und Gemini Advanced (kostenpflichtig)

  • Übrigens, Gemini ist auch der Name der darunterliegenden Sprachmodells und kommt in den drei Ausführungen Ultra, Pro und Nano.

  • Der Chatbot Gemini Advanced nutzt das Ultra 1.0 Modell, die kostenlose Gemini Version nutzt das Pro 1.0 Modell.

  • Von der Performance her ist Gemini Pro 1.0 in etwa mit GPT-3.5 vergleichbar, Gemini Ultra mit GPT-4.

  • Nutzer erhalten außerdem Zugriff auf Gemini in GMail, Docs etc., sowie 2 TB Speicherplatz und weitere Vorteile von Google One.

  • Wenn du bereits Google One Nutzer bist mit einem 5 TB+ Plan, dann kannst du Gemini Advanced bis Ende Juli 2024 kostenlos nutzen.

  • Aber Achtung: Gemini Advanced ist aktuell nur in Englisch nutzbar - wenn du eine deutsche Abfrage machst, kommt selbst nach dem Upgrade auf die kostenpflichtige Version das LaMDa-Modell zum Zug!

  • Es gibt auch eine Mobile App für Android und iPhone, aber leider ist diese noch nicht verfügbar im DACH-Raum. Google wartet wohl noch darauf, dass der neue EU AI Act in Stein gemeißelt wird

  • Gut zu wissen: Deine Daten werden standardmäßig mehrere Jahre gespeichert, mindestens aber 72 Stunden. Du kannst bei der Anmeldung ein Opt-out aus dem Training mit deinen Daten machen.

  • Weitere Details zu Gemini findest du im FAQ.

Erste Erfahrungen mit Google Gemini in der Praxis

Wir haben natürlich nicht die Finger davon lassen können, und gleich mal fleißig getestet (Gemini Advanced).

Fazit: Nice try! Die Ergebnisse sind solide. Kommt unseres Erachtens zwar noch nicht an ChatGPT Plus/GPT-4 heran, aber spielt zumindest schon mal in der gleichen Liga.

The Good

  • Gemini ist sehr schnell und multimodal (Text, Code, Bild, Spracheingabe).

  • Es werden mehrere Entwurfsversionen einer Antwort erstellt.

  • Die Double-Check-Funktion für Faktenüberprüfung und Anti-Halluzination mit Quellenangabe ist sehr praktisch.

  • Man kann Länge und Stil der Antwort einfach anpassen: kürzer, länger, einfacher, lockerer oder professioneller.

  • Chats lassen sich wie bei ChatGPT über öffentliche Links teilen.

The Bad

  • Gemini vergisst manchmal, dass es Bilder machen kann … wenn es klappt, dann erhältst du ein bis vier Vorschläge aufs mal (Microsoft Copilot bietet auch vier Bilder, ChatGPT liefert jeweils nur ein Bild).

  • Die bestehenden Extensions sind noch überschaubar und nur auf Google beschränkt (Maps, Flights, Hotels, YouTube und Workspace).

  • Es gibt viele Disclaimer/Verweigerungen bei unkritischen Anfragen, sowohl bei Text als auch Bild.

The Ugly

  • Knackpunkt: man kann keine Dateien hochladen, außer Bilder.

  • Es gibt auch keine Sandbox, wo man Scripts laufen lassen kann.

  • Und: Ein Äquivalent zu unseren geliebten GPTs? Fehlanzeige!

Wie immer gilt: Selbst testen und Erfahrungen sammeln.

Klingt spannend? So kannst du es direkt ausprobieren!

Teste die kostenlose Version unter https://gemini.google.com, oder mache ein Upgrade unter https://gemini.google.com/advanced und erhalte es für zwei Monate lang kostenlos. (Und wie gesagt, am besten in Englisch kommunizieren, wenn du in den Genuss des besten Modells kommen willst).

Pro-Tipp: Hier findest du einen praktischen Prompt-Guide.

🤴 Der “Billion-Dollar-Man” mit Chip-Vision - Genie oder Größenwahn?

Sam Altman, der dank OpenAI und ChatGPT in den Annalen der Technologiegeschichte Menschheit bereits fest verankert ist, sorgt erneut für Furore. Dieses Mal will er die Welt der Halbleiter auf den Kopf zu stellen und den Grundstein für eine neue Ära der Mikrochip-Produktion legen.

“Ich brauche 7 Billionen - ja, das ist mehr, als Microsoft und Apple zusammen wert sind!”

Mit einem Finanzierungsbedarf von bis zu 7 Billionen US-Dollar möchte er ein Netzwerk aus Chipfabriken aus dem Boden stampfen, das die wachsenden Anforderungen der AI-Technologie bedienen kann.

Um das in Kontext zu stellen: Die gesamte Chipindustrie soll bis 2030 auf 1 Billion Dollar anwachsen. Wir reden hier also von Zahlen, die so enorm sind, dass sie selbst die Staatsschulden mancher Länder in den Schatten stellen.

Sogar die zwei wertvollsten Unternehmen weltweit, Microsoft und Apple, kommen zusammen “nur” auf 6 Billionen US-Dollar.

Sam? Der denkt in ganz anderen Dimensionen… Er hat bereits vor zwei Jahren in das Startup Rain Neuromorphics investiert und auch schon länger die Idee verfolgt, dass OpenAI seine eigenen Chips entwickeln könnte.

Damit soll eine Unabhängigkeit von Mikrochip-Engpässen gewährleistet werden, die bereits jetzt für viele ein großes Problem sind. Um diese ambitionierte Vision Wirklichkeit werden zu lassen, führt Altman Gespräche mit Regierungsvertretern und Führungskräften aus der ganzen Welt.

Die geopolitische Zwickmühle

Aber lass dich davon nicht täuschen: die Schattenseiten der Globalisierung sind in den letzten Jahren deutlich geworden.

Deshalb sieht es ganz danach aus, als ob die USA zu einer Hochburg der Halbleiterproduktion werden könnte.

Gespräche mit hochrangigen US-Beamten unterstreichen die Bedeutung einer starken inländischen Chip-Produktion für die amerikanische Wirtschaft und Siche​​rheit.

Seifenblase oder Geniestreich?

Angesichts der aktuellen Herausforderungen und Engpässe in der Halbleiterindustrie könnte Altman jedoch genau zur richtigen Zeit am richtigen Ort sein, um eine entscheidende Wende herbeizu​​führen.

Oder vielleicht will er auch nur die Gunst der Stunde nutzen, wie ihm seine Kritiker vorwerfen. Die These lautet, dass GPT-5 enttäuschend sein wird, und dass er deshalb jetzt das Kapital einsammeln muss.

Doch bei einem Finanzierungsbedarf, der das gesamte Volumen des globalen Chipmarktes um ein Vielfaches übersteigt, fragen sich viele: Ist das eine utopische Seifenblase oder möglichweise ein Leitstern wie das Apollo-Projekt, das uns die Mondlandung gebracht hat?

“Shoot for the stars, and you’ll reach the moon!”

In einer Welt, die sich immer schneller dreht und in der die Technologie in atemberaubendem Tempo voranschreitet, könnte Altmans Vision entweder als genialer Schachzug oder als überambitioniertes Projekt in die Geschichte eingehen. Wir werden sehen …

P.S.: Der Mann hat es mit den großen Zahlen. Er ließ verlauten, dass jeden Tag 100 Milliarden Worte von OpenAI erstellt werden - was aktuell 0.1 % der 100 Billionen Worte entspricht, die die Menschheit weltweit jeden Tag generiert.

🤭 AI-Fun: World-Domination Meeting bei OpenAI

Geschafft! Aber kein Grund zum traurig sein. Die AInauten sind schon bald wieder zurück, mit neuem Futter für dich.

Bis bald, deine AInauten

Folge uns auf Twitter & LinkedIn!

Du willst mehr? So können wir dir helfen:

  1. Das AI-Bootcamp: Der wohl schnellste & einfachste Einstieg in die Welt der AI. Im Bootcamp lernst du in über 50+ Videos, wie du AI für dich wirklich anwenden kannst. In weniger als 2 Wochen wirst du so zum AI-Experten. Von Prompts, zu Bildern und Videos, bis zu AI im Office ist alles mit dabei.

  2. Der AI-Vault: Jede Woche neue AI Praxis-Videos, Tutorials, Tool-Tests, Promptvorlagen, Experimente uvm. Für alle AI-Enthusiasten, die die Basics bereits drauf haben und noch tiefer in die Praxis einsteigen wollen. Oder einfach gemeinsam entdecken wollen.

Dein Feedback ist für uns essenziell. Wir lesen JEDEN Kommentar und Hinweis. Sag uns, was (nicht) gut war, und was für DICH interessant ist.

⭐️ Wie hat dir diese Ausgabe gefallen?

Login or Subscribe to participate in polls.

Reply

or to participate.