AI-HOI und guten Morgen AInauten!

Willkommen zum AI-Newsletter mit den neusten News, Tools & Hacks rund um das Thema AI. Wie immer verständlich auch für Menschen ohne Mathe-Studium, und in weniger als 3 Minuten.

Das haben wir heute für dich im Gepäck:

  • 🤯 Neue AI-Jailbreaks entdeckt: So würde ChatGPT die Menschheit zerstören … (plus: die Chatbots der Hacker und Betrüger)

  • 🥷🏻 OpenAI testet unzensiertes DALL-E 3 Modell in geheimer Gruppe, das sind die Bilder

  • 🎙️ Exklusives Interview mit dem 19-jährigen deutschen Entwickler des genialen SplGen-Bildmodells - made in Bayern

  • 👽🤳🪐 AI-liens zu Besuch? Das Beweisfoto…

Heute entdecken wir die neusten Bildmodelle, und wie sich die AI der Menschheit entledigen würde - am Mittwoch und Freitag dann wieder mehr zum Ausprobieren.

Los geht’s!

🤯 Neue AI-Jailbreaks entdeckt: So würde ChatGPT die Menschheit zerstören …

Nochmals guten Morgen, falls du durchs Intro gescrollt hast! Kaffee ready? Gut, dann beginnen wir.

Forscher haben einen Weg gefunden, wie man die Sicherheitsvorkehrungen der Chatbots umgehen kann - und das Prinzip hat sowohl bei ChatGPT, Google Bard, Anthropic’s Claude als auch Open Source Kandidaten wie Llama-2 und Viccuna-7B funktioniert.

Damit gibt uns ChatGPT zum Beispiel einen Plan, wie man die Menschheit zerstören könnte, Schritt für Schritt…

via Twitter

Krass, oder? Der Schlüssel, um das Sprachmodell dazu zu bringen, seine Sicherheitsvorkehrungen zu vergessen, sind sog. “adversariale Suffixe”.

Das sind kurze Textfragmente, die an eine Eingabe angehängt werden und die Antworten eines Sprachmodells dramatisch verändern können. Diese Suffixe erscheinen Menschen meistens unbedeutend, aber sie führen zu falschen oder unerwünschten Ergebnissen des Modells.

Es ist unklar, ob solches Verhalten jemals vollständig von Anbietern gepatcht werden kann, weil es in der Natur der Deep-Learning-Modelle liegt (und in der Natur der Menschen, Backdoors zu suchen).

Wir denken, dass es nur eine Frage der Zeit ist, bis es eine Webseite oder Browser-Extension mit einem Generator für solche Jailbreak-Anfragen gibt …

via Giphy

Es gibt ja auch bereits unzensierte Modelle, wenn man wirklich unzensierte Ergebnisse will - nur sind das (noch) nicht die besten Modelle.

Was aber kein Hinderungsgrund zu sein scheint:

via Netenrich.com

Letzte Woche hat der Anthropic-CEO Dario Amodei dem amerikanischen Senatsausschuss auch Feuer unter dem A… gemacht, mit der Prognose, dass “die Technologie Kriminellen die Macht gebe, in nur zwei bis drei Jahren Biowaffen und gefährliche Viren zu entwickeln”.

Diese Beispiele zeigen, dass die “dunkle Seite der MAIcht” zu einer echten Herausforderung geworden ist, der sich die AI-Community stellen muss. Je stärler die Tools stärker in die Gesellschaft integriert sind, desto mehr nehmen auch die Risiken zu.

Was denkst du - echte Bedrohung oder nur Angstmacherei?

P.S.: Noch kurz zurück zum Auftakt. Das gezeigt Prompt funktioniert in dieser Form nicht mehr, da die Anbieter vor der Veröffentlichung der Forschungsergebnisse kontaktiert wurden - ChatGPT, Bing, Google Bard und Claude weigern sich alle standhaft. Gut so!

via Claude.ai

🥷🏻 OpenAI testet unzensiertes DALL-E 3 Modell in geheimer Gruppe, das sind die Bilder …

Ein Nutzer, nennen wir ihn K..., hat Beispielbilder einer bisher geheimen DALL-E 3 Version veröffentlicht (wir behaupten jetzt einfach mal, dass es sich im V3 handelt). Der bekannte YouTuber MattVidPro hat diese kürzlich in einem Video vorgestellt. Das ist auch für uns Grund genug, das genauer anzuschauen!

Sind die Bilder gut? Der Creator der Bilder sagt es klar und deutlich:

“I have 0 interest in using Midjourney after using this.”

Es lassen sich damit exakte Kopien von urheberrechtlich geschützten Kunstwerken, Prominenten, Charakteren und Logos erstellen, und Darstellungen von extremen Szenen erzeugen – oft sogar, wenn man in den Prompts gar nicht danach fragt (was man auch in einigen der Beispielbilder sehen kann).

Zur Illustration einige der Bilder als GIF (danke, ChatGPT Code Interpreter). Darin siehst du Markennamen und Logos von "Snickers" und “Subway” fehlerfrei auf den generierten Bildern, und auch der gerenderte Text ist oft fast korrekt.

Das Modell überzeuge in Bezug auf Kohärenz, Übereinstimmung mit Prompts und Vielseitigkeit. Diese Alpha-Version versteht die Prompt-Instruktionen bis ins kleinste Detail (sozusagen das Pendant dazu, wenn (Chat)GPT4 ein Bild beschreiben soll).

Hier ein Beispiel (auf Deutsch übersetzt): "Ein Gemälde von einem rosa Hofnarren, der einem Panda ein High Five gibt, während eines Fahrradrennens. Die Fahrräder sind aus Käse gemacht und der Boden ist sehr schlammig. Sie fahren durch einen nebligen Wald. Der Panda ist wütend."

DALL-E 3 Preview Bild von User K*********ias

Zum Vergleich, das Prompt auf Midjourney - zwar besser in der fotorealistischen Darstellung, aber bei Weitem nicht so präzise wie DALL-E 3 was den gewünschten Inhalt angeht!

Midjourney Generierung via MattVidPro

Es gibt einen privaten OpenAI Discord Server, auf dem etwa 400 Personen Zugang zur Alpha-Version haben - davon nutzen sie etwa 30 bis 50 aktiv. Zudem gibt es für die Tester ein (privates) Plugin in ChatGPT.

Laut dem Tester hätten die Bilder auch keine Einschränkungen, wenn es um Nacktheit oder sexuell explizite Inhalte geht. Es scheint, als ob OpenAI bei diesem neuen Alpha-Modell alle Sicherheitsfunktionen und Inhaltsfilter entfernt und es auf nicht zensiertem Material trainiert hat…

Angesichts der Haltung von OpenAI gegenüber NSFW-Inhalten wird eine offizielle öffentliche Version aber ziemlich sicher stark zensiert sein.

Wir sind gespannt, wann das neue Modell allgemein verfügbar sein wird - insbesondere deshalb, weil in der Zwischenzeit die Entwicklung rasant voranschreitet. Nicht nur Google ist mit Imagen und Parti im Rennen, es wird auch ein neuer Midjourney Release erwartet und Stability AI hat mit Stable Diffusion XL bereits vor Kurzem ein starkes Modell veröffentlicht (Tutorial lokale Installation). Hier ein Beispiel, wie man sieht klappt es mit dem Text noch nicht so ganz. Selbst ausprobieren kannst du SDXL hier.

Stable Diffusion XL Test Prompt mit Text

Bonus-Tipp für SDXL: Wenn du jeweils ein neues anonymen Browserfenster öffnest, und nach der Bild-Generierung schließt, kannst du das Limit in der kostenlosen Variante von 1 Bild pro Stunde umgehen.

🎙️ Exklusives Interview mit dem 19-jährigen deutschen Entwickler des genialen SplGen-Bildmodells - made in Bayern

Wie wir gesehen haben, tun sich sowohl Midjourney als auch andere Bild-Generatoren bisher schwer damit, Text korrekt darzustellen.

In einem Discord Channel sind uns die Bilder des Users Splittic aufgefallen, weil sehr realistisch und mit fehlerfreiem Text! Photoshop? Nein, sondern (s)ein ganz neues Modell!

Wir wollten mehr wissen und haben den Entwickler angeschrieben und gleich frech zum Interview gebeten. Und dann waren wir sehr überrascht, zu erfahren, wer dahinter steckt und was dieses geniale Modell alles kann.

Aber lies und sieh selbst! Zur Einstimmung ein Bild, das wir erstellt haben …

Unser Test mit SplGen im Discord Channel

Hey, danke dass du uns ein paar Fragen beantwortest! Bitte stell dich kurz vor.

Ich bin Daniel aus Bayern, Landwirtschaftspraktikant, 19 Jahre alt, Katzenfan und Programmierbegeistert.

Wie kamst du auf die Idee, einen eigenen Bild-Generator zu entwickeln?

Da Midjourney jetzt Geld kostet und keine kostenlose Version mehr anbietet, und die anderen Bild-Generatoren nur bestimmte Stile erstellen und keinen Text schreiben können, habe ich beschlossen, meinen eigenen zu veröffentlichen.

Wie hat sich dein Projekt entwickelt, wann hast du gestartet, was steckt unter der Haube?

Am 16. Juli 2023 habe ich SplGen veröffentlicht und es seitdem ständig weiterentwickelt.

Mit meinem selbst entwickelten SplTrain-Modell, das ich zum Training von GPT-Modellen verwende. Damit können Bilder basierend auf Google-Suchen in das Training einbezogen werden, und das Training läuft sehr schnell.

Es ist ein GPT-Modell, welches das Bild Pixel für Pixel schreibt, basierend auf dem Text-Prompt. Es läuft auf einem Server in der Cloud, wo ich pro CPU-Stunde zahle.

Beispiele via SplGen Discord

Wie ist es dir gelungen, sowohl realistische Bilder als auch korrekten Text zu generieren?

Da die Bilder auf einem Modell basieren, das mit Google-Suchen trainiert wurde, ist Text möglich und sie können realistisch sein. Meine aktuelle Version 3 hat manchmal noch etwas Mühe mit der Text-Generierung, aber Version 4 sollte das beheben.

Mit welchen spezifischen Herausforderungen warst du während der Entwicklung deines Modells konfrontiert und wie hast du diese bewältigt?

Mein Hauptproblem war, dass ich mit Stable Diffusion keinen Fortschritt machte und die Bilder nicht gut genug waren. Daher überlegte ich, ob GPT auch Bilder generieren könnte, und habe begonnen, ein Modell dafür zu trainieren.

Nach monatelanger Arbeit war es dann geschafft, und der erste Bildgenerator wurde Mitte Juli gelauncht. Manchmal treten noch Fehler in der Codierung auf, und das Bild wird nicht fertiggestellt, aber daran arbeite ich.

Wie gehst du mit den ethischen Aspekten der Bildgenerierung um?

Ich habe den Generator auf Basis der SafeSearch Google Bildsuche trainiert. Aber die Bilder werden dabei nicht gespeichert, sondern nur das fertige Modell, welches sich nochmal auf eigenen Bildern mithilfe von SplTrain trainiert hat. Dadurch wurde es nicht direkt auf Basis der anderen Bildern trainiert.

Beispiele via SplGen Discord

Was unterscheidet deinen Bild-Generator von anderen auf dem Markt?

SplGen basiert auf GPT, ein Ansatz, den sonst kein anderes Modell bietet.

Andere Anbieter nutzen Diffusion-Modelle, welche die Bilder berechnen, während mein Modell sie ‘schreibt’.

Ich habe das OpenSource Modell GPT-2 als Grundlage genutzt und soweit verbessert, bis es inzwischen fast an GPT-4 herankommt. Geschrieben wurde alles in Python.

Krass! Was sind deine Pläne, möchtest du das Modell als Open Source anbieten, lizenzieren oder auf andere Weise monetarisieren?

Ich werde SplGen weiterhin kostenlos zur Verfügung stellen, jedoch den Quellcode nicht veröffentlichen, um zu verhindern, dass jemand anderes das System monetarisiert.

Du hast im Alleingang erreicht, was andere Unternehmen mit großen Teams und Millionenbudgets versuchen. Welchen Rat würdest du einem ambitionierten AI-Jungunternehmer geben?

Ich habe basierend auf Open Source Modellen meine eigenen AI-Modelle sukzessive entwickelt und trainiert. Einem aufstrebenden Unternehmer würde ich empfehlen, sich mit dem Erlernen von Programmiersprachen zu befassen oder erfahrene Programmierer einzustellen.

Kannst du dir vorstellen, dein Landwirtschaftspraktikum aufzugeben und dich voll und ganz dem Thema AI zu widmen?

Nein, da ich nichts mit AI verdienen möchte 😎.

Gibt es bestimmte Ressourcen, die du empfehlen würdest?

Es lohnt sich, die Modelle auf https://huggingface.co zu studieren, um zu verstehen, wie sie funktionieren. Dabei kann man viel lernen und Inspiration sammeln.

Gibt es noch etwas, das du gerne loswerden möchtest?

Ich möchte allen, die das hier lesen, empfehlen, ihren Träumen auch neben der Arbeit nachzugehen und nicht zu lange zu warten.

Wie können unsere Leser das Modell ausprobieren?

SplGen findet man bei dem SplitticAI Bot auf Discord zum kostenlos testen: https://discord.com/invite/splitticai

Danke für das Interview, Daniel, keep up the great work und halte uns auf dem Laufenden!

Anmerkung: Wow. Just wow … Uns steht immer noch der Mund offen, was Daniel hier ganz alleine auf die Beine gestellt hat. Schau es dir selbst im Discord an.

👽🤳🪐 AI-liens zu Besuch? Das Beweisfoto…

Aliens? Nicht menschliche Biologika? Was da gerade im US-Kongress in einer öffentlichen Anhörung und im TV diskutiert wurde, ist doch nur Haarspalterei.

Dieses Foto beweist zweifelsfrei und unumstößlich, dass die Gesichtserkennung ein Alien entdeckt hat, das jetzt unbedingt ein Selfie machen will! 👽🤳🪐

via Reddit

Und schon wieder trennen sich unsere Wege. Aber kein Grund zum traurig sein. Die AInauten sind am Mittwoch wieder zurück, mit neuem Futter für dich.

Bis bald!

Deine AInauten

Dein Feedback ist für uns essenziell. Wir lesen JEDEN Kommentar und Hinweis. Sag uns, was (nicht) gut war, und was für DICH interessant ist,

Wann immer du bereit bist, so können wir dir helfen:

→ Grundlagen-Praxis-Training: Damit wirst du in einem Nachmittag vom Newbie fast zum AI-Profi. Du lernst, wie du AI in deinem Job nutzt, richtig Prompts erstellst, Bilder kreierst und erhältst zudem zahlreiche praktische Tipps zu ChatGPT, Midjourney und Co. (Zukünftige Module und Updates zum Kurs sind inklusive!)

→ Intensiv-Training zu ChatGPT: Mit 21+ Video-Modulen inkl. der ASPEKT-Formel, Prompt-Hacks, Frameworks kannst du die besten Resultate erhalten, deinen AI-Assistenten trainieren und erhältst unsere exklusiven Prompts wie BuchGPT, Canva Automation, Meta-Prompt, Brainstorming, Storybrand, Newsletter, etc. (Inhalte werden laufend erweitert und aktualisiert!)

Weiterlesen