- AINAUTEN
- Posts
- 🕵️♂️ Das große AI-Round-Up: Insights zu OpenAI's GPT-5, Google's PaLM 2 & Gemini und mehr!
🕵️♂️ Das große AI-Round-Up: Insights zu OpenAI's GPT-5, Google's PaLM 2 & Gemini und mehr!
Entdecke die neuesten Top AI-Modelle mit unserem Blick hinter die Kulissen der größten Player
AI-HOI und guten Morgen AInauten!
Willkommen zum AI Newsletter mit den neusten News, Tools & Hacks rund um das Thema AI. Wie immer verständlich auch für Menschen ohne Mathe-Studium, und in weniger als 3 Minuten (ok, vielleicht auch 5 Minuten, wenn du nicht nur drüberscrollst 😙).
Heute ist es wieder mal an der Zeit für ein Industry-Round-Up und Themen-Special mit Updates zu den wichtigsten AI-Modellen & Playern.
🕵️♂️ Unter die Lupe genommen haben wir:
Open AI’s GPT-5
Google’s PaLM 2 & Gemini
Meta’s LLaMA
Anthropic’s Claude
Amazon’s Bedrock
NVIDIA’s Service Now
Apple
Es gibt einige spannende Updates und Ausblicke zu den wichtigsten AI-Modellen, los geht’s!
🕵️♀️ Industry-Round-Up: Spannende Updates & Einblicke hinter die Kulissen der Top-AI-Modelle
Unter der Lupe: Open AI’s GPT-5, Google’s PaLM 2 & Gemini, Meta’s LLaMA, Anthropic’s Claude, Amazon’s Bedrock, NVIDIA’s Service Now & Apple
Es ist wieder einmal an der Zeit, ein Update zu den großen Playern und Modellen in der AI-Szene zu geben. Was tut sich und was erwartet uns als Nächstes? Das schauen wir uns in diesem Beitrag an.
- - - - - - - - - - -
👀 OpenAI ist führend, fordert Leitplanken und pausiert GPT-5
Tun sie es bereits, oder nicht? Die Rede ist von OpenAI, und dem Training der nächsten Generation von GPT, nämlich GPT-5.
Jetzt ist es amtlich, und gegenteilige Gerüchte wurden widerlegt: GPT-5 wird derzeit nicht trainiert, hat CEO Sam Altman unter Eid vor dem US-Kongress bestätigt.
regulation should take effect above a capability threshold.
AGI safety is really important, and frontier models should be regulated.
regulatory capture is bad, and we shouldn't mess with models below the threshold. open source models and small startups are obviously important.
— Sam Altman (@sama)
11:33 PM • May 18, 2023
Und er habe auch keine Pläne, damit in den nächsten sechs Monaten zu starten. Vielleicht wird es ja im Dezember so weit sein? Wir lassen uns überraschen.
Eines ist für Altman klar: Die AI muss reguliert werden, und zum Wohl aller eingesetzt werden. Er ist optimistisch, dass es trotz Herausforderungen eine positive Kraft in der Welt sein kann.
Während der Anhörung war er sowohl mit der Idee einer Behörde als auch mit der Lizenzierung einverstanden und erklärte, dass es nicht nur national, sondern auch global eine Regulierung benötige.
Zum Beispiel so, wie man das mit der IAEA, der internationalen Atomenergie Behörde, auch getan hat.

via Twitter
🤖 Aiaiaiai, Google … zögerliche Fortschritte werden sichtbar
Nachdem das Gefühl aufgekommen war, dass Google irgendwie den Zug verpasst, stand vor Kurzem an der I/O-Konferenz alles unter dem Motto AI.
Dieses Video ist ein lustiger Schnappschuss, wie oft AI-Begriffe verwendet wurden …
Unter anderem wurde das neueste große Sprachmodell PaLM 2 vorgestellt, der Nachfolger von PaLM. Es positioniert sich als direkter Konkurrent zu OpenAI's GPT-4.
Die Zahlen: PaLM 2 hat unglaubliche 340 Milliarden Parameter und wurde auf 3,6 Billionen Tokens trainiert - ein echter Koloss von einem Modell!
Im Kern ist es ein Sprachmodell, das jedoch über die bloße Erzeugung von Text hinausgeht. Es kann fortgeschrittene Aufgaben wie Coding, Mathematik, Klassifizierung von Daten, Frage-Antwort-Aufgaben, Übersetzung, Mehrsprachigkeit, und natürliche Sprachgenerierung übernehmen.

Grafik via Google
Google hat bereits eine Reihe von Anwendungen für PaLM 2 vorgestellt, darunter auch der Chatbot Bard - dessen Resultate noch zu wünschen übrig lassen.
Aber PaLM 2 wird bald auch die generativen AI-Funktionen wie E-Mail-Zusammenfassungen in GMail sowie Brainstorming und Umschreiben in Google Docs unterstützen. Und es gibt eine API, mit der Entwickler eigene AI-Anwendungen erstellen können.

Google Docs mit AI-Features via Google
Es gibt zudem auch eine spezialisierte Version, nämlich das Med-PaLM 2. Diese ist primär auf medizinisches Wissen trainiert und hat beeindruckende Ergebnisse hervorgebracht,. denn: Ärzte ziehen die Antworten von Med-PaLM 2 den von Menschen erzeugten Antworten vor!
Und Google arbeitet wohl bereits an seinem nächsten Modell, Gemini. Dieses Modell wird von Grund auf neu entwickelt, um multimodal (=Bild, Text, Sound, Video) zu sein und effizient mit anderen Tools und APIs zu interagieren.
Google kann jetzt auch etwas aufatmen, denn Samsung hat seinen Entscheid revidiert, auf den Mobiltelefonen die Suchmaschine von Google zu Bing umzustellen.

Multimodael Modelle via Google
🍰 Anthropic, Amazon & NVIDIA wollen auch mitspielen und einen Teil vom Kuchen abhaben
Natürlich haben alle großen Player einen starken Fokus auf AI. Amazon hat vor Kurzem mit Bedrock eine Plattform vorgestellt, die es ihren Kunden erlaubt, einfach an bestehende Modelle anzudocken.
Das macht es für Unternehmen sehr einfach, sich auf die Möglichkeiten der AI zu konzentrieren und sich nicht mit Basisinfrastruktur auseinandersetzen zu müssen.

via Amazon Bedrock Webseite
Doch auch in den eigenen Amazon Produkten soll jetzt verstärkt AI zum Einsatz kommen - schließlich wurden in den letzten Jahren über 500 Millionen Amazon Alexa Geräte unters Volk gebracht, die genutzt werden können. Diese will man nun mit einem Chatbot im ChatGPT-Style ausstatten, natürlich mit Sprachsteuerung.
Andy Jassy, CEO von Amazon, erklärte gegenüber Analysten, dass Amazon an einem neuen großen eigenen Sprachmodell arbeite, das „viel größer, viel allgemeiner und leistungsfähiger“ sein werde als seine aktuellen Modelle.
Na gut, sagen kann man vieles - aber wir wollen Beweise sehen und sind gespannt!

Geräte mit Amazon Alexa (via Amazon)
In einem Bereich macht Amazon definitiv an Boden gut, und das sind die Wachstumsraten im Anzeigen-Business.
Dort hat Amazon in den letzten Jahren stetig Marktanteile von Google und Facebook abgegraben und sich zu einem Werbegiganten entwickelt.
Für 2023 ist ein Wachstum im Amazon Werbegeschäft von 19% prognostiziert, während Google & Meta mit weniger Wachstum kämpfen.
Und mit der Cloud Plattform AWS legen bereits viele Große und Kleine ihre Infrastruktur in Amazons Hände. Mehr Marktanteile in der digitalen Werbung könnte die Diversifizierung des Konzerns erhöhen und neue Opportunitäten in den Bereichen Robotik und Logistik eröffnen.
Auch Anthropic macht von sich reden - wir haben letzte Woche das krasse neue 75.000 Worte Modell vorgestellt (das du hier 7 Tage lang kostenlos testen kannst), mit dem man Massen an Input liefern kann. Bald soll deren Chatbot Claude sogar in Zoom zur Verfügung stehen.
Der Chip-Hersteller NVIDIA, unangefochtener Marktführer und Darling der Aktionäre (+90% in diesem Jahr!), hat gerade verlauten lassen, dass man zusammen mit ServiceNow personalisierte AI-Power fürs Business anbieten wird.
Damit lässt sich der Kundenservice verbessern, das Lernen der Mitarbeiter unterstützen und Entwicklern die Möglichkeit geben, sichere, unternehmensspezifische Sprachmodelle zu erstellen.
Leider ist noch offen, wann genau dieses Angebot genutzt werden kann.


via NVIDIA
🍏 Und was tut sich eigentlich bei Apple hinter den Kulissen?
Apple auf der anderen Seite hält sich bedeckter, was genau im Bereich AI alles läuft (mehr Details gibt es zu AR / VR).
CEO Tim Cook hat aber bestätigt, dass man AI in die gesamte Apple-Produktpalette einweben will.
Was wir wissen: Der Technologieriese baut ein großes Sprachmodell, ähnlich wie ChatGPT und Google's Bard. Das Projekt wird von John Giannandrea geleitet, dem ehemaligen AI-Chef von Google, der 2018 zu Apple wechselte.
Und Apple hat auch Technologie und Expertise dazu gekauft, indem es sich in 2020 zwei AI-Startups einverleibt hat - für jeweils 200 Millionen und 50 Millionen US-Dollar.
Was sich in den letzten Tagen und Wochen bei Apple sonst noch getan hat:
iOS 17 wird ein neues Voice-Cloning Feature bieten.
Der Konzern sucht neue Mitarbeiter mit AI-Hintergrund …
… und verbietet intern die Nutzung von ChatGPT, aus Angst davor, dass Mitarbeiter vertrauliche Information bei ChatGPT eingeben (NB: es gibt neu jetzt auch einen Inkognito-Modus in ChatGPT).
Seit ein paat Tagen gibt es ChatGPT es jetzt auch als kostenlose iPhone App, Download hier. Dagegen sieht Siri definitiv alt aus …
Und bestimmt werden in 2 Wochen an der nächsten WWDC23-Apple Developer Konferenz weitere spannende Neuerungen präsentiert.

ChatGPT App für iPhone
👌 Meta & Stability AI geben sich offen und teilen ihre Modelle
Meta hingegen geht einen anderen Weg. Während viele der anderen Anbieter die Details ihrer Modelle unter Verschluss halten, teilt Meta seine Kronjuwelen mit der Öffentlichkeit und veröffentlicht diese als OpenSource.
Das (geleakte) LLaMA-Modell von Meta ist die Grundlage vieler Open Source AI-Systeme, wir haben hier ausführlich darüber berichtet.
Zudem arbeitet Meta an einem eigenen Chip, der fortgeschrittenere Metaversum-bezogene Aufgaben wie Virtual Reality und Augmented Reality sowie generativen AI-Aufgaben unterstützen kann.
Der Konzern setzt große Hoffnungen in diese maßgeschneiderten AI-Chips [den Meta Training and Inference Accelerator (MTIA) für AI-Arbeitslasten und den Meta Scalable Video Processor (MSVP) für die Videoverarbeitung], um mit den Rivalen Google und Microsoft aufzuholen.
Und auch die Rechenzentren werden upgegradet, um mit den Anforderungen der AI Schritt zu halten.
Schließlich werden Facebook, Instagram und WhatsApp ja von der Hälfte der Erdbevölkerung genutzt! Und irgendwie muss die Entlassung von 21.000 Mitarbeitern ja durch mehr Effizient und Effektivität kompensiert werden.
Auch StabilityAI gibt sich offen. Die Firma, die hinter dem Open Source Modell Stable Diffusion steht, hat gerade mit Stability Studio eine Open Source Variante ihres beliebten DreamStudio veröffentlicht.
Das kürzlich veröffentlichte DeepFloydIF Modell, das Text auf Bildern erstellen kann (woran die meisten anderen Modelle kläglich scheitern), und die Textmodell-Suite StableLM stammen ebenfalls aus ihrer AI-Küche.
Die Firma selbst kämpft trotz Milliardenbewertung mit Herausforderungen im Bereich Finanzierung und hat Rechtsstreitigkeiten am Hals.

Übrigens, scheinbar will auch OpenAI das Gesicht wahren und demnächst ein Open Source Modell veröffentlichen! Na ja, GPT-4 wird es bestimmt nicht das Wasser reichen können …
So, damit sind wir bereits am Ende unserer Übersicht, was sich in der Welt der AI-Modelle aktuell so alles tut. Eines ist sicher: langweilig wird es nicht!
🧟 GPT-4 entwickelt cooles Mini-Game: Ghoul City
So, zum Schluss noch etwas Unterhaltsames.
Dass GPT-4 ein ausgewachsener Programmierer ist, weißt du bestimmt. Die Herausforderung besteht nur darin, die richtigen Prompts zu finden, damit die AI macht, was du willst.
Twitter User Allen T hat damit ein ganz ansehnliches Game mit Spielspaß entwickelt. Wie er das gemacht hat, zeigt er in diesem Twitter-Thread auf.
GPT-4 Mini Game - Ghoul City - Version 1 🎮🤖
Ghoul City is a simple side-scrolling video game that I created entirely with GPT-4 and Midjourney.
To create Ghoul City, I pretended to not have any coding background and instead let AI handle all of the coding and debugging. 🧵👇
— Allen T (@Mr_AllenT)
4:04 PM • May 8, 2023
Und schon wieder sind 3 Minuten um. Aber kein Grund zum traurig sein. Die AInauten sind schon bald wieder zurück, mit neuem Futter für dich.
Bis bald!
Deine AInauten
Dein Feedback ist für uns essenziell. Wir lesen JEDEN Kommentar und Hinweis. Sag uns, was (nicht) gut war, und was für DICH interessant ist,
⭐️ Wie hat dir diese Ausgabe gefallen? |
Login oder Abonnieren um an umfragen teilzunehmen. |
Übrigens, wenn du am Anfang deiner AI-Reise stehst oder dein Wissen erweitern willst, empfehlen wir dir den AInauten-Praxis-Kurs:
→ Damit wirst du in einem Nachmittag vom Newbie fast zum AI-Profi. Du lernst, wie du richtig Prompts erstellst, Bilder kreierst und erhältst zahlreiche praktische Tipps zu ChatGPT, Midjourney und Co. (Und zukünftige Module und Updates zu diesem Kurs sind inklusive!)