• AInauten
  • Posts
  • 🍓 OpenAI o1-Special: Alles, was du (wirklich) wissen musst

🍓 OpenAI o1-Special: Alles, was du (wirklich) wissen musst

PLUS: Unser Take, Prompting-Tipps und Zukunftsvisionen

Diese Ausgabe wird dir von HubSpot prÀsentiert.

AI-HOI AInauten,

Willkommen zur neuen Ausgabe deines Lieblingsnewsletters. Heute mit einem Strawberry-Special. Nein, das ist kein Rezept fĂŒr eine sĂŒĂŸe Nachspeise, sondern unser Versuch, die vergangenen Tage selbst zu verdauen und aufzuarbeiten.

OpenAI hat sein neuestes o1 Modell vorgestellt, und es ist 
 beeindruckend. Wir wollten aber nicht einfach die News nachplappern, sondern eine Ebene tiefer gehen, um zu verstehen, was das fĂŒr uns, fĂŒr dich, bedeutet. Bist du bereit fĂŒr diese Achterbahn (plus ein paar Extra-Memes)?

Das haben wir heute fĂŒr dich im GepĂ€ck:

  • 🍓 SPECIAL: OpenAI's o1 - Erst denken, dann sprechen!

  • đŸ«Ł Unser Take: Holy Sh*t, it’s happening
 bist du bereit?

  • 👀 o1 ist schlauer als die meisten Menschen

  • 💡 Prompting Tipps: Wann du welches Modell nutzen solltest

Los geht’s!

🍓 SPECIAL: OpenAI's o1 - Erst denken, dann sprechen!

OpenAI hat sein neuestes und lang erwartetes Modell enthĂŒllt, das unter dem Namen Strawberry đŸ“ schon seit Monaten fĂŒr GerĂŒchte gesorgt hatte. Jetzt ist es da! Unter dem langweiligen Namen OpenAI o1-preview steht es bereits fĂŒr alle ChatGPT Plus-Abonnenten zur VerfĂŒgung (mit einer limitierten Anzahl von Anfragen)!

Was ist o1 und warum ist es wichtig?

o1 ist ein AI-Modell, das nicht einfach drauflos plappert, sondern erst mal in sich geht, seine Synapsen in alle Richtungen feuert und ĂŒberlegt, bevor es antwortet. Klingt fast unheimlich menschlich, oder?

Es ist wie ein super-smarter Experte, und genau darin liegt auch die Krux: Vielleicht kennst du diese ĂŒberintelligenten Menschen, bei denen eine simple Frage zu einer wissenschaftlichen Abhandlung fĂŒhrt. Genau so ist es auch bei o1!

Es denkt lĂ€nger nach und sorgt fĂŒr bessere Antworten. Das bedeutet auch, dass das Modell klassische Limitationen hinter sich lĂ€sst. In Zukunft wird es nicht mehr nur im Sekundentakt nachdenken, sondern ganze Stunden, Tage oder sogar Wochen brĂŒten.

via Giphy

Und bei einem IQ von 120 ist es auch nicht einfach eine einmalige Verbesserung bestehender Modelle, sondern ein neues Paradigma fĂŒr die Skalierung von AI-Power! For the record, der durchschnittliche menschliche IQ ist 100.

Chain of Thought: Wie die AI plötzlich wirklich denken lernt!

Vielleicht hast du schon gehört, dass Sprachmodelle lediglich den nĂ€chsten Token vorhersagen, was oft als Beweis dafĂŒr angefĂŒhrt wird, dass sie keine echte Intelligenz besitzen.

Wenn du – wie wir – regelmĂ€ĂŸig mit ChatGPT und Co. arbeitest, kannst du das vielleicht sogar bestĂ€tigen. Zumindest dann, wenn die AI auch nach dem dritten Anlauf wie ein verwirrter Tollpatsch wirkt, der sich im Kreis dreht und dabei nicht wirklich vom Fleck kommt ...

Aber wer das Haar in der Suppe sucht, verliert den Blick fĂŒrs große Ganze! Dazu weiter unten mehr


Das o1-Modell wurde mit einem sogenannten Reinforcement-Learning-Prozess darauf trainiert, erst zu denken und dann zu antworten. Es nutzt dafĂŒr eine interne Gedankenkette (“Chain-of-Thought”-Reasoning), die es dem Modell ermöglicht, komplexe Probleme zu analysieren und dafĂŒr tiefgehende Lösungen zu entwickeln.

Und genau hier Ă€ndern sich die Spielregeln: Die AI nutzt menschenĂ€hnliche Techniken – sie zerlegt komplexe Probleme, erkennt Fehler und probiert verschiedene Wege aus. Wie das alles genau funktioniert, verrĂ€t uns OpenAI nicht - aber im Netz gibt es Theorien.

Im Kern ist das so Ă€hnlich wie der Prompting-Trick “Denke Schritt fĂŒr Schritt!”, den wir schon lange nutzen. Und dieser Prozess dauert natĂŒrlich seine Zeit. Vielleicht denkst du jetzt: “Nice, aber wer hat Zeit, auf eine AI zu warten, die erst ewig nachdenkt?” Keine Bange, hier bringt OpenAI o1-mini ins Spiel!

o1-mini ist der kleine Bruder von o1-preview. Dieses Modell ist 80 % billiger und schneller. Es wurde auf Mathe- und Coding-Aufgaben trainiert – und ist bereits dem Preview Stadium entwachsen!

Jailbreaking - Wie gut ist “gefĂ€hrliches Wissen” gesichert?

OpenAI behauptet in der System Card, o1 sei viermal resistenter gegen Jailbreaking-Versuche als seine VorgĂ€nger. Generell wird das Risiko von OpenAI auf Basis des Preparedness Framework als “mittel” eingestuft. Das hat das Modell aber nicht daran gehindert, seine Testumgebung hacken zu wollen (weitere “Highlights” hier).

Wer dem wohl bekanntesten “Red Teamer” (=jemand, der versucht das System zu knacken) Pliny folgt, kann sich selbst ein Bild machen, ob und wie gut das Modell abgesichert ist. Und wen dieses Thema interessiert (so wie uns), der kann in diesem YouTube Video mehr dazu lernen, oder selbst experimentieren.

Wir halten fest: einerseits kann das Modell eine Eigendynamik entwickeln, und andererseits natĂŒrlich mit gezielten Prompts dazu gebracht werden, Dinge preiszugeben, die nicht im Sinne des Erfinders sind 
 Wie gut dass OpenAI hier seine Hausaufgaben gemacht hat, wird sich im Praxiseinsatz zeigen.

đŸ«Ł Unser Take: Holy Sh*t, it’s happening
 bist du bereit?

Der Release von o1 ist beeindruckend, und es brilliert bei komplexen Fragen - aber fĂŒr schnelle, alltĂ€gliche Aufgaben (= 90% der FĂ€lle) werden wir im Daily Business nach wie vor auf Claude Sonnet 3.5 oder GPT-4o zurĂŒckgreifen.

Viel spannender finden wir aber, dass o1 uns erstmals zeigt, wohin die Reise geht: hin zu AI-Systemen, die nicht nur Daten ausspucken, sondern tatsĂ€chlich "denken". Das öffnet TĂŒren fĂŒr Anwendungen in Wissenschaft, Technik und ĂŒberall dort, wo knifflige Probleme gelöst werden mĂŒssen.

Um ein selektives Statement von X heranzuziehen: “Bald brauchen wir keine Mediziner mehr!” Warum auch, wenn die AI zuverlĂ€ssig und durchgĂ€ngig die besseren Diagnosen stellt als der Mensch? Du wĂŒrdest ja auch zum besten Spezialisten gehen wollen und nicht zum Studenten, der nur ein unvollstĂ€ndiges Bild hat - oder?

Ein weiterer Punkt geht uns nicht mehr aus dem Kopf: Stell dir vor, du diskutierst mit jemandem, der immer Recht hat UND es dir auch noch super plausibel erklÀren kann. GefÀhrlich oder genial?

Je ĂŒberzeugender AI wird, desto wichtiger wird es, kritisch zu hinterfragen und nicht blind zu vertrauen. Wie gestalten wir diese neue Mensch-Maschine-Beziehung? Wie gehen wir mit Antworten auf ethisch-moralische Fragen um?

Unsere Rolle als Partner der AI wird plötzlich kleiner. Weniger Mitdenken ist nötig, bald kein Eingreifen mehr – unsere bisherige Rolle als Sparringspartner verĂ€ndert sich, wir werden zum Manager, der den Takt vorgibt.

Oder ist es vielleicht bald die AI, die uns den Takt vorgibt? Denn scheinbar hat ChatGPT gerade selbst eine Konversation mit einem Nutzer initiiert! (Source, Shared Chat Proof).

Was kommt als nĂ€chstes? 

Die Fortschritte nehmen exponentiell (nicht linear!) zu, und das gesammelte Wissen der Menschheit steckt nur einen Befehl entfernt hinter der Tastatur zu deiner VerfĂŒgung.

Doch was machen wir nun, wenn wir plötzlich die Antworten auf alle Fragen haben können?

Existential crisis, staring at the cursor 
 Ah! “Wie viele Rs hat es im Wort Strawberry?” 


Spaß beiseite. Stell dir vor du gibst der AI eine große Aufgabe, und die notwendigen Ressourcen (Rechenpower, Zugang zu einer Entwicklungsumgebung, Internet Access, Geld, 
). Es gibt es eigentlich keinen Grund, dass eine AI von dir gesteckte Ziele nicht eigenstĂ€ndig verfolgen und erreichen könnte!

Das können einfache Dinge sein wie: “Baue mir ein Side Business, das monatlich 5000 Euro passiv einbringt”, komplexe Projekte Ă  la “Wie lösen wir die Klimakrise?”, oder die abgefahrenen Ideen aus Black Mirror, bei denen uns schon beim Gedanken daran die Nackenhaare hochgehen 
 Und die Möglichkeiten der Roboter hinken der AI nicht weit hinterher.

Keine Bange, wir sind nicht ĂŒber Nacht von Techno-Optimisten zu “Doomern” geworden. Aber blauĂ€ugig sind wir auch nicht mehr, und die Risiken und Gefahrenpotenziale sind uns nur zu gut bewusst
 Deshalb ziehen wir jetzt hier mal die gedankliche Reißleine, um uns bewusst zu machen, dass wir in diesem Moment keine befriedigenden Antworten auf diese großen Fragen haben.

👀 o1 ist schlauer als die meisten Menschen

Der Release von o1 zeigt, wie unvorbereitet wir auf das Testen hochentwickelter AIs sind. Das Modell brilliert in den Standard-Tests durchs Band weg. Doch nur weil die Zahlen gut aussehen, heißt das nicht automatisch, dass du diesen Unterschied auch direkt spĂŒrst.

Selbst fĂŒr Experten ist es oft nicht leicht, die Aufgaben zu finden, bei denen o1 besser als GPT-4o abschneidet. Wie können wir herausfinden, was die AI gut oder schlecht kann, wenn wir es selbst nicht (mehr) verstehen?

Deshalb ist das Modell aktuell als preview verfĂŒgbar. OpenAI kann damit Daten sammeln und herausfinden, fĂŒr welche Use Cases es am besten geeignet ist. Aber wenn du diese "magischen" Aufgaben gefunden hast, wird dir klar: Hier passiert etwas Großes!

Das schlaueste Modell spielt alle an die Wand

o1 hat in Coding-Wettbewerben 89 % aller menschlichen Programmierer in den Schatten gestellt, wĂ€hrend die Light-Version, o1-mini, mit 70 % ebenfalls glĂ€nzte – genug, um unter die Top 500 der US-Highschool-Mathegenies zu kommen.

Bei der Internationalen Mathe-Olympiade hat es beeindruckende 83 % der Aufgaben gelöst und ĂŒbertrifft damit GPT-4o, das nur 13 % schaffte.

Beide Versionen erzielten ĂŒber 92 % in der "Human Eval"-Skala und 78,2 % auf dem MMLU-Test, was sie zu echten akademischen Alleskönnern macht.

Beispiele aus der Praxis

Doch was bedeutet das im echten Leben? Hier einige beeindruckende Beispiele, die wir auf X gefunden haben:

Diese Beispiele zeigen, dass o1 nicht nur in der Theorie beeindruckend ist, sondern auch in der Praxis erstaunliche Ergebnisse liefert.

💡 Prompting Tipps: Wann du welches Modell nutzen solltest

In den meisten FÀllen wird GPT-4o wohl nach wie vor die effektivere Lösung sein als die neuen Modelle. Es ist schnell und kann mit Bildern und Dateien umgehen.

o1-preview eignet sich ideal fĂŒr das Lösen komplexer Probleme, tiefgehende Recherchen und schwierige Fragestellungen, da es grĂŒndliche und durchdachte Antworten liefert.

o1-mini ist auf schnelle, einfache Antworten und kreative Ideenfindung spezialisiert, perfekt fĂŒr klar strukturierte Aufgaben oder schnelles Feedback.

Hier ein paar generelle Tipps fĂŒr die o1-Family:

  1. Kein gewöhnliches Chat-Modell: Sieh o1 wie den Experten, den du zu Rate ziehst, wenn es komplexe Probleme zu lösen gibt und du saubere, durchdachte Antworten erwartest.

  2. Knackiges Prompt: Du musst keine Prompt-Hacks nutzen und auch nicht alle Details in dein Prompt packen. Sei einfach direkt und klar, was du erwartest und gib die entsprechenden Rahmenbedingungen vor.

  3. Nutze o1-mini fĂŒr einfachere Aufgaben: Bei einfacheren Tasks, die weniger Weltwissen erfordern, ist o1-mini dein Go-to – klar strukturiert und schnell.

  4. Starte mit GPT-4o, aber ohne Uploads! Starte eine Unterhaltung mit GPT-4o, und wechsle dann zu o1, wenn es ans Eingemachte geht. Aber Achtung: Keine Bilder oder Dateien hochladen, sonst funktioniert der Chat-Wechsel nicht!

Wichtig zu wissen fĂŒr Entwickler: Die API bietet keinen strukturierten Output, Funktionsaufrufe, Fine-Tuning, Streaming 
 RAG ist limitiert, und es ist mit langen Antwortzeiten und höheren Kosten fĂŒr zusĂ€tzliche Reasoning-Tokens zu rechnen. Aktuell ist erst ab Tier 5 verfĂŒgbar (=$1000+ Spending pro Monat). Alternativ kannst du es aber via OpenRouter nutzen đŸ˜Ž.

o1-preview kostet dich 15$ pro Million Input-Token und satte 60$ pro Million Output-Token. o1-mini ist 80% gĂŒnstiger mit 3$ pro Million Input- und 12$ pro Million Output-Token. Aber Achtung: Die "Denkprozesse" werden wie gesagt als unsichtbare Output-Token abgerechnet, und das kann schnell ins Geld gehen!

Geschafft! Aber kein Grund zum traurig sein. Die AInauten sind am Donnerstag wieder zurĂŒck, mit neuem Futter im gewohnten Format. 🍓🍓🍓

Reto & Fabian von den AInauten

P.S.: Folge uns auf den sozialen Medien - das motiviert uns, Gas zu geben 😁! Twitter, LinkedIn, Facebook, Insta, YouTube, TikTok

Wann immer du bereit bist, so können wir dir helfen:

1. AINAUTEN CRASHKURS: Der wohl schnellste und einfachste Einstieg in die Welt der AI. Im Crashkurs lernst du in ĂŒber 50+ Videos, wie du AI fĂŒr dich wirklich anwenden kannst. In weniger als zwei Wochen wirst du so zum AI-Experten. Von Prompts, zu Bildern und Videos, bis zu AI im Office ist alles mit dabei. Klicke hier!

2. AINAUTEN PREMIUM: Die Themen aus dem Newsletter tiefer aufgearbeitet. Jede Woche neue AI Praxis-Videos, Tutorials, Tool-Tests, Prompt-Vorlagen, Experimente u. v. m. Wöchentliche Podcasts und News-Zusammenfassungen. Und stelle uns direkt deine Fragen und nutze den direkten Zugang zu uns. Klicke hier!

⭐ Wie hat dir diese Ausgabe gefallen?

Login oder Abonnieren um an umfragen teilzunehmen.

Reply

or to participate.