KI-Sprachmodelle: Eine Übersicht

In Zeiten der digitalen Schnelllebigkeit entwickelt sich die Art und Weise, wie wir mit Technologie interagieren, in einem noch nie dagewesenen Tempo weiter. An vorderster Front dieser Revolution stehen KI-Sprachmodelle, die die Art und Weise, wie wir kommunizieren, lernen und kreativ sind, verändern.

Von der Automatisierung alltäglicher Aufgaben bis hin zur Erstellung fesselnder Inhalte sind diese fortschrittlichen Algorithmen nicht nur Werkzeuge, sondern leistungsstarke Mitarbeiter, die unsere Kreativität und Produktivität steigern.

GPT-4

Entwickler: OpenAI

Erstmals veröffentlicht: März 2023

GPT-4 ist das Flaggschiff von OpenAI, das große Sprachmodell. Es kann Text sowohl aus Bildern als auch aus Texteingaben generieren.

GPT-4 wurde entwickelt, um GPT-3 und GPT-3.5 zu ersetzen, eines der Modelle, die zur Feinabstimmung von ChatGPT verwendet werden. Es ist die Grundlage für ChatGPT Plus, OpenAIs Premium-Abonnementdienst, der 20 Dollar pro Monat kostet.

Über die Größe und die zugrunde liegenden Details von GPT-4 ist nicht viel bekannt. Im Gegensatz zu früheren GPT-Modellen hat sich OpenAI dafür entschieden, alles unter Verschluss zu halten.

Allerdings soll das Modell mit 1,76 Billionen Parametern sehr groß sein – viel größer als frühere GPT-Varianten.

GPT-3

Entwickler: OpenAI

Erstmals veröffentlicht: Juni 2020

Eines der bekanntesten Textgenerierungsmodelle der Welt ist GPT-3.

Obwohl es im Vergleich zu GPT-4 inzwischen veraltet ist, wurde GPT-3 regelmäßig optimiert und auf andere Anwendungsfälle und Anwendungen, wie z. B. die Codegenerierung über Codex, abgestimmt.

GPT-3 hat während seiner Lebensdauer eine Vielzahl von Anwendungen unterstützt, darunter das textbasierte Abenteuerspiel AI Dungeon, die VR-Charaktererstellung von Fable Studios und die Social-Venture-Projekte von Create Labs.

Trotz der vielen Einsätze hielt Microsoft jedoch eine „Exklusivlizenz“ für GPT-3.

PaLM

Entwickler: Google

Erstmals veröffentlicht: April 2022

Google PaLM ist das Flaggschiff unter den großen Sprachmodellen des Suchmaschinenriesen. PaLM 2, das auf der I/O 2023 vorgestellt wurde, ersetzt das große Sprachmodell LaMDA, das die Chatbot-Anwendung Bard unterstützt.

PaLM 2 unterstützt mehr als 100 Sprachen und ist so konzipiert, dass es für domänenspezifische Zwecke und Anwendungen fein abgestimmt werden kann.

Zum Beispiel Sec-PaLM, das für Cybersicherheitsanwendungen optimiert wurde, oder Med-PaLM-2, das Ärzten helfen kann, medizinische Probleme anhand von Bildern wie Röntgenaufnahmen zu erkennen.

Ähnlich wie bei OpenAIs GPT-4 hat sich Google über die Größe von PaLM 2 noch bedeckt gehalten. Die erste Version von PaLM, die im April 2022 vorgestellt wurde, umfasste 540 Milliarden Parameter und war für den Einsatz in Konversationsanwendungen gedacht.

Claude

Entwickler: Anthropic, ein KI-Startup, das von ehemaligen OpenAI-Ingenieuren gegründet wurde. Google und Salesforce gehören zu den Geldgebern der Firma.

Erstmals veröffentlicht: März 2023

Claude ist eine Chatbot-Anwendung, die ChatGPT ähnelt und speziell dafür entwickelt wurde, sicherere Ergebnisse zu produzieren.

Er verwendet einen Ansatz namens „konstitutionelle KI“, um zu verhindern, dass er potenziell schädliche Ergebnisse erzeugt, indem er dem Modell eine Reihe von Prinzipien vorgibt, denen es folgen soll.

Claude verfügt über eine beachtliche Kontextlänge, die rund 100.000 Token oder etwa 75.000 Wörter umfasst, so dass es auch lange Dokumente verarbeiten kann.

Inflection-1

Entwickler: Inflection, ein KI-Startup aus dem Silicon Valley, das von Bill Gates, dem ehemaligen Google-CEO Eric Schmidt und LinkedIn-Mitbegründer Reid Hoffman unterstützt wird

Erstmals veröffentlicht: Juni 2023

Inflection-1 ist eines der neuesten KI-Modelle auf dieser Liste und wurde für die virtuelle Assistentenanwendung Pi.ai des Start-ups entwickelt.

Das Startup nutzte eigene technische Methoden, um das Modell auf eine Stufe mit Chinchilla von DeepMind und Googles PaLM zu stellen.

Einstein GPT

Entwickler: Salesforce

Erstmals veröffentlicht: März 2023

Einstein GPT kann personalisierte E-Mails für Vertriebsmitarbeiter/innen generieren und Antworten für Kundendienstmitarbeiter/innen erstellen, die diese bei der Bearbeitung von Kundenanfragen verwenden können.

Es wurde von Salesforce entwickelt und kombiniert die firmeneigenen Daten mit der unternehmenstauglichen Technologie des ChatGPT-Herstellers OpenAI.

Cohere Command

Entwickler: Cohere

Erstmals veröffentlicht: Juni 2022

Command ist das Flaggschiff unter den KI-Generierungsmodellen von Cohere. Es kann Text aus benutzerdefinierten Datenquellen generieren, so dass Organisationen es auf bestimmte Anwendungsfälle abstimmen können.

Command kann Produkttexte erstellen, beim Verfassen von E-Mails helfen, Beispiel-Pressemitteilungen vorschlagen und mehrere Fragen zu Dokumenten beantworten.

Es ist eines der wenigen KI-Modelle auf dieser Liste, das regelmäßig weiterentwickelt wird – Cohere veröffentlicht jede Woche eine neue Version des Command-Modells.

Bloom

Entwickler: BigScience, ein von Hugging Face geleiteter Forschungsworkshop, an dem mehr als 1.000 Forscher/innen aus 60 Ländern beteiligt sind

Erstmals veröffentlicht: Juli 2022

Bloom ist ein mehrsprachiges KI-Modell mit 176 Milliarden Parametern, das sowohl Open Source als auch universell einsetzbar ist. Bloom kann Texte in 46 natürlichen Sprachen generieren und beherrscht 13 Programmiersprachen.

LLaMA

Entwickler: Meta, FAIR

Erstmals veröffentlicht: Februar 2023

LlaMA – oder Large Language Model Meta AI – ist ein Open-Source-Sprachmodell von Meta. Es ist so konzipiert, dass darauf aufgebaut werden kann, und bildet die Grundlage für eine Vielzahl von Open-Source-Modellen wie Alpaca und Gorilla, obwohl LLaMA nur für die Forschung offen ist.

LLaMA-Modelle variieren von sieben Milliarden Parametern bis zu 65 Milliarden Parametern, wobei die kleineren Modelle von Forschern bevorzugt werden, da sie weniger rechenintensiv sind.

Das 13-Milliarden-Parameter-Modell von LLaMA übertrifft das GPT-3-Modell von OpenAI, das 175 Milliarden Parameter hat, bei den meisten Benchmarks“, heißt es in dem Papier von Meta.

Meta stellt die Version, Llama 2, kostenlos für Forschung und kommerzielle Nutzung zur Verfügung. Es gibt sie in drei Größen: sieben Milliarden, 13 Milliarden und 70 Milliarden Parameter.

Jurassic

Entwickler: AI21 Labs, ein OpenAI-Konkurrent aus Tel Aviv

Erstmals veröffentlicht: August 2021

Jurassic bietet anpassbare Sprachmodelle, die für natürlichsprachliche Anwendungsfälle entwickelt wurden. Die aktuelle Version, J2, ist über AI21 Studio, die NLP-as-a-Service-Plattform der Organisation, zugänglich.

J2 gibt es in einer Familie von drei Modellen – Large, Grande und Jumbo – sowie in anweisungsangepassten Sprachversionen von Jumbo und Grande.

Leuchtende

Entwickler: Aleph Alpha ist ein deutsches KI-Startup

Erstmals veröffentlicht: April 2022

Luminous kann Text aus natürlichsprachlichen Eingabeaufforderungen erzeugen.

Es gibt vier Größen von Luminous: Luminous-base ist die kleinste Version, die für kostengünstige Anwendungen entwickelt wurde;

Luminous-extended ist das mittlere Modell, das für Anwendungsfälle entwickelt wurde, bei denen es auf Geschwindigkeit ankommt, und das auch Bilder als Eingaben akzeptieren kann;

Luminous-supreme kann nur Text verarbeiten und ist mehr auf kreatives Schreiben zugeschnitten; und Luminous-supreme-control ist die größte und teuerste Version, die für Fragen und Antworten und natürlichsprachliches Inferencing optimiert ist.

GPT-NeoX

Entwickler: EleutherAI, ein gemeinnütziges KI-Forschungslabor, das große Sprachmodelle untersucht

Erstmals veröffentlicht: Februar 2022

GPT-NeoX ist ein Sprachmodell mit 20 Milliarden autoregressiven Parametern, das auf The Pile, einem Open-Source-Datensatz für Sprachmodelle, trainiert wurde.

GPT-NeoX ist ein leistungsstarker „few-shot reasoner“, d.h. es lernt gut aus einer kleinen Anzahl von Beispielen.

Trotz seiner geringen Größe kann GPT-NeoX eine Reihe von Aufgaben in den Bereichen Sprachverständnis, Mathematik und Wissen lösen.

Mehr Inspiration für dich: