Modelle und Formen von KI

In den letzten Jahren hat insbesondere die Bekanntheit von sogenannten LLMs (Large-Language-Models; dt: Große Sprach-Modelle) durch ChatGPT (Generative Pre-Trained Transformer), Copilot, Claude oder Gemini stark zugenommen. Auch Text-To-Image-Models wie DALL-E, Midjourney oder Stable Diffusion standen immer öfter - sowohl positiv als auch negativ - in der Öffentlichkeit. 
Doch viele Menschen können sich unter dem Oberbegriff "Künstliche Intelligenz" nur sehr wenig praktisch vorstellen. Was beinhaltet der Begriff der KI eigentlich alles und was ist sowohl praktisch möglich als auch theoretisch?
Im Folgenden möchten wir Ihnen einige der relevantesten Formen und Modelle der Künstlichen Intelligenz erläutern.

Bevor man nun bestimmte Modelle betrachtet, muss man zwischen schwacher und starker künstlichen Intelligenz unterscheiden.
Unter starker künstlicher Intelligenz (auch AGI; Artificial General Intelligence genannt) versteht man eine Maschine, die im Allgemeinen dieselben Fähigkeiten wie ein Mensch gleichzeitig besitzt und dadurch jede intellektuelle Aufgabe erfüllen kann. Eine solche Maschine besitzt nicht nur "Intelligenz", sondern auch "Bewusstsein". Es ist stark umstritten, wie realistisch die Existenz von starker künstlicher Intelligenz theoretisch und praktisch ist. Führende Experten vergleichen beispielsweise den Unterschied zwischen schwacher und starker künstlicher Intelligenz mit dem Unterschied zwischen der derzeiten Raumfahrt und Raumschiffen mit Überlichtgeschwindigkeit. 

Auf der anderen Seite steht die schwache künstliche Intelligenz. Hiermit werden Maschinen bezeichnet, die bestimmte einzelne Fähigkeiten des Menschen abbilden und bestimmte dazugehörige Aufgaben erfüllen können. Während diese Maschinen konkrete, logische Anwendungsprobleme bearbeiten können, besitzt sie keine Kreativität und die Fähigkeit vollkommen selbstständig zu lernen, ist stark eingeschränkt.

Unter diesem Absatz finden Sie das Periodensystem der künstlichen Intelligenz (Quelle: Bitkom e.V). Jede Kachel steht für eine unterschiedliche (den menschlichen Fähigkeiten angelehnte) Fähigkeit. Eine starke künstliche Intelligenz müsste all diese Fähigkeiten beherrschen. Eine schwache künstliche Intelligenz lediglich (mindestens) eine. Mit rot sind die Fähigkeiten gekennzeichnet, die derzeitige Sprachmodelle (wie ChatGPT oder Gemini) beherrschen. 

https://www.periodensystem-ki.de/Mit-Legosteinen-die-Kuenstliche-Intelligenz-bauen
Foto: https://www.periodensystem-ki.de/Mit-Legosteinen-die-Kuenstliche-Intelligenz-bauen

Die zwei wichtigsten Oberbegriffe, wenn man über Formen und Modelle von Künstlicher Intelligenz spricht, sind Maschinelles Lernen (auch ML) und Neuronales Netzwerk (auch KNN). 

Maschinelles Lernen ist in erster Linie ein Sammelbegriff für verschiedene Methoden, bei denen ein Computersystem anhand verschiedener Beispielen lernt und aus diesen selbstständig Modelle ableitet. Maschinelles Lernen grenzt sich somit von den "klassischen Systemen" ab, die nur entlang vorgegebener Strukturen agieren. 

Neuronale Netzwerke beschreiben eine bestimmte Technik des Maschinellen Lernens. Inspiriert ist diese Technik von der Struktur des menschlichen Gehirns. Es gibt viele unterschiedliche Arten, ein künstliches neuronales Netzwerk aufzubauen. Gemeinsam haben sie alle, dass das System selbstständig in der Lage ist neue Verzweigungen und Entscheidungswege zu erstellen. Sollte einer der Entscheidungen nicht zum gewünschten Ergebnis führen, wird dieser Weg automatisch vom System verworfen. Am Ende entsteht ein "Netzwerk" von einer oder mehreren guten Entscheidungen für eine Fragestellung oder Situation. 

Eine besondere Form stellt die Methode des sogenannten Deep Learning (tiefes Lernen oder mehrschichtigees Lernen) dar. In dieser Methode werden in der Regel mehrere Neuronale Netzwerke gleichzeitig verwendet und miteinander verschränkt. Dies ermöglicht die Bearbeitung von hochkomplexen Situationen. Durch die hohe Komplexität der Systeme entstehen jedoch während des Prozesses "hidden layers" (versteckte Ebenen), die zunehmend intransparenter und unzuerklärbarer werden. Zugleich benötigt es für die Verwendung, je nach Maßstab, große Mengen an Daten und eine hohe Rechenleistung. Diese Methode findet insbesondere bei Forschungsanwendungen sowie großen kommerziellen Projekten Anwendung.

Eigene Darstellung
Foto: Eigene Darstellung

Um die jeweilige Künstliche Intelligenz zu "trainieren" kommen unterschiedliche Methoden zum Einsatz. Die vier bekanntesten sind:

  • Supervised Learning (überwachtes Lernen) - Hier wird das System mit vorausgewählten Daten trainiert. Man gibt zuvor an, welche Antworten oder Schlussfolgerungen "richtig" und welche "falsch" sind. Sobald das System dann mit anderen unbekannten (aber ähnlichen) Daten arbeitet, können die Ergebnisse mit den bekannten, richtigen Ergebnissen verglichen und überprüft werden. 

  • Unsupervised Learning (unüberwachtes Lernen) - Hier wird dem System kein Fundament zur Verfügung gestellt. Es versucht eigenständig aus einer verfügbaren Datenmenge Muster zu erkennen und Ähnliches in Gruppen einzusortieren. Dieser Ansatz ist besonders beliebt in der sogenannten Clusteranalyse.

  • Reinforcement Learning (bestärkendes Lernen) - Dies ist ein Mix aus den beiden zuvor genannten Trainingsmethoden. Das System analysiert selbstständig eine verfügbare Datenmenge, ohne das Ziel zu kennen. Zu bestimmten Zeitpunkten erhält das System eine positive oder negative Rückmeldung, je nachdem nah es am unbekannten Ziel ist. Auf Basis der Rückmeldung passt das System seine Strategie an. 

  • Generative Adversarial Networks (GANs) -  Hier stehen zwei unterschiedliche neuronale Netze in einem Wettstreit miteinander. Eines der Netze erzeugt künstliche Daten, während das andere Netz diese betrachtet und beurteilt.  Besonders geeignet ist diese Methode bei der Erstellung von kreativen Daten, wie Bildern, Videos oder Texten.