Gato nennt Deepmind seine neue KI mit Referenz auf das spanische Wort für Katze und ordnet sie in die Gruppe der Systeme mit künstlicher allgemeiner Intelligenz (AGI, Artificial General Intelligence) ein. Darunter fallen laut Definition Systeme mit der Fähigkeit, jede Aufgabe zu verstehen und zu erlernen, die auch ein Mensch erledigen kann. Unterstützt wird Gato zudem durch eine Technologie namens "multiples Embodiment" (Verkörperung im Raum). Sie simuliert durch räumliche Sensorik die physische Präsenz mit den dazugehörigen Sinneswahrnehmungen. Laut Deepmind ist Gato ein Allzwecksystem, das die Lösung vieler verschiedener Arten von Aufgaben lernen kann. Gato wurde auf 604 Aufgaben trainiert, darunter das Beschriften von Bildern, das Führen von Dialogen, das Stapeln von Blöcken mit einem echten Roboterarm und das Spielen von Atari-Spielen.
Wie alle KI-Systeme musste Gato anhand realer Beispiele trainieren. Dazu fütterten es die Forscher mit Milliarden von Wörtern, Bildern aus realen und simulierten Umgebungen, Steuerungsinteraktionen, Gelenkdrehmomenten und mehr. Die Darreichung dieser Daten erfolgte in Form von Tokens, die dazu dienen, Daten in einer für Gato verständlichen Form darzustellen. Damit war es dem System möglich, beispielsweise die Spielmechanik des Atari-Spieleklassikers "Breakout" selbstständig herauszufinden.
Im Detail wurde Gato in seiner Trainingsphase wie erwähnt über Tokens serialisiert, dann als Batch gestapelt und schließlich durch ein neuronales Transformer-Netzwerk ähnlich verarbeitet, wie es von großen KI-Sprachmodellen bekannt ist. Bei dem Verfahren maskierten Machine-Learning-Ingenieure den "Schwund" (Verlust- oder auch Loss-Funktion, die die Genauigkeit der Ergebnisse misst) und trainierten das Modell dahingehend, dass es nur Handlungs- und Textziele "vorhersagt". Zurzeit
...Der komplette Artikel ist nur für Abonnenten des ADMIN Archiv-Abos verfügbar.