KI auf der Suche nach einem Körper
Deep Learning und Morphological Computation
Einige beachtliche Erfolge kann die künstliche Intelligenz bereits vorweisen, beispielsweise beim Spielen des Brettspiels Go: AlphaGo hat einen der besten Go-Profis klar geschlagen. Dies wird manchmal als Wendepunkt bezeichnet. Dass künstliche neuronale Netzwerke fähig sind, selbstständig Problemlösungen zu finden, auf die Menschen nicht gekommen wären, könnte auch die Weise verändern, wie man zu wissenschaftlichen Erkenntnissen kommt. Aber es gibt auch Aufgaben, bei denen die Künstliche Intelligenz an ihre Grenzen kommt. Morphological Computation könnte hier leistungsfähiger sein.
Im letzten Jahr waren die Medien voll mit Schlagzeilen über den Erfolg der Künstlichen Intelligenz. Das Schlagwort Deep Learning war in aller Munde – eine Technik aus dem Bereich des Maschinellen Lernens, die künstliche neuronale Netze verwendet, um eine hierarchische Struktur aufzubauen. Das Netzwerk abstrahiert und reduziert Information von einer Schicht zur nächsten, indem es die Verbindungen zwischen den Schichten mit der richtigen Gewichtung lernt. Je mehr Schichten ein solches Netz hat, desto tiefer ist es. Daher auch der Name Deep Learning.
Der Ansatz ist nicht neu, aber vor Kurzem entwickelte Verfeinerungen haben zu einem Durchbruch geführt. Eines der bekanntesten Erfolgsbeispiele ist Googles AlphaGo, ein Computerprogramm, das Deep Learning benutzt, um das alte chinesisches Brettspiel Go zu spielen – und zwar sehr erfolgreich.
Wieso ist gerade Go so interessant? Das Spiel hat eine unglaublich grosse Anzahl von möglichen Spielsituationen. Bei einer Standardspielbrettgrösse von 19 x 19 Feldern, und mit drei Möglichkeiten pro Position (schwarzer, weisser oder kein Stein), ergeben sich mehr als 10172 Varianten. Zum Vergleich: Die geschätzte Anzahl aller Atome im Universum ist eine 1 mit «nur» 80 Nullen. Die Anzahl der Varianten in Go ist viel zu gross, um jemals alle Möglichkeiten auch nur annähernd durchzuprobieren.
Um das Spiel wirklich gut spielen zu können, ist eine Art Intuition nötig. Das Programm muss in der Lage sein, auch bei neuen Spielsituationen gute Züge zu machen. AlphaGo zeigte genau diese Fähigkeit in beeindruckender Art und Weise, denn es besiegte Lee Sedol, den 18-fachen Go-Weltmeister, eindeutig mit 4:1 Spielen.
Deep Learning hat neben Go, welches vielleicht das bekannteste Resultat ist, auch andere beeindruckende Ergebnisse geliefert. Zum Beispiel wurde mit dem gleichen Ansatz gelernt, Computerspiele wie Mario Bros zu spielen (ohne die Regeln zu kennen), komplexe Bilder zu verstehen, Spracherkennung durchzuführen, Lieder zu kategorisieren und viele andere.
Obwohl diese Resultate beeindruckend sind, haben sie alle ein gemeinsames Problem: Sie konzentrieren sich nur auf die virtuelle Welt. Die Aufgabe ist klar vordefiniert, es gibt klare (meist sehr einfache) Regeln und alles ist deterministisch. Alles passiert innerhalb der eng abgegrenzten digitalen Welt des Computers. Eventuelle Interaktionen mit der realen Welt finden nur durch streng definierte Kanäle statt. Zum Beispiel gibt AlphaGo vor, wo der nächste Stein hingelegt werden soll, und eine Person führt diese Aktion fehlerfrei aus. Kurz gesagt, versucht man künstliche Intelligenz in einer Box zu bauen.
Nur in virtuellen Welten
Das ist zwar kein Problem, wenn man den Inhalt von Fotos verstehen will, aber sobald dem Programm eine Möglichkeit gegeben wird, mit der realen Welt zu interagieren, verschwimmen diese klar definierten Grenzen. Jede Aktion hat Konsequenzen, die oft nicht immer eindeutig nachvollziehbar sind, weil die Welt da draussen sehr komplex ist.
Ein typisches Beispiel, wo eine Interaktion der künstlichen Intelligenz mit der realen Welt erwünscht ist, sind Roboter, speziell solche, welche mit uns zusammen arbeiten. Roboter müssen idealerweise ihre gesamte Umgebung verstehen, um auf (möglichst) alle Situationen richtig zu reagieren. Auf den ersten Blick scheint es hier eine hohe Ähnlichkeit mit der Problemstellung von Go zu geben. Auch hier soll das intelligente Programm eine Art «Intuition» besitzen, da es zu viele Möglichkeiten (neue «Spielsituationen») gibt. Also sollte auch hier Deep Learning erfolgreich angewendet werden können. Leider funktioniert das aber nicht!
In der reellen Welt
Die «neuen» Situationen in Go liegen stets innerhalb streng begrenzter Regeln. Beispielsweise liegt anstatt eines schwarzen Steins manchmal ein weisser. Der Einsatz eines Steins mit einer anderen Farbe oder gar ein anderes Objekt ist nicht möglich.
Die «neuen» Situationen, die ein intelligenter Roboter meistern soll, sind von einer ganz anderen Qualität. Zum Beispiel bringt der Besitzer des Roboters einen Hund mit nach Hause. Der Roboter sieht nun zum ersten Mal ein solches Tier. Wie soll er sich verhalten? Nach welchen Regeln verhält sich dieses neue «Objekt»?
Diese Art von Situation ist typisch für Aufgaben in der realen, hochdynamischen Welt, in der wir leben. Unsere «Regeln» ändern sich. Nicht alle und nicht ständig, aber unsere Welt ist bei Weitem dynamischer und offener als Go. Ein naives Anwenden von Ansätzen wie Deep Learning scheitert hier kläglich.
Ein weiteres Problem ist, dass alle Aufgaben, in denen Deep Learning erfolgreich war, beliebig oft wiederholt werden können. Dieser Ansatz funktioniert wunderbar, wenn man ein Videospiel hat oder ein Brettspiel spielen lernen will. Wenn man verliert, lernt man daraus und startet von Neuem. Mit einem echten Roboter ist das unmöglich. Es ist sogar äusserst gefährlich – nicht nur für den Roboter, sondern auch für alle rundherum. Ein Fehler und der Roboter stürzt und ist beschädigt oder, was noch schlimmer ist, er verletzt oder tötet jemanden.
Entwicklungen bei Robotern
Die Geschichte der Robotik ist eng mit der Geschichte der Künstlichen Intelligenz verknüpft. Die Idee war immer schon, intelligente Maschinen zu bauen, die uns in der Arbeit und zu Hause unterstützen oder sogar ersetzen. Die Frage ist, wo sind alle diese Roboter? Robotik existiert schon seit Jahrzehnten und es wird ständig von einer Roboterrevolution gesprochen. Die Wahrheit ist, Robotik ist sehr erfolgreich, aber nur in ganz speziellen Bereichen. Der Grossteil der Roboter arbeitet hinter Zäunen in Fabriken. Sie sind dort deshalb so erfolgreich, weil sie eine klar definierte Aufgabe haben und unter klar abgegrenzten Bedingungen arbeiten. Sie müssen nicht intelligent sein, da sie voraussetzen können, dass Teil A immer genau an derselben Stelle ist, und Teil B genauso. Es gibt klare Regeln, die sich nicht ändern.
Sobald aber Roboter aus ihrer «vertrauten Umgebung», den Fabriken, herausgeholt werden, versagen sie kläglich. Sie wirken fast lächerlich. Ein gutes Beispiel ist die Darpa challenge, ein internationaler Wettbewerb, der vom amerikanischen Verteidigungsministerium organisiert wurde. Die Roboter mussten Aufgaben erfüllen wie Türen öffnen, Autos fahren und über unregelmässige Oberflächen gehen. Es nahm die internationale Crème de la Crème der Robotik teil und trotzdem stolperten viele Roboter über die eigenen Beine oder fielen einfach um, wenn sie eine Tür aufmachen sollten. Die wirkliche Welt ausserhalb eines solchen Wettbewerbs ist noch um einiges komplexer und unvorhersehbarer.
Offensichtlich wurde das Problem der künstlichen Intelligenz in der Robotik noch nicht gelöst. Je mehr wir darüber lernen, auch durch solche Wettbewerbe, desto mehr kristallisiert sich heraus, dass wir in der Robotik und der künstlichen Intelligenz gegen eine Wand laufen. Seit Beginn der Robotik (Kybernetik) wurde uns versprochen, dass es nur noch fünf bis zehn Jahre dauern würde, bis wir intelligente Roboter haben. Ein Versprechen, das bis heute nicht erfüllt wurde. Das Problem: Wir bauen Roboter mehr oder weniger nach den gleichen Prinzipien wie seit Beginn der Robotik. Vielleicht sollte der Ansatz geändert werden, wenn er offensichtlich nicht zum Erfolg führt? Aber gibt es eine Alternative? Die Antwort lautet ja. Wir brauchen nur einen Blick auf die Natur zu werfen. Tiere (inklusive uns) stehen vor den exakt gleichen Herausforderungen wie Roboter und sie lösen diese auf unglaublich beeindruckende Art und Weise. Tiere sind robust, adaptiv und enorm energieeffizient. In fast allen Aufgaben sind Tiere um Grössenordnungen besser als die besten Roboter. Nur in der Fabrik, wo unter strengen Einschränkungen immer die gleiche Aufgabe sehr exakt und schnell ausgeführt werden soll, sind Roboter besser.
Verteilte Intelligenz
Ein auffallender Aspekt der Intelligenz bei Tieren ist die Beobachtung, dass Berechnungen, die nötig sind, um erfolgreich mit der Umgebung zu interagieren, nicht nur im Gehirn stattfinden. Wenn man genau hinschaut, sieht man, dass die Intelligenz über den ganzen Körper verteilt ist. Das sind zum Beispiel die mechanischen Eigenschaften unserer Muskeln und Sehnen, die uns helfen, stabil zu laufen, oder lokale neuronale Regelkreise. Aber sogar die rein mechanische Ebene des Körpers leistet einen wichtigen Beitrag zum intelligenten Verhalten. Je mehr wir über Tiere lernen, speziell bei sehr primitiven Tieren, umso mehr sehen wir, dass diese physische Ebene überraschend vielfältig ist und eine hohe Anzahl an Regelungsaufgaben übernimmt, um die Systeme robuster und adaptiver zu machen. Auch hilft der Körper dabei, sensorische Eindrücke zu verarbeiten, indem er seine physischen Eigenschaften dazu benützt, um Informationen zu filtern, nichtlinear zu transformieren und zu integrieren. Grundsätzlich ist ein Grossteil des intelligenten Verhaltens nicht das Resultat von Befehlen, die vom Gehirn kommen, sondern ein Produkt aus der Interaktion des Körpers mit der Umgebung. Das ist eine komplett andere Art von Intelligenz als die, die wir mit künstlicher Intelligenz zu konstruieren versuchen.
Morphological Computation
Ein Begriff, der verwendet wird, um dieses Phänomen zu beschreiben, ist Morphological Computation. Basierend auf dieser Idee wurden auch Roboter gebaut. Eines der bekanntesten Beispiele sind sogenannte passive dynamische Läufer. Das sind rein mechanische Roboter, welche eine schiefe Ebene heruntergehen können, indem sie ihre mechanische Struktur nutzen, um die Schwerkraft in eine elegante Gehbewegung umzuwandeln. Diese Roboter haben keine Motoren, keine Sensoren und auch kein digitales «Gehirn», trotzdem funktionieren sie – natürlich auch extrem energieeffizient.
Ein anderes berühmtes Beispiel ist die Kaffeeballon-Greifhand (coffee balloon gripper). Das ist ein einfacher Luftballon, der mit gemahlenem Kaffee gefüllt ist. Wenn man die Luft absaugt, wird er hart, lässt man Luft hinein, wird er wieder weich. Das gleiche Prinzip sieht man, wenn man gemahlenen Kaffee kauft. Da er vakuumverpackt ist, ist die Verpackung hart. Wenn man ein Loch hineinsticht, wird er weich.
Mit dieser Kaffeeballon-Greifhand kann man Objekte, die in Grösse und Art verschieden sind, aufnehmen. Der Greifer muss dabei nicht wissen, welches Objekt es ist. Solange er im weichen Zustand ist, passt sich der Ballon mit dem Kaffee an die Form des Objekts an. Saugt man die Luft ab, wird er hart und hält das Objekt. Die Regelung der Greifhand ist extrem einfach: Ein simples Ein/Aus genügt. Den Rest macht der (intelligente) Körper.
Verwendet man im Vergleich dazu eine klassische Roboterhand, braucht man eine äusserst komplexe Regelung (typischerweise mit Signalen für 15 bis 20 Motoren) und ein genaues Modell des Objekts und seiner Position im Raum.
Wie man an diesen beiden Beispielen sehen kann, und es gibt unzählige mehr, kann (und soll) der Körper von Robotern intelligente Funktionen implementieren. Das Resultat sind elegante Lösungen, die energieeffizient, robust und adaptiv sind. Sie funktionieren, obwohl sie nicht alle Informationen über ihre Umwelt haben. Das ist sehr vielversprechend. Nur, man muss dann Roboter komplett anders bauen, als wir es heutzutage machen.
In der konventionellen Robotik gibt es eine klare Trennung zwischen dem (dummen) Körper und dem (intelligenten) Gehirn/zentralen Regler. Bei einem «morphological computation»-Ansatz verschwimmt diese Grenze. Die Art und Weise, wie solche Roboter konstruiert werden, ist anders. Mathematische Modelle haben gezeigt, dass ein Körper eine komplexe und nichtlineare Dynamik haben und aus weichen Materialien bestehen sollte. Sogar Rauschen im System ist hilfreich. Interessanterweise sind dies alles Eigenschaften, die in klassischen Roboterdesigns unerwünscht sind. Andererseits sind das genau die Eigenschaften, die sehr gut Körper von Tieren beschreiben.
Zudem sind das auch Eigenschaften der beiden oben genannten Beispiele «passiver dynamischer Läufer» und «Kaffeeballon-Greifhand» wie auch einer Reihe von neuen Robotern, die aus weichen Materialien wie Silikonen, Kunststoff, Gel usw. gebaut werden – sogenannte «Soft Robots». In den letzten Jahren hat sich ein eigenes Forschungsfeld um dieses Thema entwickelt.
Das ist sicher ein Schritt in die richtige Richtung, um Roboter wirklich intelligent zu machen und sie aus den Fabriken in unsere Welt zu bringen. Aber früher oder später werden wir Roboter nicht mehr wie Maschinen bauen und Künstliche Intelligenz nicht mehr in einer virtuellen Box konstruieren, um wirklich intelligente Roboter zu bekommen. Beide werden auf natürliche Weise zusammenkommen, in wachsenden und sich selbst entwickelnden Robotiksystemen.
Electrosuisse / ITG-Kommentar
Effiziente und elegante Lösungen
Künstliche Intelligenz schlägt Menschen zwar in Spielen wie Go und Schach, aber wirklich nützliche Haushalts-Roboter gibt es (noch) nicht. KI-Methoden wie Deep Learning kommen mit offenen Alltagsumgebungen deutlich weniger gut zurecht. Der Artikel präsentiert mit Morphological Computation einen interessanten Gegenentwurf zum Ansatz des «dummen Körpers mit Hirn». Nach dem Vorbild der Natur, mit verteilter Intelligenz und einem Körper, der aktiv mit der Umgebung interagiert, sind effiziente und elegante Lösungen möglich – ein spannender Ausblick.
Patrik Stampfli, ITG-Vorstandsmitglied und Head of Operations, Elca.
Kommentare