Skip to main content

Idee der Foundation Models - KI Journal Club

Die Septemberausgabe vom KI-Journal Club widmet sich dem Stand der KI-Forschung der ersten Stunde und dem Ansatz des menschlichen Denkens, dem Einfluss neuer Technologien auf die Arbeitswelt und Neues vom Search On Event, denn bei Suche als solches gibt immer wieder neue Aspekte zu entdecken und erforschen.

Stochastische Papageien und andere Vögel

Mitte der 1950er, genauer 1956, wurde in Dartmouth mit der berühmten Konferenz Dartmouth Summer Research Project on Artificial Intelligence das Forschungsgebietes der Künstlichen Intelligenz ins Leben gerufen. Ziel war es, das menschliche Denken und Lernen zu formalisieren, damit Maschinen dies simulieren können. In dem Förderantrag waren die Antragsteller noch optimistisch schnell Erfolge erzielen zu können: “Wir glauben, dass in dem einen oder anderen dieser Problemfelder bedeutsame Fortschritte erzielt werden können, wenn eine sorgfältig zusammengestellte Gruppe von Wissenschaftlern einen Sommer lang gemeinsam daran arbeitet.”. 65 Jahre später haben wir zwar durchaus Erfolge und Fortschritte im Bereich KI vorzuzeigen, aber vom Verständnis menschlichen Denkens und Lernens sind wir immer noch weit entfernt.

Zeit für einen Neustart, dachten sich über 100 Forscher, Postdocs und Studenten der Stanford University und erklärten, dass es einen „umfassenden Paradigmenwechsel in der KI“ geben muss. Sie haben in einem 200-seitigen Report die neue Idee der Foundation Models eingeführt. Ein Foundation Model ist dabei die gemeinsame Grundlage, auf der viele aufgabenspezifische Modelle durch Anpassung aufgebaut werden. Oder praktischer, ein Large Language Model (LLM) wie GPT-3, das dann für weitere Aufgaben gefinetuned wird, was die Idee dann nicht mehr so neu erscheinen lässt. Das LLMs starke Limitierungen haben, wurde in vergangenen Ausgaben bereits diskutiert und so wird auch der Stanford Vorstoß von Teilen der Wissenschaft kritisch gesehen. Sich nur auf LLMs zu fokussieren limitiert die Forschung immens und ignoriert Fragen wie Ethik, Erklärbarkeit und auch Verlässlichkeit. Die Idee der Foundation Models auf den Menschen angewandt, würde bedeuten, dass alle Menschen im allgemeinen ein gleiches Grundmodell haben, das durch Lebenserfahrung, Ausbildung etc. gefinetuned wird. Ob das die Lösung für die Frage ist, was eigentlich Intelligenz ausmacht, darf wenigstens angezweifelt werden und so bleibt uns nur auf erfolgreichere weitere 65 Jahre KI Forschung zu hoffen.

KI und Arbeit

Einen interessanten Gedanken zur Zukunft der Arbeit präsentiert der Artikel AI Won’t Steal Your Job, But It’ll Sure Make It Suck. Unbestritten ist der Einfluss neuer Technologien auf die Arbeitswelt. Schon immer haben neue Technologien die Arbeitswelt und die Welt insgesamt verändert. AI ist hier keine Ausnahmen. Ein Argument für den Einsatz neuer Techniken ist dabei, dass dadurch die Arbeit für den Menschen vereinfacht wird. Der Artikel zeigt an drei anschaulichen Beispielen, dass diese Verbesserung nicht für alle Teile an der Arbeit Beteiligten gilt. So profitieren wir als Endnutzer von schnelleren und einfacheren Lieferdienstmöglichkeiten. In Städten wie Berlin ist es möglich, sich innerhalb von 10 Minuten einen Einkauf nach Hause liefern zu lassen. Nach wenigen Klicks hat man das erledigt und der Einkauf steht kurz danach vor der Tür. Ein positives und vor allem nutzerfreundliches Erlebnis. Für die Lieferdienstfahrer hingegen sieht die neue Welt bei weitem nicht so gut aus. Anstatt von einem menschlichen Vorgesetzten Aufträge zu bekommen, und mit diesem auch bei Problemen Rücksprache halten zu können, kommen die Aufträge von einem unerbittlichen, sich an definierte Regeln haltenden ‘Phantom Boss’. Dabei werden Fahrer, die zum Beispiel durch nicht selbstverschuldete Unfälle Lieferungen nicht ausliefern konnten abgestraft und kriegen weniger Aufträge oder schlechtere Liefergebiete. So führt die Technik, die für den Endnutzer ein rundum positives Erlebnis liefert, zu mehr Jobs. Leider aber zu mehr schlechten Jobs.

Suche ist ein ungelöstes Problem…

diesen Worten von Googles SVP Prabhakar Raghavan stimmen wir sofort zu. Um das Problem aber wenigsten in Teilen zu verbessern, präsentierte Google auf dem Search On Event einige Neuheiten, die uns in Zukunft die Suche mit Google erleichtern sollen. Im Fokus dabei multimodale Anfragen, eine Kombination aus Wort und Bild, Kontextinformationen zu zum Beispiel Videos und eine verbesserte E-Commerce Suche, die auch mit anzeigt, ob der Gegenstand verfügbar ist.

Datum: 30.09.2021

Autor

Dr. Till Plumbaum

Till Plumbaum verantwortete als COO die Bereiche KI, maschinelles Lernen, natürliche Sprachverarbeitung (NLP), Personalisierung, Empfehlungssysteme, Suche und Information Retrieval.