Der Samantha-Effekt: Ein genauerer Blick in die Zukunft der Bots

2013 veröffentlichte Spike Jonze das Indie-Sci-Fi-Drama-Romcom 'Her'.

Der Film folgt der Entwicklung des ersten künstlich intelligenten Betriebssystems der Welt, 'Samantha'.

Abgesehen von den Referenzen von Scarlett Johansson ist Samantha der Tagtraum eines jeden Entwicklers: das perfekte Beispiel für „echte“ künstliche Intelligenz (KI). Als beeindruckende Gesprächspartnerin versteht sie den Kontext, die natürliche Sprache, die Emotionen und den gesunden Menschenverstand.

Offensichtlich sind moderne Bots nicht ganz auf Samanthas Niveau. Bestenfalls können sie über eine Konversationsschnittstelle bestimmte Ergebnisse liefern. Im schlimmsten Fall schmeißen sie Ihr Telefon frustrierend gegen die Wand.

Könnten wir uns angesichts der blitzschnellen Entwicklung der Technologie einer Ära nähern, in der es einen Samantha-ähnlichen Bot geben könnte?

Emotional intelligente Daten

Die heutige KI kombiniert symbolische Verarbeitung (KI unter Verwendung expliziter Regeln und Logik) mit maschinellem Lernen auf eine Weise, die ihre jeweiligen Stärken ausnutzt und ihre Schwächen verringert.

Mit der symbolischen Verarbeitung können wir beispielsweise Kenntnisse und Verhaltensweisen festlegen, die möglicherweise nur schwer aus Daten zu lernen sind. Maschinelles Lernen ergänzt dies, indem es dem System hilft, sich an unerwartete Situationen und neue Konzepte anzupassen.

Diese Kombination hat auch nützliche Eigenschaften, die über die Beschleunigung des Lernprozesses hinausgehen. In Zukunft könnte es uns die Möglichkeit geben, menschlicher mit Bots zu interagieren.

Denn maschinelles Lernen ist trotz aller verlockenden Eigenschaften im Grunde immer noch ein statistischer Prozess. Dies bedeutet, dass es die Qualität der Daten widerspiegelt, von denen es abhängt.

Dies ist ein Segen und ein Fluch. Die Sensibilität des maschinellen Lernens für die Eigenschaften seiner Eingabedaten bedeutet, dass es leicht das Falsche lernen kann, wie im Fall von Tay, Microsofts eigenem rassistischen Roboter, gezeigt wurde.

Es wurde auch argumentiert, dass die Daten, die für maschinelles Lernen ausgewählt werden, häufig die unbewussten Vorurteile des Forschers / Entwicklers (normalerweise junge weiße Männer) widerspiegeln.

Um Samanthas Fähigkeit zur Selbstbeobachtung und zum Denken zu erreichen, müssten wir eine Art künstliche emotionale Intelligenz in unsere Bots programmieren: damit sie antworten können

"Warum hast du dich dafür entschieden?"

Und selbst heutige relativ einfache Systeme unternehmen Schritte, um individualistische Antworten auf Fragen zu synthetisieren.

In der Zwischenzeit ist es jedoch am nächsten an emotional intelligenten Maschinen, sicherzustellen, dass wir unsere Algorithmen für maschinelles Lernen auf qualitativ hochwertige Daten in einer genau überwachten Umgebung anwenden.

Das Semantic Web

Der Schöpfer des World Wide Web, Tim Berners-Lee, war der Zeit weit voraus, als er 2001 das Semantic Web vorschlug:

"Ein System, mit dem Computer aus den Beziehungen zwischen Ressourcen im Web auf die Bedeutung schließen können".

Im Wesentlichen könnten Maschinen Ideen, Konzepte und Fakten anstelle von Dokumenten und Seiten miteinander verknüpfen.

Dies würde es Samantha-ähnlichen "Computerassistenten" ermöglichen, Informationen über uns zu "lesen" und in unserem Namen zu arbeiten: Autonome Planung unserer Termine, Organisation unserer Reisen, Reservierung von Abendessen. Hallo, PA unserer Träume.

Berners-Lees Vision wurde bereits in gewissem Umfang durch Googles Knowledge Graph verwirklicht, wonach Google Tausende von Personen einstellen musste, um explizite Regeln in eine symbolische Darstellung des gesunden Menschenverstandes einzugeben.

Auf diese Weise kann Google Fragen mit einer kleinen Box strukturierter Daten (unten) beantworten und nicht nur mit einer Liste von Webseiten.

Bilderkennungstechnologien könnten auch ein Vorläufer des Semantic Web sein. Diese KI kann bereits Schlüsselwörter, demografische Daten, Farben und Gesichter in Bildern erkennen.

Natürliche Spracherkennung

Die Fähigkeit, natürliche Sprache zu verstehen, ist für einen erfolgreichen Bot von zentraler Bedeutung. mit Text, aber auch mit Spracherkennung.

Idealerweise sollte ein Bot in der Lage sein, sein Ziel zu erreichen, indem er die Konversationslücken automatisch ausfüllt.

Siri, Cortana und Alexa entsprechen noch nicht ganz Samanthas Maßstäben. Aber ihre Leistung in diesem Bereich scheint nicht unerreichbar.

Die Fehlerraten bei der Spracherkennung sinken jedes Jahr um etwa 20%, wobei Google kürzlich nur 4,1% erreicht hat - fast so genau wie beim Menschen.

Diese Verbesserungen sind auf eine Reihe von Innovationen zurückzuführen: Multi-Mikrofon-Arrays, Richtstrahlen, ausgefeilte Rauschverarbeitung und die Anwendung von Sprachbiometrie.

Die auditive Szenenanalyse ist eine weitere vielversprechende Technik, mit der versucht wird, verschiedene Schallquellen zu trennen.

Die Spracherkennung profitiert auch von dem immer größeren Datenpool, der zum Trainieren statistischer Modelle mithilfe maschineller Lerntechniken verwendet wird. Eines davon wird als Deep Neural Networks (DNNs) bezeichnet.

DNNs bestehen aus mehreren verbundenen Schichten von Verarbeitungseinheiten, die von den neuronalen Netzen des menschlichen Gehirns inspiriert sind.

Sie können eine Vielzahl von Eingaben - Bilder, Wortsequenzen, Orte und Sprachäußerungen - in gewünschte Kategorien wie Wörter, Objekte und Bedeutungsdarstellungen einteilen.

Kontext und Abstraktion

Die Art des Denkens, die wir als Menschen machen, hängt davon ab, den Kontext zu verstehen und Schlussfolgerungen zu ziehen. Manchmal sind diese logisch, aber meistens basieren sie auf unserem allgemeinen Wissen über die Welt: zu erkennen, dass X wahrscheinlich zu Y führen wird.

Bei der Anwendung auf KI sollte der ideale virtuelle Assistent in der Lage sein, Alternativen vorzuschlagen, wenn er mit einer Einschränkung konfrontiert ist, verschiedene Möglichkeiten in Betracht zu ziehen und deren Vorteile zu verstehen:

Ich: "Ich möchte heute ein paar Schuhe bei Melissa kaufen."
Bot: Entschuldigung, Melissa ist geschlossen. Warum probierst du nicht Office aus, das ähnlich und in der Nähe ist? “

Ein Bot könnte diese Assoziationen im Prinzip durch Versuch und Irrtum lernen, aber dies würde ewig dauern: Für jede Interaktion gibt es eine Million verschiedene Variationen.

Einige KI-Forscher glauben, dass der Schlüssel für Computer analog zu lernen ist. Es ist diese Fähigkeit, die es dem Menschen ermöglicht, von einer Situation in eine andere zu verallgemeinern und vom Kontext zu einer höheren Ebene des Verstehens zu abstrahieren

Menschlich klingende Bots

Die emotionale Reichweite und Beugung in Samanthas Stimme ist immer noch außerhalb unserer Reichweite, aber neue Sprachgenerierungsmodelle wie Google WaveNet können "unheimlich überzeugende" künstliche Stimmen erzeugen.

Kein Roboter mehr, Siri.

Eine natürlich klingende Stimme erhöht massiv unseren Eindruck von der Intelligenz einer Maschine. Dies hat den Nachteil, dass die Erwartungen im Namen des Benutzers steigen und möglicherweise zu Konversationsfehlern und Frustrationen führen.

Und wir alle wissen, wie viel weniger Geduld wir mit einer Maschine haben als mit einem Menschen…

Unabhängig davon, ob ein Bot unsere Erwartungen erfüllen kann oder nicht, sind wir geneigt, auf Maschinen zu vertrauen, die menschliches Verhalten zeigen (Wortspiel, Wortspiele, Witze, Zitate und emotionale Schlussfolgerungen).

Dies erinnert an den Turing-Test, bei dem ein menschlicher Richter ein Gespräch mit einem anderen Menschen und einer Maschine führt. Wenn der Richter die Maschine nicht vom Menschen unterscheiden kann, hat die Maschine den Test bestanden.

Einblicke

Kann KI uns helfen, Einsichten zu entwickeln?

Ein Einblick gibt Ihnen im Kern etwas Neues und Wertvolles. Am wichtigsten ist jedoch, dass es bei zukünftigen Entscheidungen und Aktionen hilft - etwas, das für Software schwer zu verstehen ist.

Wir kennen eine Einsicht, wenn wir sie sehen, aber es ist schwierig, scharfe Grenzen zu definieren oder zu ziehen. Um einen Einblick zu gewinnen, müssen Muster, Beziehungen und Korrelationen identifiziert werden.

Einige maschinelle Lernprojekte haben sich bereits mit diesem Bereich befasst.

Zum Beispiel ist Googles Deep Mind (der auch DNNs verwendet) gut darin, neue Muster zu identifizieren, und zwar auf einer Komplexitätsebene, die in einem Fall (das Spiel Go) die von Menschen übertrifft. Techniken wie diese funktionieren jedoch nur, wenn wir der Maschine mitteilen, was das Ziel ist (in diesem Fall: das Spiel gewinnen).

Nur Menschen können neue Muster identifizieren, die ohne ein vorgegebenes Ziel interessant sind. Eine Maschine kann Muster identifizieren, wenn sie das Ziel versteht. Nur Menschen können Muster kreativ identifizieren.

Andererseits besteht ein Problem, mit dem Menschen konfrontiert sind, darin, dass wir uns auf viele Informationen verlassen, wenn wir uns auf eine bestimmte Aufgabe konzentrieren. Einige dieser Informationen wurden unbewusst durch Erfahrung gewonnen; einiges davon durch bewusstes Lernen.

Mit zunehmendem Informationsvolumen wird die Menge, die wir durchsehen können, proportional immer geringer.

Hier haben also Maschinen einen Vorteil. Sie können besser mit riesigen Datenpools umgehen.

Wenn wir diese Daten zusammenstellen und integrieren, können Maschinen in den Bereichen, in denen wir Probleme haben, mit uns zusammenarbeiten.

Derzeit liegen die meisten digitalen Informationen in Form von Text vor - das heißt, die Daten sind unstrukturiert und nicht die strukturierten Daten, die in herkömmlichen Datenbanken enthalten sind.

Textdaten

Dies führt uns in den Bereich des maschinellen Lesens, der sich in den letzten 20 Jahren aus den Forschungslabors in kommerzielle Anwendungen verlagert hat.

Automatisierte Techniken zum Verständnis geschriebener Texte sind zwar noch lange nicht perfekt, aber in letzter Zeit schnell gereift, was durch neue Entwicklungen in der KI gefördert wurde.

Hier ist ein Beispiel.

Ein Patient betritt eine Arztpraxis mit einer seltenen Krankheit, mit der der Arzt nicht vertraut ist. Der Arzt konsultiert seinen digitalen Assistenten, der alle medizinischen Fachzeitschriften, Fakten und Informationen, die jemals über die Krankheit geschrieben wurden, in Sekundenschnelle scannt.

Anschließend werden diese Informationen zusammengefasst und dem Arzt in mundgerechten Stücken präsentiert.

Maluuba, ein kürzlich von Microsoft erworbenes Deep-Learning-Startup, versucht, eine „Alphabetisierungsmaschine“ zu entwickeln, die Text lesen und auf dieser Basis lernen kann, zu kommunizieren.

Im Wesentlichen können Computer riesige Textmengen auf eine Weise erfassen, kuratieren und zusammenfassen, von der wir niemals träumen könnten.

Und wir müssen keine hochtechnischen Computerprogrammiersprachen oder Datenbankabfragen verwenden, um zu sagen, wonach wir suchen: Kürzlich entwickelte Systeme können auch natürliche Sprache verwenden, um Fragen zu einem Text zu stellen.

Dies ist uns bis zu einem gewissen Grad bereits bekannt, da wir Abfragen in Google eingeben (die automatische Vervollständigung macht dies noch einfacher).

All dies macht Bots zu einem natürlichen Erben dieser Tradition.

Der letzte Coup de Grace ist, dass wir jetzt Personalisierung durch Apps haben, die durch Interaktion lernen.

Zum Beispiel entwickelt Replika eigenwillige Sprachmuster, die auf dem Scannen vergangener Chat-Sitzungen basieren und ein Wissen über die Vorlieben und Prioritäten eines Benutzers schaffen.

Und das bringt uns sehr nahe an das Territorium von Samantha.

KI-gesteuerte menschliche Intelligenz

Während der ersten industriellen Revolution begannen Maschinen, Handarbeit zu übernehmen.

Mit Industrie 4.0 übernehmen sie heute auch die manuelle geistige Arbeit.

Fast jede routinemäßige Aufgabe kann automatisiert werden.

Und als Verkäufer und Vermarkter gibt es viele alltägliche Aufgaben, von denen wir uns gerne entlasten würden, wie zum Beispiel:

… Dateneingaben manuell eingeben, nach Themen und Ideenartikeln suchen, durch endlose E-Mails waten…

Indem wir diese an einen künstlich intelligenten „Geist“ weitergeben, können wir unsere Bemühungen auf Bereiche konzentrieren, in denen wir (als Menschen) herausragende Leistungen erbringen und die uns (als Menschen) von Maschinen unterscheiden.

Dies war unser Ausgangspunkt für die Entwicklung von GrowthBot, unserem Vertriebs- und Marketing-Bot, mit dem Sie Ihr Geschäft ausbauen können.

KI kann keine neuen Erkenntnisse hervorbringen; Aber es kann uns helfen, unsere Kreativität effektiver ins Spiel zu bringen.

Wir könnten uns eine Reihe von Daten, Beziehungen und Korrelationen ansehen und denken, wir sehen etwas Neues, etwas, das uns hilft, die Welt besser zu verstehen.

Das ist es doch, was Menschen gut können.

Aber ist diese Einsicht nur eine Vermutung oder mehr? Hier können wir die Automatisierung anweisen, einzugreifen, Annahmen zu beseitigen und Transparenz zu schaffen.

So wie wir es sehen, ist der vielversprechendste Aspekt der KI nicht die Fähigkeit, einen lebensechten Begleiter wie Samantha zu replizieren - sondern die Verstärkung unserer eigenen Intelligenz als Menschen.

Danke fürs Lesen.

Wenn Ihnen dieser Artikel gefallen hat, können Sie auf diese Schaltfläche klicken, um anderen zu helfen, ihn zu finden.

.

Ursprünglich veröffentlicht auf blog.growthbot.org.