https://bodybydarwin.com
Slider Image

Samsungs neuer digitaler Assistent, Bixby, versucht, die Spracherkennung auf eine echte KI zu lenken

2022

Die Verwendung von Sprachbefehlen mit einem Smartphone ist nichts Neues. Der neue digitale Assistent von Samsung, Bixby, geht jedoch über die Spracherkennung hinaus und integriert tiefgreifendes Lernen und erweiterte visuelle Suche, damit er sich wie ein echter digitaler Assistent auf Ihrem Gerät anfühlt.

Bixby zieht sofort Vergleiche mit Apples Siri und Googles Assistent, aber während wir diese häufig als einfache Stimmen betrachten, beschreibt Samsung, dass Bixby eine eigene kartenbasierte visuelle Schnittstelle hat, um Informationen zu übermitteln. Die Stimme ist nur ein Teil der Gleichung. Die anderen Aspekte sind Visionen (wie das Scannen eines QR-Codes mit der Kamera, das Ermitteln der Kosten eines Buches anhand des Umschlags oder das Übersetzen von Texten), Erinnerungen und Empfehlungen. Bixby ist der Überbegriff für diese vier intelligenten Funktionen.

Sriram Thodla, Senior Director bei Samsung, der sich mit Intelligenz und dem Internet der Dinge befasst, stellte Bixby am Mittwoch während der Ankündigungsveranstaltung für das Galaxy S8 und S8 + der Öffentlichkeit vor. „Bixby versteht den Kontext, sagte er. "Es weiß, was auf Ihrem Bildschirm passiert."

Sie können ihn beispielsweise bitten, einen Screenshot Ihrer Arbeit zu machen und dieses Bild dann an einen Kontakt zu senden. Diese Art komplexer Anfragen, die sich über mehrere Apps und Dienste erstrecken, hat sich in der Vergangenheit für digitale Assistenten als problematisch erwiesen.

„Wir sagen, Bixby ist eine intelligente Benutzeroberfläche“, sagte Mok Oh, Vice President für Servicestrategie bei Samsung, in einem Interview bei einer Presseveranstaltung am Montag.

Oh, die Vollständigkeit von Bixby wird angepriesen, was bedeutet, dass, wenn eine App Bixby-fähig ist, alles, was Sie mit Berührung tun können, auch über Sprache erfolgen kann. Sie könnten beispielsweise Bixby auffordern, die Anzeigesprache Ihres Telefons auf eine andere Sprache umzustellen, und Bixby sollte dies tun. Der Assistent ist auch "kognitiv verzeihend", sagte Oh, daher sollte er mit Mehrdeutigkeiten bei Anfragen umgehen können.

Oh fuhr fort, um die Foto-App des Telefons mit dem Namen Galerie und den Tausenden von verschiedenen Kombinationen von Aufgaben, die ein Benutzer darin ausführen konnte, hervorzuheben. Es gibt unzählige Möglichkeiten, wie ein Benutzer ein Bild beschneiden oder bearbeiten kann, und Bixby sollte in der Lage sein, damit umzugehen.

"In vielerlei Hinsicht wenden wir Deep Learning-Technologie an", sagte Oh zu Bixby. Ein Aspekt davon ist, dass Bixby den Benutzern nach der Bearbeitung einer Anfrage die Option "Daumen hoch" oder "Daumen runter" gibt, um Bixby mitzuteilen, wie es funktioniert hat, und ihm beim Lernen zu helfen. "Tatsächlich wenden wir das Lernen auf viele, viele verschiedene Aspekte unseres gesamten Technologie-Stacks an", fügte er hinzu.

Diese Daumen-nach-oben- oder Daumen-nach-unten-Funktion ist für virtuelle Agenten wie Bixby, Alex Rudnicky, ein Forschungsprofessor für Informatik an der Carnegie Mellon University, der sich auf Sprache konzentriert, von entscheidender Bedeutung. "Sie benötigen eine Art Verstärkung, die es dem System grundsätzlich ermöglicht, die Verbindung zwischen dem, was der Benutzer will, und dem, was tatsächlich passiert, grundlegend zu verstehen", sagte er. »Realistisch gesehen wird der Agent eine Menge Fehler machen.«

Die Alexa-App von Amazon hat eine ähnliche Funktion: Sie fragt den Benutzer, ob er das getan hat, was er wollte.

Zusätzlich zu seinen Hörfähigkeiten kann Bixby auch in die reale Welt sehen. Mit der integrierten Kamera des S8 kann Bixby Objekte in einer Szene erkennen und nach Informationen zu diesem Produkt sowie verwandten Produkten suchen. Natürlich können Sie sie auch bei Samsung-Partnern kaufen. Dies ist eine Funktion, die Siri derzeit nicht anbietet, und Google Assistant häufig, um gemischte Ergebnisse zu erzielen. Diese Art der Interaktion im Augmented Reality-Stil ist jedoch ein logischer Schritt für AI als persönlicher Assistent.

Für die visuelle Suche hat Samsung verschiedene Partnerunternehmen wie Amazon zum Einkaufen und Foursquare für standortspezifische Funktionen ausgewählt (Thodla verwendete ein Beispiel, in dem er ein Bild von New Yorks legendärem Flatiron-Gebäude machte und sich darüber informierte) gute Verpflegungsmöglichkeiten in der Umgebung) und Google Translate zur Interpretation von Zeichen in verschiedenen Sprachen.

Schließlich sollte Bixby auch Situationsmuster aufgreifen, sagte Oh; Wenn Sie normalerweise telefonieren, während Sie von der Arbeit nach Hause fahren, übernimmt der Assistent dies möglicherweise und empfiehlt Ihnen, dies zu tun. Thodla hat diesen Punkt auch während der Enthüllung des Geräts angesprochen und gesagt, dass Bixby einen Uber vorschlagen könnte, wenn er bemerkt, dass Sie normalerweise zu einer bestimmten Zeit einen nehmen.

Bixby verfügt über einen eigenen Startbildschirm, auf dem Informationen zur typischen Verwendung gespeichert werden. Informationen aus verschiedenen Apps werden auf Karten angezeigt und diejenigen, die für sie am relevantesten sind, werden nach oben verschoben. Am Morgen werden also Dinge wie Wetter und E-Mail priorisiert, während in der Nacht soziale Medien an die Spitze gerückt werden. All dies ist jedoch variabel, da Bixby Feedback vom Benutzer erhält.

Im Allgemeinen ist es laut Kris Bondi, dem Chief Marketing Officer bei Neura, Mustererkennung und Situationsbewusstsein, bei denen ein virtueller Assistent Vorschläge macht, die einfache Spracherkennung und Konnektivitätsfähigkeiten von künstlicher Intelligenz trennen. Neura stellt eine KI-Engine her, die sich auf die Personalisierung und Identifizierung von Kontexten und Momenten im Leben eines Benutzers konzentriert.

Wissenschaftler haben eine faszinierende neue Methode, um das Alter von Skelettresten zu bestimmen

Wissenschaftler haben eine faszinierende neue Methode, um das Alter von Skelettresten zu bestimmen

Ein japanisches Raumschiff zoomt auf einen Asteroiden zu, der wie ein Edelstein geformt ist

Ein japanisches Raumschiff zoomt auf einen Asteroiden zu, der wie ein Edelstein geformt ist

Paläontologen wissen endlich, wie dieses uralte gepanzerte Reptil aussah

Paläontologen wissen endlich, wie dieses uralte gepanzerte Reptil aussah