Alexa bekommt ein umfangreiches Update, das Gespräche mit der Sprach-KI natürlicher machen soll.

Alexa
George W. Bailey / Shutterstock.com

Auf dem Devices- & Services-Event hat Amazon neue Geräte und Software vorgestellt. Die wohl wichtigste Ankündigung war aber ein umfangreiches Update für Alexa. In Zukunft soll sich die Kommunikation mit der Sprach-KI grundlegend verändern. Vor allem soll sie natürlicher und menschlicher werden. Amazon hat dafür ein neues eigenes Sprachmodell entwickelt, das sich an KI-Vertretern wie ChatGPT oder Googles Bard orientiert. Mit dem großen Unterschied: Die Amazon-Software ist speziell für Sprachsteuerung optimiert, wie Hardware-Chef Dave Limp in Arlington im US-Bundesstaat Virginia erklärte.

Wie gewohnt soll sich mit Alexa möglichst alles im eigenen Zuhause steuern lassen, dies soll nun aber möglichst natürlich ablaufen. Das beginnt schon damit, dass man künftig nicht mehr für jede neue Spracheingabe die Aufforderung „Alexa“ sagen muss. Eine Unterhaltung wird stattdessen mit „Let’s chat“, also etwa „Lass uns plaudern“, begonnen. Von da an kann man sich dann mit Alexa wie mit einem Menschen unterhalten. Das führte Limp auf der Bühne vor, wie der Spiegel ausführt.

„Speech-to-Speech“ für schnellere Antworten

Limp fragt Alexa zum Beispiel, in welcher Form sein Lieblings-Footballteam gerade ist und bekommt von Alexa die richtige Antwort. Die KI weiß also aus vorangegangenen Fragen, was Limp sportlich besonders interessiert. Zudem soll Alexa eine natürlich wirkende Einladung für eine Grillparty formulieren. Die Ähnlichkeiten zu ChatGPT sind dabei frappierend, allerdings stets im sprachlichen Dialog und nicht per Texteingaben.

Hier kommt das neue Sprachmodell zum Tragen, das sich den Umweg über Text spart. „Anstatt die Audioanforderung eines Kunden zunächst mithilfe von Spracherkennung in Text umzuwandeln, dann mithilfe eines LLM eine Textantwort oder eine Aktion zu generieren und dann mit Text-to-Speech wieder Audio zu produzieren, wird dieses neue Modell diese Aufgaben vereinheitlichen und ein viel reichhaltigeres Gesprächserlebnis schaffen“, erklärte Rohit Prasad, Senior Vice President und Head Scientist, auf der Präsentation. Amazon nennt das Konzept „Speech-to-speech“.

Menschlich, emotional – und vorerst nur in den USA

Eine neue Version von Alexas Sprachausgabe soll zudem auch menschlicher, weniger technisch klingen, wie in Arlington vorgeführt wurde. Alexa wird künftig auch Pausen und Füllwörter wie „Ah“ oder „Ähm“ einbauen, wie es auch ein menschliches Gegenüber machen würde. Auch das Verständnis der KI soll steigen. Wer zum Beispiel Filme oder Serien sucht und die entsprechenden Titel nicht genau kennt, kann auch Eingaben wie „Du weißt schon, der Film mit Tom Cruise am Flugzeug“ ausprobieren und soll von Alexa die richtigen Antworten erhalten.

Dave Limp musste in seinem Gespräch mit Alexa zwar ab und zu Sätze wiederholen und Alexa reagierte ab und an verzögert, dies könne aber dem Spiegel zufolge auch am WLAN im Saal gelegen haben. Vorerst wird das alles aber ohnehin nur auf Englisch und in den USA funktionieren. Wann die neue Alexa auch nach Deutschland kommt, ist offen. Und übrigens auch, ob die neue Alexa-Version irgendwann kostenpflichtig wird. Alexa werde zwar vorerst weiterhin kostenlos nutzbar sein, in einem Interview mit The Verge schloss Limp aber nicht aus, für einen so fortschrittlichen digitalen Assistenten Gebühren zu verlangen.

/
Geschrieben von Christoph Pech




Kommentar schreiben

Sicherheitscode
Captcha aktualisieren