Künstliche Intelligenz für Raumschiff und Cheeseburger

Microsoft bringt neue Werkzeuge für Künstliche Intelligenz und nennt Anwendungsbeispiele.

Recent Posts

Microsoft bringt neue Werkzeuge für Künstliche Intelligenz und nennt Anwendungsbeispiele.

Künstliche Intelligenz – ein Trendthema, das durch die Medien geistert. Die Palette der Szenarien reicht von gescheiten Websites, die Besucher eigenständig herumführen und Fragen beantworten, bis zu selbstfahrenden Autos. Google, Facebook und Apple sind nur drei Beispiele für Großkonzerne, die Anwendungen in diesem Bereich weiterentwickeln. Auch Microsoft will da nicht zurückstehen, soeben hat der US-Konzern angekündigt, neue Tools für die Integration von künstlicher Intelligenz (KI) in eigene Anwendungen zur Verfügung zu stellen.

Konkret geht es um drei neue Cognitive Services:

  • Der ab sofort verfügbare Custom Speech Service soll Sprache in unterschiedlich lauten Umgebungen sowie dialektisch, mundartlich oder fachlich gefärbte Formulierungen erkennen können.
  • Der Content Moderator erlaubt es, Texte, Bilder oder Videos nach unerwünschtem Material zu durchsuchen und unter anderem Gewaltszenen oder hetzerische Sprache herauszufiltern.
  • Die Bing Speech API verwandelt Audiomaterial in Text, soll sogar den Inhalt solcher Texte verstehen und Texte in gesprochene Sprache zurückverwandeln können.

Content Moderator und Bing Speech API sollen ab März verfügbar sein, heißt es seitens Microsoft. Nichts weniger als die KI „demokratisieren“ soll die Microsoft-Mission sein. „Künstliche Intelligenz wird uns helfen, aus den vielen Informationen und Daten, die heute auf uns einwirken, Sinn und Wissen zu generieren und so mehr zu erreichen“, sagt Georg Droschl, Leiter des Geschäftsbereichs Cloud & Enterprise bei Microsoft Österreich. Die neuen Cognitive Services seien ein weiterer Schritt auf dem Weg, dass „Menschen und künstliche Intelligenz möglichst reibungslos und effizient zusammenarbeiten können“.

Einsatz in der Praxis

Was bringt das aber konkret in der Praxis? Integration einer funktionierenden Sprachsteuerung soll es beispielsweise in Virtual-Reality-Games erlauben, Spielern die Kontrolle über den Fortgang einer Geschichte zu geben. Ein Beispiel dafür ist das Game „Starship Commander“ von Human Interact (siehe Video unten): Dafür werden die „Cognitive Services“ von Microsoft für die Sprachsteuerung von Raumschiffen verwendet, man greift also aktiv ins Geschehen ein. Zudem kommt ein sogenanntes „Language Understanding Intelligent Service“ zum Einsatz, um zu verstehen, was genau mit Befehlen wie „Raus hier!“ gemeint sein könnte. Das VR-Spiel soll für Oculus und Steam veröffentlicht werden, ein Datum dafür gibt es aber noch nicht.

Sprache erkennen

Der Hintergrund: Moderne Spracherkennung braucht statistische Modelle, die unter anderem Machine Learning nutzen, um aus der riesigen Menge von Daten genaue Übersetzungen gesprochener Wörter herzustellen. Mit Hilfe der entsprechenden Services ist es nun möglich, akustische Modelle zu bauen, die aus kurzen Audioschnipseln Phoneme oder Toneinheiten in einer gegebenen Sprache erkennen. McDonald’s setzt die Spracherkennung bei seinen Drive-ins ein – damit der Cheeseburger tatsächlich als solcher verstanden wird.

Bild oben: Screenshot aus Trailer "Starship Commander" von Human Interact.