Ein Angebot von

Spracherkennung

IBM erreicht Meilenstein bei der Erkennung natürlicher Sprache

| Redakteur: Franz Graser

Bei der Spracherkennung geht es darum, analoge akustische Äußerungen digital verständlich zu machen. IBM hat hier nach eigenen Angaben einen neuen Bestwert erzielt, sagt aber auch, dass es noch viel zu tun gebe.
Bei der Spracherkennung geht es darum, analoge akustische Äußerungen digital verständlich zu machen. IBM hat hier nach eigenen Angaben einen neuen Bestwert erzielt, sagt aber auch, dass es noch viel zu tun gebe. (Bild: Clipdealer)

Der amerikanische IT-Konzern hat nach eigenen Angaben einen neuen Rekord bei der Spracherkennung durch Computer erreicht. Big Blue konnte die Fehlerrate bei der Worterkennung auf 5,5 Prozent reduzieren und bewegt sich damit in etwa auf demselben Niveau wie wir Menschen. Das Endziel sei aber noch nicht erreicht, heißt es.

George Saon, Principal Research Scientist bei IBM, schreibt in einem Weblog-Eintrag, dass die menschliche Fehlerrate bei der Worterkennung zwischen fünf und zehn Prozent liege: „Je nachdem wen Sie fragen, verstehen Menschen ein oder zwei von zwanzig Worten, die sie hören, nicht. Für die meisten von uns ist das kein Problem. Stellen Sie sich aber vor, wie schwierig das für einen Computer sein muss.“

Die Worterkennungsquote eines Menschen zu erreichen, so Saon, sei schon lange Zeit das ultimative Ziel der Industrie. Ein Mitbewerber – gemeint ist Microsoft – habe bereits im vergangenen Jahr behauptet, diese Marke erreicht zu haben. Microsoft nahm im Oktober 2016 für sich in Anspruch, die Fehlerrate auf 5,9 Prozent gedrückt zu haben und sich damit auf dem Level menschlicher Spracherkennung zu bewegen.

IBM-Mann Saon sagt jedoch: „Bei uns knallen noch keine Sektkorken.“ Big Blue verortet die Parität mit den Menschen bei einer Fehlerrate von 5,1 Prozent. Zu dieser Erkenntnis sei IBM im Laufe seiner Forschungsarbeiten gekommen.

Das Ergebnis von 5,5 Prozent will der IBM-Researcher jedoch nicht kleinreden: „Wir haben einen großen Durchbruch erzielt. Aber wir haben ein gutes Stück Weg zurückzulegen, bevor wir behaupten können, bei der Spracherkennung denselben Level wie Menschen erreicht zu haben.“ Saon zitiert Yoshua Bengio vom Montreal Institute for Learnung Algorithms (MILA), der dieselbe Meinung vertritt.

IBM sei aber auf einem guten Weg, so Bengio, indem das Unternehmen neurale Netze und Deep-Learning-Methoden verwende, um die Spracherkennung zu verbessern. IBM-Mann Saon zitiert zudem Julia Hirschberg, Leiterin des Departments of Computer Science an der Columbia University. Sie sagt: „Menschliche Sprache ist extrem komplex, gerade auch bei spontanen Konversationen. Es ist auch schwierig, das menschliche Sprachverständnis zu definieren, da die Fähigkeit der Menschen, andere zu verstehen, schwankt.“

„Wenn wir automatische Spracherkennung und menschliches Sprachverständnis miteinander vergleichen, dann ist es sehr wichtig, die Leistung des automatischen Systems und das menschliche Verständnis auf dasselbe Sprechbeispiel zueinander in Beziehung zu setzen“, so Professorin Hirschberg. Vor diesem Hintergrund habe IBM sich um die Verbesserung der Messtandards SWITCHBOARD und CallHome verdient gemacht.

Erst im Dezember, so Saon, sei der IBM-Dienst Watson Speech to Text um die sogenannte Diarization ergänzt worden. Das erlaubt es, verschiedene Sprecher auseinanderzuhalten und deren Eigenheiten in die Spracherkennung einzubeziehen. „Unser Fortschritt motiviert uns natürlich“, schließt Saon, „aber unsere Arbeit hängt von weiterer Forschung ab – und davon, uns mit den höchsten Standards messen zu lassen.“

Softwaretechnik für pilotiertes Fahren

Automotive

Softwaretechnik für pilotiertes Fahren

27.02.17 - Die erfolgreiche Implementierung von pilotierten Fahrfunktionen erfordert neue Konzepte und Ansätze in der Automotive Softwareentwicklung. Insbesondere werden Methoden aus dem Bereich der Künstlichen Intelligenz die intelligenten Systeme im Automobil vorantreiben. lesen

Wie sich das menschliche Gehirn im Computer nachbilden lässt

Künstliche Intelligenz

Wie sich das menschliche Gehirn im Computer nachbilden lässt

07.02.17 - Die Herausforderung, die Komplexität des menschlichen Gehirns im Computer nachzubilden, hat eine neue Generation von Wissenschaftlern und Entwicklern von Computeralgorithmen hervorgebracht. lesen

Ist Künstliche Intelligenz dümmer als gedacht?

Deep Learning

Ist Künstliche Intelligenz dümmer als gedacht?

22.07.16 - Glaubt man Hollywood oder den Prognosen aus dem Silicon Valley, dann sind Artifical-Intelligence-Systeme (AI) in greifbarer Nähe. Die Ergebnisse der Winograd Schema Challenge, einem erweiterten Turing-Test für künstliche Intelligenzen, zeichnet allerdings ein anderes Bild. lesen

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Ausklappen
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Ausklappen
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44572743 / KI)