Spracherkennung

    Aus WISSEN-digital.de

    Allgemeines

    Bei der Spracherkennung handelt es sich um ein Verfahren zur Verarbeitung der natürlichen menschlichen Sprache durch Computer, das im Prinzip untrennbar mit der Spracheingabe verbunden ist. Es wird unter anderem bei Diktiersystemen und bei Zugangskontrollen verwendet.

    Zur Spracherkennung werden die analog vorliegenden Töne der Sprache aufgenommen, digitalisiert und verarbeitet, z.B. durch Vergleich mit gespeicherten Mustern, einem Referenz-Vokabular. Alternativ werden für die Erkennung auch statistische Verfahren benutzt, die die Häufigkeit von Lautfolgen berücksichtigen (Hidden-Markov-Modellierung).

    Bei der Spracherkennung geht es einerseits um das Steuern von Computern und anderen Geräten durch natürliche Sprache. Andererseits geht es um das Aufnehmen und Verarbeiten von Diktaten. Viele Programme bieten beide Funktionen an. Das Erkennen funktioniert zum Teil nur eingeschränkt, da die menschliche Sprache sehr komplex ist und es viele Besonderheiten der Aussprache gibt (etwa: Dialekte, Emotionen, Erkältungen).

    Verschiedene Systeme

    Es gibt Spracherkennungs-Systeme verschiedener Kategorien. Die einfachsten benötigen Pausen zwischen den Wörtern, die sie erkennen sollen (so genannte diskrete Sprechweise). Leistungsfähigere Programme erlauben kontinuierliches Diktieren, also eine natürliche Sprechweise. Die Software muss zudem auf den jeweiligen Sprecher trainiert werden. Leistungsfähigere Produkte unterliegen diesen Einschränkungen nur noch teilweise oder gar nicht mehr. Sie haben dafür aber in der Regel einen kleineren Wortschatz.

    Anwendungen

    Aktuelle Einsatzgebiete der Spracherkennung sind: Eingabe von Zahlen und Wortlisten, z.B. Telefonlisten, Angeben von Rufnummern (auch bei Telefonen mit Spracherkennungs-Chip) und Kreditkartennummern, auch Word Spotting (Herausfischen von Schlüsselwörtern), z.B. bei Gesprächsüberwachung. Texterfassungs- und Diktatsysteme sind aktuell v.a. dort interessant, wo es einen klar eingegrenzten Wortschatz gibt, z.B. in der Medizin (Röntgenärzte) oder Juristerei (Anwälte). Ein spezielles neues Gebiet der Spracherkennung ist die Identifizierung von Personen, z.B. bei Zugangskontrollen. So existiert bereits eine Voice Security Card, die Personen durch ihrer Stimme identifiziert.

    KALENDERBLATT - 24. Juli

    1923 Der Friede von Lausanne revidiert den Friedensvertrag von Sèvres (10. August 1920), durch den die Türkei fast alle europäischen Gebiete an Griechenland verloren hatte.
    1929 Japan hinterlegt als letzter Unterzeichnerstaat die Ratifikationsurkunde des Kellogg-Paktes. In ihm wird der Krieg als Mittel zum Lösen internationaler Streitfälle verurteilt und die friedliche Beilegung angestrebt.
    1939 Frankreich, England und Russland unterzeichnen einen Beistandspakt, der aber schon einen Monat später durch den Hitler-Stalin-Pakt jede Wirksamkeit verliert.



    Olé, olé, olé olé!

    Sie kennen sich aus im grenzenlosen Reich von König Fußball? Na, dann schießen Sie mal los ...
    Jetzt quizzen!