Spracherkennung

    Aus WISSEN-digital.de

    Allgemeines

    Bei der Spracherkennung handelt es sich um ein Verfahren zur Verarbeitung der natürlichen menschlichen Sprache durch Computer, das im Prinzip untrennbar mit der Spracheingabe verbunden ist. Es wird unter anderem bei Diktiersystemen und bei Zugangskontrollen verwendet.

    Zur Spracherkennung werden die analog vorliegenden Töne der Sprache aufgenommen, digitalisiert und verarbeitet, z.B. durch Vergleich mit gespeicherten Mustern, einem Referenz-Vokabular. Alternativ werden für die Erkennung auch statistische Verfahren benutzt, die die Häufigkeit von Lautfolgen berücksichtigen (Hidden-Markov-Modellierung).

    Bei der Spracherkennung geht es einerseits um das Steuern von Computern und anderen Geräten durch natürliche Sprache. Andererseits geht es um das Aufnehmen und Verarbeiten von Diktaten. Viele Programme bieten beide Funktionen an. Das Erkennen funktioniert zum Teil nur eingeschränkt, da die menschliche Sprache sehr komplex ist und es viele Besonderheiten der Aussprache gibt (etwa: Dialekte, Emotionen, Erkältungen).

    Verschiedene Systeme

    Es gibt Spracherkennungs-Systeme verschiedener Kategorien. Die einfachsten benötigen Pausen zwischen den Wörtern, die sie erkennen sollen (so genannte diskrete Sprechweise). Leistungsfähigere Programme erlauben kontinuierliches Diktieren, also eine natürliche Sprechweise. Die Software muss zudem auf den jeweiligen Sprecher trainiert werden. Leistungsfähigere Produkte unterliegen diesen Einschränkungen nur noch teilweise oder gar nicht mehr. Sie haben dafür aber in der Regel einen kleineren Wortschatz.

    Anwendungen

    Aktuelle Einsatzgebiete der Spracherkennung sind: Eingabe von Zahlen und Wortlisten, z.B. Telefonlisten, Angeben von Rufnummern (auch bei Telefonen mit Spracherkennungs-Chip) und Kreditkartennummern, auch Word Spotting (Herausfischen von Schlüsselwörtern), z.B. bei Gesprächsüberwachung. Texterfassungs- und Diktatsysteme sind aktuell v.a. dort interessant, wo es einen klar eingegrenzten Wortschatz gibt, z.B. in der Medizin (Röntgenärzte) oder Juristerei (Anwälte). Ein spezielles neues Gebiet der Spracherkennung ist die Identifizierung von Personen, z.B. bei Zugangskontrollen. So existiert bereits eine Voice Security Card, die Personen durch ihrer Stimme identifiziert.



    Film und Fernsehen

    Zehn aus fast 300 Fragen zu Film und Fernsehen warten auf Sie. Also: Füße hoch, Popcorn und los!
    Jetzt quizzen!


    KALENDERBLATT - 20. Oktober

    1314 Doppelte Königswahl in Frankfurt: Friedrich der Schöne, Herzog von Österreich, und der bayerische Herzog Ludwig streiten sich um die Krone des Deutschen Reichs.
    1827 In der Seeschlacht von Navarino verliert das Osmanenreich die Seeherrschaft in der Ägäis; für die Griechen wird der Weg in die Unabhängigkeit frei.
    1842 Die tragische Oper "Rienzi" von Richard Wagner wird in Dresden uraufgeführt.