Spracherkennung

    Aus WISSEN-digital.de

    Allgemeines

    Bei der Spracherkennung handelt es sich um ein Verfahren zur Verarbeitung der natürlichen menschlichen Sprache durch Computer, das im Prinzip untrennbar mit der Spracheingabe verbunden ist. Es wird unter anderem bei Diktiersystemen und bei Zugangskontrollen verwendet.

    Zur Spracherkennung werden die analog vorliegenden Töne der Sprache aufgenommen, digitalisiert und verarbeitet, z.B. durch Vergleich mit gespeicherten Mustern, einem Referenz-Vokabular. Alternativ werden für die Erkennung auch statistische Verfahren benutzt, die die Häufigkeit von Lautfolgen berücksichtigen (Hidden-Markov-Modellierung).

    Bei der Spracherkennung geht es einerseits um das Steuern von Computern und anderen Geräten durch natürliche Sprache. Andererseits geht es um das Aufnehmen und Verarbeiten von Diktaten. Viele Programme bieten beide Funktionen an. Das Erkennen funktioniert zum Teil nur eingeschränkt, da die menschliche Sprache sehr komplex ist und es viele Besonderheiten der Aussprache gibt (etwa: Dialekte, Emotionen, Erkältungen).

    Verschiedene Systeme

    Es gibt Spracherkennungs-Systeme verschiedener Kategorien. Die einfachsten benötigen Pausen zwischen den Wörtern, die sie erkennen sollen (so genannte diskrete Sprechweise). Leistungsfähigere Programme erlauben kontinuierliches Diktieren, also eine natürliche Sprechweise. Die Software muss zudem auf den jeweiligen Sprecher trainiert werden. Leistungsfähigere Produkte unterliegen diesen Einschränkungen nur noch teilweise oder gar nicht mehr. Sie haben dafür aber in der Regel einen kleineren Wortschatz.

    Anwendungen

    Aktuelle Einsatzgebiete der Spracherkennung sind: Eingabe von Zahlen und Wortlisten, z.B. Telefonlisten, Angeben von Rufnummern (auch bei Telefonen mit Spracherkennungs-Chip) und Kreditkartennummern, auch Word Spotting (Herausfischen von Schlüsselwörtern), z.B. bei Gesprächsüberwachung. Texterfassungs- und Diktatsysteme sind aktuell v.a. dort interessant, wo es einen klar eingegrenzten Wortschatz gibt, z.B. in der Medizin (Röntgenärzte) oder Juristerei (Anwälte). Ein spezielles neues Gebiet der Spracherkennung ist die Identifizierung von Personen, z.B. bei Zugangskontrollen. So existiert bereits eine Voice Security Card, die Personen durch ihrer Stimme identifiziert.


    Das große Tier-Quiz

    Etwa eine Trillion Tierarten gibt es. Sie kennen nicht alle? Macht nichts, vielleicht knacken Sie auch so den Highscore ...
    Jetzt quizzen!


    KALENDERBLATT - 22. März

    1765 England erlässt ein Stempelgesetz, das die erste direkte Besteuerung der amerikanischen Siedler darstellt und Abgaben für alle Schriftstücke in die Kolonien vorsieht.
    1962 Der sowjetische Ministerpräsident Chruschtschow macht die gemeinsame Erforschung des Weltraums mit den USA von Fortschritten in der Abrüstungsfrage abhängig.
    1974 Der Bundesrat billigt die Herabsetzung des Volljährigkeitsalters auf 18 Jahre.