Spracherkennung

    Aus WISSEN-digital.de

    Allgemeines

    Bei der Spracherkennung handelt es sich um ein Verfahren zur Verarbeitung der natürlichen menschlichen Sprache durch Computer, das im Prinzip untrennbar mit der Spracheingabe verbunden ist. Es wird unter anderem bei Diktiersystemen und bei Zugangskontrollen verwendet.

    Zur Spracherkennung werden die analog vorliegenden Töne der Sprache aufgenommen, digitalisiert und verarbeitet, z.B. durch Vergleich mit gespeicherten Mustern, einem Referenz-Vokabular. Alternativ werden für die Erkennung auch statistische Verfahren benutzt, die die Häufigkeit von Lautfolgen berücksichtigen (Hidden-Markov-Modellierung).

    Bei der Spracherkennung geht es einerseits um das Steuern von Computern und anderen Geräten durch natürliche Sprache. Andererseits geht es um das Aufnehmen und Verarbeiten von Diktaten. Viele Programme bieten beide Funktionen an. Das Erkennen funktioniert zum Teil nur eingeschränkt, da die menschliche Sprache sehr komplex ist und es viele Besonderheiten der Aussprache gibt (etwa: Dialekte, Emotionen, Erkältungen).

    Verschiedene Systeme

    Es gibt Spracherkennungs-Systeme verschiedener Kategorien. Die einfachsten benötigen Pausen zwischen den Wörtern, die sie erkennen sollen (so genannte diskrete Sprechweise). Leistungsfähigere Programme erlauben kontinuierliches Diktieren, also eine natürliche Sprechweise. Die Software muss zudem auf den jeweiligen Sprecher trainiert werden. Leistungsfähigere Produkte unterliegen diesen Einschränkungen nur noch teilweise oder gar nicht mehr. Sie haben dafür aber in der Regel einen kleineren Wortschatz.

    Anwendungen

    Aktuelle Einsatzgebiete der Spracherkennung sind: Eingabe von Zahlen und Wortlisten, z.B. Telefonlisten, Angeben von Rufnummern (auch bei Telefonen mit Spracherkennungs-Chip) und Kreditkartennummern, auch Word Spotting (Herausfischen von Schlüsselwörtern), z.B. bei Gesprächsüberwachung. Texterfassungs- und Diktatsysteme sind aktuell v.a. dort interessant, wo es einen klar eingegrenzten Wortschatz gibt, z.B. in der Medizin (Röntgenärzte) oder Juristerei (Anwälte). Ein spezielles neues Gebiet der Spracherkennung ist die Identifizierung von Personen, z.B. bei Zugangskontrollen. So existiert bereits eine Voice Security Card, die Personen durch ihrer Stimme identifiziert.



    Drama, Drama ...

    Wissen oder nicht wissen ... das ist hier die Frage! Wie gut kennen Sie sich aus auf den Brettern, die die Welt bedeuten?
    Jetzt quizzen!


    KALENDERBLATT - 20. August

    1944 Dr. Carl Goerdeler, das zivile Haupt der Verschwörer vom 20. Juli 1944 (Zwanzigster Juli), wird festgenommen. Auf seinen Kopf waren eine Million Reichsmark als Belohnung ausgesetzt.
    1955 In Genf endet die erste Atomkonferenz, an der 1 200 Wissenschaftler aus 72 Ländern teilgenommen haben.
    1968 Die UdSSR lässt Truppen des Warschauer Pakts in die Tschechoslowakei einmarschieren und beendet so den Prager Frühling.