Spracherkennung
Aus WISSEN-digital.de
Allgemeines
Bei der Spracherkennung handelt es sich um ein Verfahren zur Verarbeitung der natürlichen menschlichen Sprache durch Computer, das im Prinzip untrennbar mit der Spracheingabe verbunden ist. Es wird unter anderem bei Diktiersystemen und bei Zugangskontrollen verwendet.
Zur Spracherkennung werden die analog vorliegenden Töne der Sprache aufgenommen, digitalisiert und verarbeitet, z.B. durch Vergleich mit gespeicherten Mustern, einem Referenz-Vokabular. Alternativ werden für die Erkennung auch statistische Verfahren benutzt, die die Häufigkeit von Lautfolgen berücksichtigen (Hidden-Markov-Modellierung).
Bei der Spracherkennung geht es einerseits um das Steuern von Computern und anderen Geräten durch natürliche Sprache. Andererseits geht es um das Aufnehmen und Verarbeiten von Diktaten. Viele Programme bieten beide Funktionen an. Das Erkennen funktioniert zum Teil nur eingeschränkt, da die menschliche Sprache sehr komplex ist und es viele Besonderheiten der Aussprache gibt (etwa: Dialekte, Emotionen, Erkältungen).
Verschiedene Systeme
Es gibt Spracherkennungs-Systeme verschiedener Kategorien. Die einfachsten benötigen Pausen zwischen den Wörtern, die sie erkennen sollen (so genannte diskrete Sprechweise). Leistungsfähigere Programme erlauben kontinuierliches Diktieren, also eine natürliche Sprechweise. Die Software muss zudem auf den jeweiligen Sprecher trainiert werden. Leistungsfähigere Produkte unterliegen diesen Einschränkungen nur noch teilweise oder gar nicht mehr. Sie haben dafür aber in der Regel einen kleineren Wortschatz.
Anwendungen
Aktuelle Einsatzgebiete der Spracherkennung sind: Eingabe von Zahlen und Wortlisten, z.B. Telefonlisten, Angeben von Rufnummern (auch bei Telefonen mit Spracherkennungs-Chip) und Kreditkartennummern, auch Word Spotting (Herausfischen von Schlüsselwörtern), z.B. bei Gesprächsüberwachung. Texterfassungs- und Diktatsysteme sind aktuell v.a. dort interessant, wo es einen klar eingegrenzten Wortschatz gibt, z.B. in der Medizin (Röntgenärzte) oder Juristerei (Anwälte). Ein spezielles neues Gebiet der Spracherkennung ist die Identifizierung von Personen, z.B. bei Zugangskontrollen. So existiert bereits eine Voice Security Card, die Personen durch ihrer Stimme identifiziert.
Kalenderblatt - 20. April
1844 | Uraufführung des Märchens "Der gestiefelte Kater" von Ludwig Tieck. |
1916 | Die USA drohen Deutschland mit dem Abbruch der diplomatischen Beziehungen, wenn Deutschland nicht die Torpedierung von Fracht- und Passagierschiffen aufgebe. |
1998 | Die Terrororganisation RAF (Rote Armee Fraktion) erklärt sich selbst für "Geschichte" und löst sich auf. |