|
|
|||
|
||||
OverviewIn diesem Buch wird die Empfindlichkeit des Automatic Speech Recognition-Werkzeugs Whisper auf Störgeräusche untersucht. Hierbei werden unterschiedliche Geräuschtypen in verschiedenen Lautstärken untersucht. Es zeigte sich, dass einige Störgeräusche wie reines Rauschen oder Hintergrundgespräche einen höheren Einfluss auf die Transkript-Fehlerrate haben. Es wurde untersucht, ob mittels Machine Learning-Algorithmen und evolutionären Algorithmen eine Audioplugin-basierte Vorverarbeitung gefunden werden kann, welche die Transkriptgenauigkeit in Gegenwart von Störgeräuschen verbessert. Die Ergebnisse zeigen, dass mit den gewählten Methoden Verbesserungen für einzelne Störgeräusche erzielt werden konnten. Eine universelle Pluginkette zur Verbesserung der Transkriptgenauigkeit auf beliebigen Daten konnte jedoch nicht identifiziert werden. Full Product DetailsAuthor: Jakob BehnkePublisher: Springer Fachmedien Wiesbaden Imprint: Springer Vieweg ISBN: 9783658500474ISBN 10: 3658500476 Pages: 102 Publication Date: 03 February 2026 Audience: Professional and scholarly , Professional & Vocational Format: Paperback Publisher's Status: Active Availability: Not yet available This item is yet to be released. You can pre-order this item and we will dispatch it to you upon its release. Language: German Table of ContentsReviewsAuthor InformationJakob Behnke hat seinen Master of Science in Informatik an der Universität zu Lübeck erfolgreich abgeschlossen. Während seines Studiums arbeitete er in der Arbeitsgruppe Ambient Computing am Institut für Telematik. Tab Content 6Author Website:Countries AvailableAll regions |
||||