Schmollende Lippen oder nicht? Wie eine verbesserte Sprechererkennung forensische Untersuchungen unterstützen kann

Polizeiliche Ermittlungen nutzen regelmäßig abgehörte Telefonmitschnitte als Ermittlungsmaterial. Doch woher wissen sie, dass die Stimme auf der Aufnahme tatsächlich dem Verdächtigen gehört? Ph.D. Die Studentin Laura Smorenburg versucht diese Frage zu beantworten.

Jeder hat eine andere Stimme. So wissen wir oft sofort, ob wir einen Freund eines Fremden hören. Aber wenn die Polizei einen Anruf abhört, ist es schwieriger, mit hundertprozentiger Sicherheit zu sagen, wen sie auf dem Band hört. Außerdem ist die Qualität schlechter als beispielsweise bei einer Mikrofonaufnahme. Das erschwert die Arbeit der Polizei, die häufig mit Telefonaufzeichnungen arbeitet. Forensische Analysten versuchen daher, die Sprechererkennung zu verbessern.

Rolle der Konsonanten

Eine Möglichkeit, dies zu erreichen, besteht darin, die verschiedenen Laute einer Sprache näher zu betrachten. Smorenburg untersuchte insbesondere die Rolle zweier Konsonantengruppen: nasale und frikative Konsonanten. „Wie spricht jemand zum Beispiel das G auf Niederländisch aus? Handelt es sich um ein weiches oder ein hartes G? Wenn Sie verschiedene Sprachmerkmale einer Person aus verschiedenen Arten von Aufnahmen vergleichen, können Sie prüfen, ob es sich wahrscheinlich um denselben Sprecher handelt.“ Sie sagt.

Einige Töne enthalten mehr Informationen über den Sprecher als andere Töne. „Der phonetische Kontext eines Wortes kann die Aussprache beeinflussen. Wenn Sie sprechen, sprechen Sie die Laute nicht einzeln aus, sondern zusammen. Das wirkt sich auf die Laute selbst aus. Das G im Niederländischen ist ein gutes Beispiel: Im Wort „geen“ ( „keine“ bedeutet „keine“), es klingt anders als das Wort „goed“ (bedeutet „gut“), weil sich Ihre Lippen in einer anderen Position befinden.

„Menschen schmollen in unterschiedlichem Ausmaß und zu unterschiedlichem Zeitpunkt, wenn sie abgerundete Laute wie die Vokale in ‚gut‘ aussprechen. Deshalb wollte ich wissen, ob diese Unterschiede zwischen verschiedenen Sprechern für die forensische Analyse von Bedeutung sind“, erklärt Smorenburg. Wenn Geräusche in bestimmten Geräuschkontexten mehr Sprecherinformationen enthalten, könnten forensische Analysten effektiver arbeiten.

Die Studie kam zu dem Ergebnis, dass die Analyse von Nasal- und Frikativkonsonanten in bestimmten Lautkontexten tatsächlich zu etwas mehr Sprecherinformationen führt, obwohl Smorenburg einen Vorbehalt hinzufügt: „In der Praxis muss man sich mit dem begnügen, was man hat, weil es oft nur sehr wenige Daten gibt.“ Für die Analyse verfügbar. Wenn Sie nur nasale und frikative Konsonanten aus bestimmten Kontexten untersuchen, erhalten Sie nur minimale Beweisgewinne. Im Prinzip ist das auch eine gute Nachricht, denn es bedeutet, dass forensische Ermittler den phonetischen Kontext bei ihren Analysen nicht berücksichtigen müssen.“

Zur Verfügung gestellt von der Universität Leiden

ph-tech