Soutenance de thèse de Gaston HILKHUIJSEN

Ecole Doctorale
SCIENCES POUR L'INGENIEUR : Mécanique, Physique, Micro et Nanoélectronique
Spécialité
ACOUSTIQUE
établissement
Aix-Marseille Université
Mots Clés
intelligibilité de la parole,suppression de bruit,renforcement de la parole,
Keywords
speech intelligibility,noise suppression,speech enhancement,
Titre de thèse
Effets de suppression de bruit sur l'intelligibilité de la parole
effects of noise suppression on speech intelligibility
Date
Vendredi 22 Septembre 2017 à 9:30
Adresse
Laboratoire de Mécanique et d’Acoustique CNRS - UPR 7051 4 impasse Nikola Tesla Marseille
Amphithéâtre F.Canac
Jury
Directeur de these Sabine MEUNIER CNRS / LMA UPR 7051
Examinateur Micheal STONE University of Manchester
Rapporteur Etienne PARIZET INSA Lyon / Laboratoire Vibrations Acoustique Insa Lyon
Rapporteur Deniz BASKENT Faculty of Medical Sciences ENT Clinic
Examinateur Michel CARETTE AMU
Examinateur Ludovic ESCOUBAS AMU / IM2NP

Résumé de la thèse

On perçoit souvent la parole en présence de bien d’autres sons. Parfois les interférences sonores atteignent des niveaux tellement élevés que la parole devient intelligible. Les méthodes de renforcement de la parole tentent de réduire les bruits ambiants, mais on en sait très peu sur l’effet qu’elles produisent sur l’intelligibilité de la parole. Cette thèse explore les effets des méthodes de renforcement de la parole, aussi appelées algorithmes de suppression du bruit, sur la l’intelligibilité. Après une brève introduction sur les notions de renforcement de la parole et d’intelligibilité, on présente trois études qui abordent les effets de ces méthodes d’un point de vue empirique. On démontre que le résultat de la suppression du bruit tend à réduire l’intelligibilité et que cet effet est constant pour une grande variété de niveaux sonores. Quand on fait appel à des experts pour mettre en place un système commercial de suppression du bruit dans le but d’améliorer l’intelligibilité, ils proposent des réglages qui dégradent l’intelligibilité. Les profanes perçoivent bien une amélioration de l’intelligibilité qui résulte des méthodes de renforcement de la parole. Trois autres études subséquentes tentent de préciser les propriétés du signal, qui ont des effets sur l’intelligibilité et qui sont généré par les méthodes de renforcement de la parole. Des métriques physiques basées sur différentes propriétés du signal ont été utilisées pour estimer l’intelligibilité de la parole renforcée. La plupart de ces mesures fournissent des estimations peu fiables ou biaisées de l’intelligibilité absolue. Certaines de ces métriques pourraient cependant servir à ajuster des systèmes de renforcement de la parole enfin d’atteindre une intelligibilité optimale.

Thesis resume

Speech is often perceived in the presence of other sounds. At times the interfering sounds can reach such high levels that the speech becomes unintelligible. Speech enhancement methods attempt to reduce the audibility of noisy sounds, but little is known about how their influence on intelligibility. This thesis explores the effects of speech enhancement, also known as noise suppression algorithms, on speech intelligibility. After a short introduction to speech enhancement and intelligibility, three studies consider the effects from an empirical perspective. It is shown that noise suppression tends to reduce intelligibility and that its effect is mostly constant across a broad range of noise levels. When experts were asked to apply a commercial noise suppressor to optimise intelligibility, they proposed settings that degraded intelligibility. Laypeople successfully identified an increase in intelligibility resulting from speech enhancement. Three subsequent studies attempt to identify the signal properties responsible for the intelligibility effects and generated by speech enhancement. Physical metrics based on various signal properties were used to estimate the intelligibility of the speech-enhanced noisy signal. Most metrics provided unreliable or biased estimates of absolute intelligibility. Some could nevertheless be used to adjust speech enhancers such that intelligibility is optimal.