Soutenance de thèse de Thomas BORDONNE

Ecole Doctorale
SCIENCES POUR L'INGENIEUR : Mécanique, Physique, Micro et Nanoélectronique
Spécialité
« Sciences pour l'ingénieur » : spécialité « Acoustique »
établissement
Aix-Marseille Université
Mots Clés
Perception,Imitation,Invariant,Voix,Analyse,Sonore,
Keywords
Perception,Imitation,Invariant,Voice,Analysis,Sound,
Titre de thèse
Exploration de la perception sonore par imitations vocales
Exploration of the sound perception with vocal imitations
Date
Mardi 26 Novembre 2019 à 14:00
Adresse
Laboratoire PRISM, 31 chemin J. Aiguier, 13009 Marseille
Amphithéatre Pierre Desnuelles
Jury
Directeur de these M. Richard KRONLAND-MARTINET PRISM / CNRS / AMU
Rapporteur M. Patrick SUSINI IRCAM
Rapporteur M. Sylvain MARCHAND Université de la Rochelle
Examinateur Mme Nathalie HENRICH BERNARDONI GIPSALab / CNRS
Examinateur M. Pascal BELIN INT / AMU
CoDirecteur de these Mme Mitsuko ARAMAKI PRISM / CNRS / AMU

Résumé de la thèse

L'approche écologique de la perception sonore, initialement développée par Gibson dans le cadre de la vision, stipule que notre perception repose sur l'identification de structures morphologiques appelées ''invariants'' perceptifs. Dans le contexte de la synthèse sonore, la détermination de ces invariants est cruciale pour proposer un contrôle intuitif et cohérent avec la perception. En outre, sur la base du concept d'" analyse par synthèse " proposé par Risset et Wessel, la synthèse sonore constitue un outil pertinent d'exploration de la perception sonore. Un certain nombre d'invariants perceptifs, notamment associés à l'identification des sons du quotidien, ont été définis dans la littérature par des approches basées sur la physique des sources ou sur l'analyse des sons générés par ces sources. Cependant, lorsque l'on souhaite déterminer de nouveaux invariants perceptifs associés à notre ressenti, l'approche physique ou par signal n'est plus adaptée et la description verbale des sons présente certaines limitations. Au cours de cette thèse, nous avons étudié dans quelle mesure les invariants perceptifs peuvent être révélés de manière naturelle par les imitations vocales, en évitant ainsi le biais induit par une description sémantique. Un protocole expérimental a été mis au point avec un corpus sonore contenant des sons d'environnement construits par synthèse pour lesquels les invariants étaient connus. Le test perceptif a consisté à demander aux participants d'imiter vocalement les sons de ce corpus. Notre travail a permis de mettre au point un outil d'analyse des signaux vocaux, ainsi qu'un ensemble de descripteurs acoustiques caractérisant les imitations qui ont été ensuite comparés aux paramètres de synthèse. Les résultats ont montré que les participants ont mis en évidence dans leurs imitations vocales des éléments saillants des sons cohérents avec les invariants utilisés pour le corpus sonore. Les reports collectés auprès des participants ont également révélé d'autres attributs perceptifs spécifiques à leur stratégie d'imitations. Ce travail de thèse valide ainsi l'utilisation des imitations vocales et propose une méthodologie globale pour la détermination d'invariants perceptifs. Il offre également des perspectives prometteuses d'exploration de la perception sonore par une évaluation plus introspective du ressenti à l'aide des imitations vocales.

Thesis resume

The ecological approach to sound perception, initially developed by Gibson in the context of vision, states that our perception is based on the identification of morphological structures called perceptual "invariants". In the context of sound synthesis, the determination of these invariants is crucial to provide intuitive control consistent with perception. In addition, based on the concept of "analysis by synthesis" proposed by Risset and Wessel, sound synthesis is a relevant tool for exploring sound perception. A number of perceptual invariants, particularly associated with the identification of everyday sounds, have been defined in the literature by approaches based on the physics of the sources, or on the analysis of the sounds generated by these sources. However, when we want to determine new perceptual invariants associated with our feelings, the physical or signal approach is no longer appropriate, and the verbal description of sounds has certain limitations. In this thesis, we studied to what extent perceptual invariants can be naturally revealed by vocal imitations, thus avoiding the bias induced by a semantic description. An experimental protocol was developed with a sound corpus containing synthesized environmental sounds for which the invariants were known. The perceptual test consisted in asking the participants to imitate the sounds of this corpus vocally. Our work has led to the development of a voice analysis tool, as well as a set of acoustic descriptors characterizing the imitations that were then compared to the synthesis parameters. The results showed that the participants highlighted in their vocal imitations salient elements of the sounds consistent with the invariants used for the sound corpus. The reports collected from participants also revealed other perceptual attributes specific to their imitation strategy. This thesis thus validates the use of vocal imitations and proposes a global methodology for the determination of perceptual invariants. It also offers promising prospects for exploring sound perception through a more introspective assessment of feelings using vocal imitations.