Localisation du locuteur dans une séquence audiovisuelle

Authors: CHOLLET, Gérard
MANZANERA, Antoine
VU, Ngoc Son

Le mouvement de la bouche d’un locuteur est fortement corrélé avec les données audio que celle-ci produit. L’objectif est ici de détecter le locuteur dans une vidéo en utilisant ces deux signaux : le signal de parole acoustique et le signal de parole visuel. La localisation du locuteur est la clé dans certaines applications : les vidéoconférences, les systèmes de sécurité, la reconnaissance des personnes, l’indexation de vidéos, l’amélioration des interfaces homme machine, l’analyse d’expressions humaines, la lecture sur les lèvres, etc. L’objectif de ce stage est d’étudier la localisation du locuteur en utilisant les données audio et les donnés visuelles. Dans ce rapport, je présente d’abord les principes de l’extraction des énergies visuelles et de l’énergie sonore. En suite j’étudie di érents méthodes pour mesurer leurs correspondances. L’extraction des caractéristiques peut être aidée par la détection et le suivi des visages, je présenterai aussi les résultats de localisation obtenus en utilisant ou non ces outils…

Title: Localisation du locuteur dans une séquence audiovisuelle
Authors: CHOLLET, Gérard
MANZANERA, Antoine
VU, Ngoc Son
Keywords: localisation du locuteur;multi modalité;détection de visage
Issue Date: 2007
URI: http://repository.vnu.edu.vn/handle/VNU_123/236
Appears in Collections: IFI – Master Theses
Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s