Résumé |
L'une des conséquences du développement des techniques de numérisation et du multimédia est la très forte
utilisation d'oeuvres musicales sans autorisation. Il en résulte une nouvelle difficulté pour tous les organismes
chargés de collecter les droits d'auteurs, puisqu'il faut être en mesure d'identifier ces utilisations, en particulier sur
les réseaux numériques interactifs tel Internet, afin d'effectuer de façon satisfaisante la perception et la répartition
des rémunérations dues aux auteurs. Ainsi, à l'heure où la transmission et la reproduction d'oeuvres musicales sont
à la portée de tout possesseur d'ordinateur personnel relié au réseau Internet, on peut imaginer qu'un logiciel de
reconnaissance d'extraits sonores dans une base de données puisse résoudre ce problème.
Par conséquent, ce stage (qui s'est déroulé du mois d'Août 1998 au mois de Décembre 1998, puis du mois de Mars
au mois de Juin 1999 à l'Institut de Recherche et de Coordination Acoustique Musique (IRCAM) dans l'équipe
Analyse/Synthèse dirigée par Xavier RODET) étudie la reconnaissance d'extraits sonores dans une base de données
d'une taille équivalente à celle d'une dizaine de disques compacts, en vue de l'étendre ultérieurement à mille disques
compacts (soit environ mille heures de musique). Plus précisément, étant donné un court extrait (typiquement dix
secondes) d'une de ces oeuvres, il s'agit de retrouver l'oeuvre et la position dans l'oeuvre de cet extrait. Pour cela,
nous avons durant la première partie du stage caractérisé chaque oeuvre et ses différentes parties par un code
sonore, c'est-à-dire des paramètres spécifiques en nombre suffisamment réduit. Nous avons ensuite classé sous
forme hiérarchique ces codes sonores à l'aide de la méthode des Nuées Dynamiques de façon à permettre une
recherche et une comparaison rapides de l'extrait inconnu avec l'ensemble des oeuvres de la base. Enfin, nous avons
établi un programme de recherche capable, à partir d'un extrait d'une dizaine de secondes issu d'un des compacts
disques de notre base, de retrouver l'oeuvre et la position dans l'oeuvre de cet extrait dans un temps raisonnable
(quelques minutes).
Cette seconde partie du stage vise à améliorer les performances de notre programme de recherche, notamment lors
des procédures de sélection de caractéristiques et de classification qui sont, bien entendu, intimement liées l'une à
l'autre. Pour cela, nous calculons l'information mutuelle entre nos caractéristiques et nos différentes classes afin de
sélectionner les composantes les plus pertinentes de notre code sonore, puis nous faisons appel à un nouvel
algorithme de classification nettement plus rapide grâce à une optimisation de l'algorithme des k plus proches
voisins.
|