Ircam-Centre Pompidou

Recherche

  • Recherche simple
  • Recherche avancée

    Panier électronique

    Votre panier ne contient aucune notice

    Connexion à la base

  • Identification
    (Identifiez-vous pour accéder aux fonctions de mise à jour. Utilisez votre login-password de courrier électronique)

    Entrepôt OAI-PMH

  • Soumettre une requête

    Consulter la notice détailléeConsulter la notice détaillée
    Version complète en ligneVersion complète en ligne
    Version complète en ligne accessible uniquement depuis l'IrcamVersion complète en ligne accessible uniquement depuis l'Ircam
    Ajouter la notice au panierAjouter la notice au panier
    Retirer la notice du panierRetirer la notice du panier

  • English version
    (full translation not yet available)
  • Liste complète des articles

  • Consultation des notices


    Vue détaillée Vue Refer Vue Labintel Vue BibTeX  

    Catégorie de document Article paru dans une revue
    Titre Mixed source model and its adapted vocal tract filter estimate for voice transformation and synthesis
    Auteur principal Gilles Degottex
    Co-auteurs Pierre Lanchantin, Axel Roebel, Xavier Rodet
    Paru dans Speech Communication, Février 2013, Vol. 55, n° 2
    Comité de lecture Oui
    Collation p.278-294
    Copyright Elsevier B.V.
    Année 2013
    Statut éditorial Accepté - publication en cours
    Résumé

    In current methods for voice transformation and speech synthesis, the vocal tract filter is usually assumed to be excited by a flat ampli- tude spectrum. In this article, we present a method using a mixed source model defined as a mixture of the Liljencrants–Fant (LF) model and Gaussian noise. Using the LF model, the base approach used in this presented work is therefore close to a vocoder using exogenous input like ARX-based methods or the Glottal Spectral Separation (GSS) method. Such approaches are therefore dedicated to voice pro- cessing promising an improved naturalness compared to generic signal models. To estimate the Vocal Tract Filter (VTF), using spectral division like in GSS, we show that a glottal source model can be used with any envelope estimation method conversely to ARX approach where a least square AR solution is used. We therefore derive a VTF estimate which takes into account the amplitude spectra of both deterministic and random components of the glottal source. The proposed mixed source model is controlled by a small set of intuitive and independent parameters. The relevance of this voice production model is evaluated, through listening tests, in the context of resyn- thesis, HMM-based speech synthesis, breathiness modification and pitch transposition.

    Mots-clés Mixed source; Glottal model; Vocal tract filter; Voice quality; Voice transformation; Speech synthesis
    Equipe Analyse et synthèse sonores
    Cote Degottex13a
    Adresse de la version en ligne http://articles.ircam.fr/textes/Degottex13a/index.pdf

    © Ircam - Centre Pompidou 2005.