VOCALISE : Synthèse vocale des SMS

CENTAL Louvain-La-Neuve

Début : Avril 2008
Durée : 24 mois
Financement : Région Wallonne First Post-Doc

Conscient de ce phénomène de société, le CENTAL lança en 2004 le projet "Faites don de vos SMS à la Science" : 75 000 SMS furent alors récoltés, ce qui constitue le plus grand corpus de SMS à ce jour. Au travers d'une étude scientifique réalisée sur ce corpus, le CENTAL a acquis une expertise unique dans le domaine de l'analyse des phénomènes qui distinguent, en français, le langage SMS de la norme écrite. Fort de cet acquis et afin de réaliser des études similaires dans d'autres langues, le centre a démarré, en 2007, le projet "sms4science".

Aujourd'hui, les opérateurs de téléphonie se rendent compte qu'une large couche de la population ne peut accéder au contenu textuel du SMS : personnes visuellement déficientes, automobilistes, clients de téléphonie fixe... Dès lors, l'idée est de proposer à cette clientèle un service supplémentaire : la vocalisation des SMS à l'aide d'un système de synthèse de la parole.

Or, le langage utilisé dans les SMS est si éloigné de la norme écrite (contractions, agglutinations, simplifications) que les systèmes classiques ne peuvent le vocaliser correctement. Sur la base de ce constat, le CENTAL a proposé à Multitel, centre de recherche montois expert en synthèse de la parole et reconnaissance de formes, de l'aider à développer un système de synthèse vocale des SMS dans le cadre d'un FIRST Post-Doc de la Région wallonne. Intéressé par le résultat de la recherche, Proximus, de son côté, a proposé de tester le système tout au long de son développement.

Chercheur

Dr Richard Beaufort

Promoteur

Prof. Cédrick Fairon

Partenaires industriels