Un système à base de connaissances pour une communication parlée personne-système multilingue
Résumé La tâche de reconnaissance automatique de la parole (RAP), qui est au coeur de la communication parlée Personne-Système, peut être vue comme une gestion de l’information issue de la microstructure acoustique du signal vocal pour la transformer en une information représentée par la macrostructure phonétique implicite. La correspondance avec le moins d’erreurs possible de ces deux structures nécessite une intégration de connaissances a priori sur la macrostructure phonétique dans des systèmes dédiés à la gestion de l’information acoustico-phonétique. Dans cet article, nous abordons des aspects liés tant à la gestion de l’information phonétique véhiculée par le signal vocal qu’à la topologie de systèmes experts capables de conduire des processus de reconnaissance phonémique multilingue. La démarche que nous proposons consiste à enrichir la base de connaissances de ces experts par des indices représentatifs de la majorité des langues humaines afin de rehausser les performances d’identification des macro-classes et des traits phonétiques divers. Les résultats obtenus sur des corpus de logatomes et de phrases en langues française et arabe montrent qu’il est possible d’orienter la conception des systèmes vers une unification du processus de reconnaissance pour l’adapter à une identification phonémique multilingue.