Analyse et classification d’exemples illustratifs dans le dictionnaire “Cesselin" en utilisant Google Traduction et un dictionnaire UNL-UWs
Savoir si un exemple dans un dictionnaire bilingue est un proverbe, une expression idiomatique, une collocation ou un simple exemple d’utilisation serait très utile aux utilisateurs, mais est rarement indiqué. Dans cet article, nous présentons une classification manuelle et une annotation d’exemples dans un dictionnaire bilingue japonais-français, le « Cesselin » (145000 entrées), dérivées de l’analyse manuelle de 500 entrées, et décrivons les étapes d’automatisation du processus d’annotation. Quant aux proverbes, nous utilisons simplement des dictionnaires de proverbes. Pour les autres cas, notre méthode consiste à comparer la traduction (automatique) en anglais d’un exemple original (japonais) et sa traduction (française) dans le dictionnaire. La comparaison est basée d’abord sur le nombre de lexèmes communs aux deux sorties (anglaises), et deuxièmement sur le nombre de lexèmes synonymes, qui peuvent être trouvés en utilisant un grand dictionnaire UNL-UW. Nous montrons notre procédure de classification en détail et son automatisation future.