Relations internationales

La traduction voix-à-voix ouvre un monde de communication

Jacqui Griffiths
27 April 2015

6 minutes

La technologie vocale qui traduit une langue orale A en langue B, connue sous le nom de traduction voix-à-voix, pourrait transformer notre manière de communiquer. Les récentes avancées technologiques aident les chercheurs à progresser rapidement dans la mise au point d’outils qui nous permettront de communiquer naturellement et avec fluidité, indépendamment de la langue pratiquée.

Dans Star Trek, le traducteur universel permettant une communication instantanée entre différentes cultures a été inventé vers l’an 2150. En réalité, il se pourrait que nous soyons en avance.

En mai 2014, à l’occasion de la Code Conference, conférence annuelle dédiée aux médias et à la technologie, Microsoft a dévoilé son application « Skype Translator ». Gurdeep Singh Pall, vice-président de Skype, messagerie instantanée par vidéo via Internet, et Satya Nadella, directeur général de Microsoft, ont discuté en anglais avec une employée allemande de Microsoft, Diana Heinrichs, pendant que l’application traduisait leur conversation en temps réel.

De telles démonstrations ont stimulé l’imagination du public, encouragé les équipes de recherche du monde entier à développer des outils de traduction qui aideront à mieux se comprendre, indépendamment de la langue pratiquée. Ces outils pourraient ainsi gommer nombre de difficultés en termes de mobilité internationale, de commerce mondial et de communications interculturelles, supprimant des barrières tout en préservant les différences culturelles.

PRÉSENT IMPARFAIT

Les derniers outils voix-à-voix combinent plusieurs technologies, dont de nouvelles méthodes d’apprentissage par réseau neuronal basées sur le comportement du cerveau humain, marquant une avancée significative.

Cependant, l’objectif d’une traduction voix-à-voix précise en temps réel est en progrès. Même avec un taux d’erreurs réduit (20% de mots incorrects en 2010 contre 12% en 2013), les ordinateurs ne sont pas encore capables de gérer tous les aspects d’une conversation. « L’outil voix-à-voix actuel se concentre sur des traductions de phrases littérales », déclare Sean Colbath, maître de recherches chez Raytheon BBN Technologies, spécialisé dans l’acoustique, le traitement des signaux et la technologie de l’information associée, filiale du géant américain de l’aéronautique et défense Raytheon. « Le système ne reconnaît pas les mèmes, le contexte ou les ambiguïtés du langage. Par exemple, il peut bloquer devant un nom ou le traduire mot à mot. Si vous lui demandez à quelle heure passe le bus puis le prix du ticket, il ne fera pas le lien et ne comprendra pas que vous souhaitez connaître le prix du ticket de bus. »

La technologie voix-à-voix a néanmoins accompli de grands progrès.

L’ENGOUEMENT DES ENTREPRISES

Les technologies de traduction voix-à-voix, qui étaient limitées à des applications ciblées, touchent aujourd’hui le grand public et attirent des investisseurs majeurs. Ainsi, Facebook a racheté l’entreprise à l’origine de l’application de traduction voix-à-voix Jibbigo ; Google propose des traductions voix-à-voix en 80 langues dans le cadre de Google Translate ; et AT&T Labs, division dédiée à la R&D du fournisseur mondial de télécommunications AT&T, mène des recherches en utilisant des moteurs de reconnaissance vocale, de traduction automatique et de synthèse vocale basées sur le cloud. « Les technologies liées à la traduction voix-à-voix ont fortement progressé », affirme Srinivas Bangalore, membre du personnel technique chez AT&T Labs. « Si la traduction sans erreur pourrait bien rester un mythe, des services fonctionnels dotés d’une interface utilisateur efficace peuvent atténuer ces limites et ont une utilité pratique. »

« LA TRADUCTION VOIX-À-VOIX PEUT FAIRE PASSER LA COMMUNICATION D’ENTREPRISE INTERNATIONALE AU NIVEAU SUPÉRIEUR EN SUPPRIMANT VIRTUELLEMENT LA BARRIÈRE DE LA LANGUE. »

OLIVIER FONTANA
RESPONSABLE MARKETING DU TRADUCTEUR MICROSOFT/BING, GROUPE MACHINE TRANSLATION DE MICROSOFT RESEARCH

CONVERSATIONS DÉFINIES

La traduction voix-à-voix est plus efficace lors de conversations dont le sujet est pris en compte par la technologie. « Le système voix-à-voix ne peut pas gérer les messages subtils incluant un contexte, un langage corporel ou des émotions », déclare Neil Payne, directeur marketing de l’agence de traduction Kwintessential, basée au Royaume-Uni. « Il peut toutefois avoir un usage spécifique comme lors d’un échange entre un médecin et son patient, où des paramètres existent autour des sujets abordés. »

Alan Black, informaticien et expert en synthèse vocale au Language Technologies Institute (LTI) de l’Université Carnegie-Mellon de Pittsburg, va dans le même sens. « Actuellement, la traduction voix-à-voix est utile lorsque vous devez communiquer avec des personnes qui ne connaissent pas d’autres langues que la leur, comme lors d’opérations de secours internationales. »

Le déploiement du système limité à ces contextes constitue une expérience utile au développement de la technologie pour un champ d’application plus large. « Nous avons mis au point une technologie voix-à-voix pour les forces armées américaines », ajoute S. Colbath. « Nos recherches ont pour but de comprendre l’aspect scientifique de la technologie voix-à-voix. Nous allons au-delà des applications militaires en nous intéressant par exemple aux services des douanes et de protection des frontières. La conversation serait ici plus élaborée. C’est à ce niveau que les progrès doivent être accomplis. Il faut œuvrer pour une perception du contexte et une compréhension du sens commun, de façon à rendre la conversation fluide. »

SUPPRIMER LES BARRIÈRES

Les paramètres de la technologie vont continuer à se développer, de même que sa capacité à transformer la communication pour une large palette d’utilisateurs.

« La traduction voix-à-voix peut faire passer la communication d’entreprise internationale au niveau supérieur en supprimant virtuellement la barrière de la langue », affirme Olivier Fontana, responsable marketing du traducteur Microsoft/BING pour le groupe Machine Translation de Microsoft Research basé à Washington. Aaron Davis, linguiste informaticien et directeur de la technologie de Lingotek, fournisseur d’outils de traduction automatique basé dans l’Utah (USA), partage le même point de vue. « Combiné à une technologie de communication en temps réel et basée sur Internet, le système voix-à-voix pourrait offrir de nouvelles perspectives intéressantes aux visioconférences internationales », commente-t-il. « Fournir une traduction ou des sous-titres vous donnera la certitude que votre message est transmis avec précision. » Il estime que la technologie voix-à-voix pourrait apporter un vent de nouveauté au secteur du divertissement. « Les amateurs de jeux vidéo utilisent des invites vocales, mais ils pourraient communiquer via un tchat qui traduirait à leurs partenaires installés à l’autre bout du monde. »

Autre application prometteuse : le renforcement des liens affectifs. « La traduction voix-à-voix permettra aux amis et aux familles géographiquement éloignés de rester en contact même s’ils ne parlent pas la même langue », ajoute O. Fontana.

CONNEXION CULTURELLE

Il serait logique que la traduction voix-à-voix incite à ne pas apprendre d’autres langues, mais les chercheurs affirment que cela n’est pas le cas, du moins pour le moment. « Ils estiment que cette technologie tend à démontrer un bénéfice culturel », affirme A. Davis. « Lorsqu’on n’est pas obligé d’apprendre l’anglais pour communiquer, on a tendance à mieux préserver sa culture, à commencer par sa langue. »

S. Bangalore estime que cette technologie favorisera la communication entre les personnes issues de cultures différentes. « Équipé des technologies de traduction, on est susceptible de communiquer davantage avec des personnes ne parlant pas la même langue, élargissant ainsi nos horizons linguistiques et culturels », affirme-t-il.

O. Fontana est du même avis. « La technologie de traduction voix-à-voix démocratisera et démystifiera l’apprentissage des langues. Elle permettra aux locuteurs non-natifs de communiquer avec des personnes avec lesquelles ils n’auraient jamais pu parler. Le système servira d’outil de soutien permettant aux nouveaux apprenants d’une langue d’être plus à l’aise lorsqu’ils mettront leurs compétences à l’épreuve. »

« NOUS POURRONS PRENDRE EN CHARGE DES CONVERSATIONS INFORMELLES CAR LES GENS VEULENT CETTE CAPACITÉ ET INVESTISSENT POUR LA DÉVELOPPER. »

ALAN BLACK
EXPERT EN SYNTHÈSE VOCALE AU LANGUAGE TECHNOLOGIES INSTITUTE, UNIVERSITÉ CARNEGIE-MELLON

FUTUR PROGRESSIF

Bien qu’obtenir une traduction fluide en temps réel puisse prendre encore des années, la technologie voix-à-voix se développe pour soutenir une gamme d’interactions toujours plus large. Pourtant, A. Davis met en garde contre une approche « suffisante » du développement de la technologie. « Si nous acceptons que la traduction comporte des imperfections et que nous déployons l’application à l’échelle mondiale, nous atteindrons un palier car nous n’irons pas plus loin dans son perfectionnement », déclare-t-il. « Le taux d’erreurs pourrait n’être que de 10% mais on peut perdre certaines nuances subtiles. Ces fameux 10% pourraient être essentiels à la compréhension de la discussion. »

Selon A. Black, tant que la dynamique se poursuit, la technologie voix-à-voix évoluera pour répondre à toujours plus de besoins et d’attentes. « Comme pour d’autres intelligences artificielles, nous continuerons à repousser les limites à chaque avancée technologique », conclut-il. « Cette technologie ne sera donc jamais parfaite, c’est certain. Mais nous finirons par être en mesure de prendre en charge des conversations informelles car les gens veulent cette capacité et investissent pour la développer. »

Voir une démo de Skype Translator :
https://www.youtube.com/watch?v=cJIILew6l28

Autres resources

S'abonner

Abonnez-vous pour recevoir notre newsletter mensuelle