TRADUCCIÓN AUTOMÁTICA
= [Cita]
Tim McKenna, escritor y filósofo, escribe en octubre de 2000: "Cuando la calidad de los softwares sea suficiente para que la gente converse por escrito y verbalmente en la web en varios idiomas y en tiempo real, veremos un nuevo mundo abrirse ante nosotros. Científicos, políticos, empresarios y muchos otros grupos podrán comunicar directamente entre ellos sin la intervención de mediadores o traductores."
= Definición
Un programa de traducción automática analiza el texto en la lengua de salida (texto origen) y genera automáticamente el texto correspondiente en la lengua de llegada (texto meta), aplicando reglas precisas para la transferencia de la estructura gramatical. El ser humano no interviene en el proceso, a diferencia de lo que pasa con la traducción asistida por computador, que supone la interacción entre el hombre y la máquina. Si la traducción automática sigue siendo aproximada, los programas van mejorando con regularidad, sin pretender competir con el cerebro humano.
SYSTRAN, empresa pionera en el procesamiento automático de las lenguas, explica en su sitio web: "Un programa de traducción automática traduce de un lengua natural a otra lengua natural. La traducción automática tiene en cuenta la estructura gramatical de cada lengua y utiliza reglas para transferir la estructura gramatical de la lengua de origen (texto para traducir) a la lengua meta (texto traducido). La traducción automática no sustituye ni está destinada a sustituir al traductor humano."
La Asociación Europea de Traducción Automática (EAMT: European Association for Machine Translation) propone la definición siguiente en su sitio web: "La traducción automática consiste en el uso de la computadora para traducir textos de una lengua natural a otra. Fue una de las primeras áreas de investigación en informática. Resultó que este objetivo era difícil de lograr. Sin embargo existen hoy en día unos cuantos sistemas que producen resultados cuya calidad – aunque no sea perfecta – es suficiente para ser útil en ciertas aplicaciones específicas, en general en el campo de la documentación técnica. Además los programas de traducción, destinados esencialmente a ayudar al traductor humano a generar traducciones, gozan de una creciente popularidad entre los organismos de traducción profesionales."
¿Cuándo empezó la investigación relativa a la traducción automática? Se puede leer un historial en el sitio web de Globalink, una empresa especializada en programas y servicios de traducción (ahora desaparecida). He aquí un resumen de este historial.
Desde sus inicios, la traducción automática y el procesamiento del lenguaje natural progresan al mismo tiempo que el desarrollo de la informática cuantitativa. El desarrollo de las primeras computadoras programables durante la Segunda Guerra Mundial es acelerado por los primeros esfuerzos criptográficos para romper los códigos secretos alemanes. Después de la guerra, la traducción y el análisis de texto en lenguaje natural proporcionan una base para el campo emergente de la teoría de la información.
Durante los años 1950, la investigación sobre la traducción automática toma forma pero limitándose aún a una traducción literal (palabra por palabra) sin utilizar reglas lingüísticas. El proyecto ruso iniciado en la Universidad de Georgetown a principios de los años 1950 representa el primer intento sistemático para crear un sistema de traducción automática utilizable.
Hasta mediados de los años 1960, una serie de investigaciones académicas y de investigaciones financiadas por los gobiernos se llevan a cabo en los Estados Unidos y en Europa. Al mismo tiempo, los rápidos avances en el campo de la lingüística teórica culminan en 1965 con la publicación del libro "Aspects of the Theory of Syntax" ("Aspectos de la Teoría de la Sintaxis") por Noam Chomsky, y alteran radicalmente la estructura vigente para la comprensión de la fonología, la morfología, la sintaxis y la semántica del lenguaje humano.
En 1966, el informe del la Comisión ALPAC (Automatic Language Processing Advisory Committee - Comisión Asesora Sobre el Tratamiento Automático del Lenguaje) del gobierno de los Estados Unidos hace una estimación prematuramente negativa del valor de los sistemas de traducción automática y de las perspectivas para sus aplicaciones prácticas, poniendo así fin a la financiación y la experimentación en este ámbito para la década siguiente.
Hay que esperar hasta fines de los años 1970 para ver aparecer nuevos experimentos serios, junto con los avances de la informática y de las tecnologías de las lenguas. Este período ve el desarrollo de sistemas de transferencia de una lengua a otra, y el lanzamiento de los primeros intentos comerciales. Empresas como SYSTRAN y METAL están convencidas de la viabilidad y la utilidad de semejante mercado. Desarrollan productos y servicios de traducción automáticos conectados a un servidor central.
Pero quedan muchos problemas, por ejemplo los altos costes de desarrollo, un trabajo lexicográfico enorme, la dificultad de ofrecer nuevas combinaciones de idiomas, la inaccesibilidad de estos sistemas para el usuario medio, y finalmente el desafío de pasar a nuevas etapas de desarrollo.
= Experiencias
En los años 1990, la expansión del internet y del comercio electrónico favorecen el desarrollo de un verdadero mercado con productos y servicios de las empresas SYSTRAN, Alis Technologies, Lernout & Hauspie, Globalink y Softissimo, entre otras, para usuarios profesionales y usuarios medios.
SYSTRAN (acrónimo de "System Translation"), pionero en el procesamiento del lenguaje natural, es el autor del primer programa de traducción gratis en la web. AltaVista, un buscador utilizado por doce millones de usuarios, tiene más y más usuarios que no hablan inglés. Lanzado en diciembre de 1997, AltaVista Translation - también conocido como Babel Fish - es un servicio de traducción automática de páginas web del inglés a los idiomas siguientes: alemán, francés, español, italiano y portugués, y viceversa. La sede de SYSTRAN está en París (Francia), con una sucursal en San Diego (California) para las ventas y el marketing, y parte de la I + D (Investigación y Desarrollo).
Con sede en Montreal (Quebec), Alis Technologies desarrolla y comercializa soluciones y servicios de procesamiento lingüístico con programas de traducción que convierten sistemas informáticos monolingües en herramientas multilingües.
Con sede en Ypres (Bélgica) y Burlington (Massachusetts, Estados Unidos), Lernout & Hauspie (posteriormente adquirido por ScanSoft) tiene productos y servicios en dictado, traducción, compresión de voz, síntesis de voz y documentación industrial. Las tecnologías cubiertas incluyen el reconocimiento automático de las lenguas, la compresión digital de la palabra, el paso del texto a la voz, y la traducción. Los productos de las tres primeras tecnologías están destinados a grandes empresas de telecomunicaciones, informática, multimedia, electrónica de consumo y electrónica de automoción. Los productos de la cuarta tecnología - servicios de traducción - están destinados a las empresas de tecnologías de la información, a los mercados verticales y a los mercados de automatización.
Lernout & Hauspie forma también el Machine Translation Group (Grupo de Traducción Automática), que incluye empresas que desarrollan, producen y venden sistemas de traducción, por ejemplo L&H Language Technology, AppTek, AILogic, NeocorTech y Globalink.
Fundada en 1990 en los Estados Unidos, Globalink es una empresa especializada en programas y servicios de traducción, con soluciones personalizadas a partir de una gama de programas, opciones en línea y servicios de traducción profesional. La empresa distribuye sus programas de traducción en alemán, inglés, español, francés, italiano y portugués, y propone soluciones a problemas de traducción para individuos, pequeñas empresas, multinacionales y gobiernos, ya sea un producto individual con una traducción preliminar rápida o un sistema completo para la gestión de traducciones de documentos profesionales.
El sitio web de Globalink (ahora desaparecido) destaca a finales de los años 1990: "Con los programas de aplicación de Globalink, la computadora utiliza tres conjuntos de datos: el texto que hay que tratar, el programa de traducción y un diccionario de palabras y frases en el idioma fuente, así como información sobre los conceptos descritos por el diccionario y las normas aplicables a la frase: reglas de sintaxis y gramática, entre los cuales algoritmos que regulan la conjugación de verbos, el ajuste de la sintaxis, las concordancias de género y número y el orden de las palabras. Una vez que el usuario ha seleccionado el texto y lanzado el proceso de traducción, el programa empieza por comparar las palabras del texto a tratar con las palabras almacenadas en el diccionario. Una vez encontrada la adecuación, la aplicación prepara una nota completa que incluye información sobre los posibles significados de la palabra y, según el contexto, sus relaciones con otras palabras en la misma frase. El tiempo necesario para la traducción depende de la largura del texto. Un documento de tres páginas y 750 palabras requiere un tratamiento de aproximadamente tres minutos para una primera traducción."
Con sede en París (Francia), Softissimo comercializa la serie de programas de traducción Reverso, junto con productos de escritura multilingüe, diccionarios electrónicos y métodos de lenguas. Reverso se utiliza por ejemplo en Voilà, el buscador de France Télécom. Softissimo también distribuye programas de aprendizaje de idiomas y diccionarios como el Eurodico o los diccionarios de la editorial Collins.
En marzo de 2001, IBM se lanza en el mercado de la traducción con un producto profesional de alto nivel, el WebSphere Translation Server. Este programa traduce inmediatamente a varios idiomas (alemán, chino, coreano, español, francés, inglés, italiano, japonés) las páginas web, los correos electrónicos y los diálogos en línea (chats). Puede interpretar 500 palabras por segundo y permite añadir vocabularios específicos.
= El futuro
François Vadrot, director de FTPress (French Touch Press), una firma de prensa en línea, escribe en mayo de 2000: "¿Realmente es posible pensar que toda la población del mundo acabará comunicando en cualquier dirección? ¿Quizás sí? ¿Vía sistemas de traducción instantánea, escrita u oral? Me cuesta trabajo imaginar que veremos tan pronto aparecer instrumentos capaces de traducir las sutilezas del modo de pensar propio de un país: en este caso no bastaría con traducir la lengua sino que sería preciso establecer pasarelas de sensibilidad. ¿A no ser que la 'mundialización' uniformice todo eso?"
Alex Andrachmes, productor audiovisual, escritor y "explorador de hipertexto", está igual de dubitativo. Escribe en diciembre de 2000: "Espero a ver cómo son aquellas famosas traducciones simultáneas en vivo… Nos las describen provistas de nuevos procesadores ultra- poderosos, pero ya nos las anunciaban para la generación de procesadores actual. Por lo tanto, si es para obtener un: usted / reserva / avión / de el / november 17-2000 … Gracias, puedo pasar sin ello. Tal vez más adelante sí."
Otras personas son más optimistas.
Pierre-Noël Favennec, experto en la dirección científica de France Télécom R&D, destaca en febrero de 2001: "La investigación sobre la traducción automática debería permitir una traducción automática a los idiomas deseados, pero ofreciendo aplicaciones para cada lengua y no sólo para las lenguas dominantes (por ejemplo, la difusión de documentos en japonés, si el emisor es de lengua japonesa, y la lectura en bretón, si el receptor es de lengua bretona). Así pues queda mucho por hacer en el campo de la traducción automática y escrita de todas las lenguas."
Tim McKenna, escritor y filósofo, escribe en octubre de 2000: "Cuando la calidad de los softwares sea suficiente para que la gente converse por escrito y verbalmente en la web en diferentes idiomas y en tiempo real, veremos un nuevo mundo abrirse ante nosotros. Científicos, políticos, empresarios y muchos otros grupos podrán comunicar directamente entre ellos sin la intervención de mediadores o traductores."
Randy Hobler es consultor en marketing internet para Globalink, una empresa de productos y servicios de traducción. Entrevistado en septiembre de 1998, destaca perspectivas interesantes sobre el futuro de la traducción: "Pronto alcanzaremos el punto en que será tan habitual obtener una traducción muy fiel del texto y del habla que esta funcionalidad podrá formar parte de las plataformas o incluso de los chips. En esta etapa, cuando el desarrollo del internet haya alcanzado su velocidad de crucero, cuando la fidelidad de la traducción supere el 98% y cuando las diferentes combinaciones de idiomas posibles hayan cubierto la gran mayoría del mercado, la transparencia de la lengua - es decir cualquier comunicación de un idioma a otro - será una visión demasiado restrictiva para los que venden esta tecnología.
El desarrollo siguiente será la 'transparencia transcultural y transnacional' en la cual los otros aspectos de la comunicación humana, el comercio y las transacciones más allá del solo idioma entrarán en juego. Por ejemplo, los gestos tienen un significado, los movimientos faciales tienen un significado, y esto varía en función de las normas sociales de un país a otro. La letra 'O' hecha con el pulgar y el dedo índice significa 'OK' en los Estados Unidos, mientras que en Argentina es un gesto obsceno.
Cuando asistamos al desarrollo inevitable de la videoconferencia multilingüe multimedia, será necesario corregir visualmente estos gestos. El Media Lab del MIT (Massachusetts Institute of Technology - Instituto de Tecnología del Massachusetts), Microsoft y muchos otros trabajan sobre el reconocimiento informático de las expresiones faciales, la identificación de los datos biométricos para la cara, etc. No sirve para nada que un empresario estadounidense haga un discurso excelente para un argentino durante una videoconferencia multilingüe en la web si hace también el gesto 'O' con el pulgar y el dedo índice, aunque su discurso esté traducido en un español argentino perfecto. Los computadores podrán interceptar estos gestos y corregirlos visualmente.
Las culturas difieren en miles de formas, y la mayoría de las manifestaciones de estas culturas podrán ser modificadas por vía informática al pasar de una a otra. Esto incluye las leyes, las costumbres, los hábitos de trabajo, la ética, el cambio monetario, las maneras de indicar las tallas en la ropa, las diferencias entre el sistema métrico y el sistema no métrico, etc. Las empresas dinámicas catalogarán y programarán estas diferencias, y venderán productos y servicios para ayudar a los habitantes del planeta a comunicar mejor entre ellos. Una vez que estos productos y servicios se hayan generalizado, contribuirán realmente a una mejor comprensión a escala internacional."