Divulgación de la Ciencia: La traducción automática

jueves, 9 de febrero de 2017

La traducción automática

John McCarthy

The same post in English

En un famoso curso de verano que tuvo lugar en Dartmouth College en 1956, se propuso el nombre de inteligencia artificial para los programas de ordenador que realizaran tareas que tradicionalmente se habían considerado exclusivamente humanas, como jugar al ajedrez y traducir de una lengua humana a otra. Los asistentes a ese curso, dirigido por John McCarthy, lanzaron las campanas al vuelo y predijeron que en diez años se habrían resuelto completamente esos dos problemas. Así pues, esperaban que hacia 1966 habría programas capaces de ganar al campeón del mundo de ajedrez, y otros que podrían traducir perfectamente entre dos lenguas humanas cualesquiera.

En marzo de 1961, mi tío Felipe F. Moreno, que por entonces era jefe de traductores de español en la sede de la Unión Internacional de Telecomunicaciones (UIT) en Ginebra, escribió en la revista de la UIT un artículo sobre la traducción automática y cómo podría afectar a los traductores humanos, lo que demuestra que la cuestión era candente. Poco después, cuando se cumplió el plazo establecido por los precursores de la inteligencia artificial, se comprobó que habían sido demasiado optimistas, porque los dos problemas que plantearon estaban muy lejos de resolverse.

Sabemos que el objetivo de que un programa ganara al campeón del mundo de ajedrez no se cumplió hasta 1997, cuando el programa Deep Blue derrotó a Garry Kasparov, vigente campeón en ese año. El otro problema, la traducción automática, resultó aún más difícil. A finales de los sesenta corría por los ambientes informáticos la siguiente anécdota:

Para probar un par de programas traductores, inglés-ruso y ruso-inglés, se le proporcionó al primero el siguiente texto del Evangelio (Mat.26:41):The spirit is willing, but the flesh is weak. (El espíritu está pronto, pero la carne es débil). El resultado de la traducción al ruso pasó como entrada al traductor ruso-inglés, y el resultado obtenido fue: The vodka is good, but the meat is spoiled. (El vodka es bueno, pero la carne está estropeada).

La anécdota es probablemente apócrifa, pero expresa muy bien cuál es el problema de la traducción automática: las lenguas humanas son ambiguas, lo que hace muy difícil traducirlas. La ambigüedad puede ser sintáctica, como en los siguientes ejemplos:

No pude estudiar derecho (el jorobado de Notre Dame).

Time flies like an arrow (el tiempo vuela como una flecha). Esta frase inglesa tiene otras tres interpretaciones sintácticas posibles, además de la más común, que es la que he traducido. Una de ellas es: a las moscas del tiempo les gusta una flecha.

La ambigüedad también puede ser semántica, como en estos ejemplos:

¡Pare la mula! ¿Ha parido una mula, o queremos que se pare?

Todo hombre ama a una mujer. ¿Todos a la misma, o cada uno a una?

Lo malo es que estas ambigüedades suelen ser distintas en cada lengua, lo que dificulta la traducción automática, porque la frase a elegir depende de un contexto muy amplio, que incluye conocimientos generales sobre el mundo, que los programas de ordenador no tienen. Por eso la investigación en traducción automática tardó mucho en dar resultados.

A finales de los años setenta, el gobierno japonés decidió emprender un proyecto que pusiera a su país a la cabeza de la informática mundial. Según explicaron, estaban cansados de que el resto del mundo considerara a los japoneses como copiadores eficientes de la tecnología desarrollada por otros países. Esta vez querían ser ellos los copiados. Por eso pusieron en marcha el proyecto de la quinta generación, que consistiría en lo siguiente:

· En el hardware: ordenadores adaptados para simplificar la construcción de aplicaciones de inteligencia artificial.

· En el software: programas capaces de interaccionar con el usuario en su propia lengua (inglés y japonés) y de traducir correctamente entre esas dos lenguas.

El proyecto de la quinta generación debía durar diez años y terminó a principios de los años noventa con un fracaso. Los supuestos ordenadores de quinta generación que iban a construirse resultaron ser ordenadores personales corrientes, dotados de un firmware que les permitía entender el lenguaje Prolog, lo cual no era nuevo, pues los primeros ordenadores personales llevaban firmware que les capacitaba para entender el lenguaje Basic. Los grandes objetivos (traducción automática y comprensión del lenguaje natural) no fueron alcanzados.

Icono de Google Translate

El éxito del proyecto consistió en empujar a otros países a lanzar proyectos menos ambiciosos, algunos de los cuales sí dieron lugar a resultados razonables. Por ejemplo, en la Unión Europea, donde la traducción de documentos entre lenguas oficiales se lleva una proporción importante del presupuesto, se puso en marcha el proyecto EUROTRA, cuyo objetivo inicial (traducir correctamente textos entre dos lenguas) se redujo al final a otro más simple, pero alcanzable: construir herramientas que ayuden a los traductores humanos a aumentar su rendimiento (traducción asistida por computadora).

Una herramienta moderna de este tipo es Google Translate. A menudo se toman a broma sus traducciones, con ejemplos como estos:

Google Translate traduce así la frase española Me daría de tortas: I would give of cakes.

Y la frase No se anda con chiquitas la traduce así: She does not hang out with little girls.

Sí, es gracioso, pero quien pretenda utilizar Google Translate para traducir textos entre dos idiomas cualesquiera y los acepte tal como salen, no ha entendido nada. Esta herramienta es una ayuda para el traductor humano, pero la actuación de este es ineludible. Es preciso corregir las traducciones que nos ofrece Google Translate, pero aun así la herramienta es muy útil. Ofrezco un ejemplo sacado de mi propia experiencia: antes de utilizar Google Translate, yo tardaba entre dos y tres meses en traducir una de mis propias novelas del español al inglés. Desde que utilizo la herramienta, ese tiempo ha disminuido a unas dos semanas, y la calidad final de la traducción es comparable a la antigua. Es decir, mi productividad como traductor se ha multiplicado por cuatro.

Hilo Inteligencia natural y artificial: Anterior Siguiente

Manuel Alfonseca

12 comentarios:

Fonch9 de febrero de 2017 a las 12:48
Yo felicito, como siempre al señor Alfonseca por su brillante artículo. Si, se hablo mucho de la victoria de Deep Blue, a Gary Kasparov, pero fueron seres humanos, quienes le introdujeron los datos para vencerlo. Respecto al programa de traducción. Creo, que un compañero mío de curso David Grajal Blanco, creo, que estaba trabajando en algo relativo a la traducción de textos. Estoy de acuerdo contigo el traductor de bgoogle es muy útil, y a mí me ayuda a buscar palabras difíciles en inglés, cuando estoy escribiendo críticas de libros en Goodreads.
ResponderEliminar
Respuestas
Jose Martin10 de febrero de 2017 a las 12:29
Hola Manuel, felicidades por tu artículo. En los ejemplos que pones no me parece que estén mal traducidos, me explico... el traductor necesitaría información sobre el contexto. Puede que para un español sean frases hechas pero para otro hispanohablante no. Soy de la opinión que en el caso de no disponer de más información para hacer un análisis global se haga una traducción literal.

El mismo Google Translate ya hace esto. Prueba a introducir estos dos ejemplos:
Me senté en un banco del parque --> I sat on a park bench
Voy al banco a sacar dinero --> I'm going to the bank to get some money

En cambio, si no disponemos de apenas información ofrecerá la traducción más común para el término "bank":
Veo un banco --> I see a bank

ResponderEliminar
Respuestas
Pelapollos10 de febrero de 2017 a las 13:47
Manuel, me has recordado con lo del Prolog una charla sobre ese lenguaje que nos dio en el Centro Científico una señora (creo recordar que suramericana y de IBM EEUU), en la que se tomó como diez minutos para explicarnos cómo había que realizar una multiplicación en Prolog a base de doscientas recursiones y líos varios. O algo parecido, y con gran cachondeo del personal.

¿La recuerdas?

Juan.
ResponderEliminar
Respuestas
Pelapollos10 de febrero de 2017 a las 13:58
Yo ahora, al tener la desgracia de presidir una comunidad de vecinos en la Costa del Sol con mayoría de belgas, estoy teniendo que desenterrar mi olvidado francés del colegio que llegó a ser razonablemente bueno (mis padres, muy pioneros ellos, me mandaban a horribles colonias en el Pirineo francés en verano).

He comprobado que para mí la manera más rápida de redactar bien en francés es:

1º: escribir el texto inicial en inglés y metérselo al Google para que lo pase al francés; me da la sensación de que las traducciones a y desde el inglés son las más logradas con diferencia.

2º: editar el texto en francés para que me suene bien.

3º meter el texto editado de vuelta al google para que lo devuelva al inglés, para así detectar posibles errores ortográficos en francés.
ResponderEliminar
Respuestas
Anónimo12 de febrero de 2017 a las 17:47
Disculpe señor Alfonseca que me salga del tema del post. Hoy acabo de leer un artículo en el blogsalmon.com, que a su vez remite a otro blog, sobre el "Palimpsesto de Arquímedes". Se dice que los monjes borraron el palimpsesto para colocar un libro de oraciones y que por ésta causa "se perdieron siglos de avance científico" ¿Sabe algo de ello? ¿Puede escribir sobre el punto? ¿Tendrá alguna incidencia importante, de ser cierto el asunto, con el "retraso de la ciencia?

Gracias. Dios le guarde. Éxitos para su blog
ResponderEliminar
Respuestas
Unknown13 de febrero de 2017 a las 17:30
Tengo la intención de traducir una novela de Español a Inglés. Como puedo lograrlo de manera personal, pues quiero aprender, pero también hacerlo bien. ¿Me pueden ayudar?

ResponderEliminar
Respuestas

Añadir comentario

Los comentarios nuevos no están permitidos.