jueves, 9 de febrero de 2017

La traducción automática

John McCarthy
En un famoso curso de verano que tuvo lugar en Dartmouth College en 1956, se propuso el nombre de inteligencia artificial para los programas de ordenador que realizaran tareas que tradicionalmente se habían considerado exclusivamente humanas, como jugar al ajedrez y traducir de una lengua humana a otra. Los asistentes a ese curso, dirigido por John McCarthy, lanzaron las campanas al vuelo y predijeron que en diez años se habrían resuelto completamente esos dos problemas. Así pues, esperaban que hacia 1966 habría programas capaces de ganar al campeón del mundo de ajedrez, y otros que podrían traducir perfectamente entre dos lenguas humanas cualesquiera.
En marzo de 1961, mi tío Felipe F. Moreno, que por entonces era jefe de traductores de español en la sede de la Unión Internacional de Telecomunicaciones (UIT) en Ginebra, escribió en la revista de la UIT un artículo sobre la traducción automática y cómo podría afectar a los traductores humanos, lo que demuestra que la cuestión era candente. Poco después, cuando se cumplió el plazo establecido por los precursores de la inteligencia artificial, se comprobó que habían sido demasiado optimistas, porque los dos problemas que plantearon estaban muy lejos de resolverse.
Sabemos que el objetivo de que un programa ganara al campeón del mundo de ajedrez no se cumplió hasta 1997, cuando el programa Deep Blue derrotó a Garry Kasparov, vigente campeón en ese año. El otro problema, la traducción automática, resultó aún más difícil. A finales de los sesenta corría por los ambientes informáticos la siguiente anécdota:
Para probar un par de programas traductores, inglés-ruso y ruso-inglés, se le proporcionó al primero el siguiente texto del Evangelio (Mat.26:41):The spirit is willing, but the flesh is weak. (El espíritu está pronto, pero la carne es débil). El resultado de la traducción al ruso pasó como entrada al traductor ruso-inglés, y el resultado obtenido fue: The vodka is good, but the meat is spoiled. (El vodka es bueno, pero la carne está estropeada).
La anécdota es probablemente apócrifa, pero expresa muy bien cuál es el problema de la traducción automática: las lenguas humanas son ambiguas, lo que hace muy difícil traducirlas. La ambigüedad puede ser sintáctica, como en los siguientes ejemplos:
            No pude estudiar derecho (el jorobado de Notre Dame).
Time flies like an arrow (el tiempo vuela como una flecha). Esta frase inglesa tiene otras tres interpretaciones sintácticas posibles, además de la más común, que es la que he traducido. Una de ellas es: a las moscas del tiempo les gusta una flecha.
La ambigüedad también puede ser semántica, como en estos ejemplos:
¡Pare la mula! ¿Ha parido una mula, o queremos que se pare?
Todo hombre ama a una mujer. ¿Todos a la misma, o cada uno a una?
Lo malo es que estas ambigüedades suelen ser distintas en cada lengua, lo que dificulta la traducción automática, porque la frase a elegir depende de un contexto muy amplio, que incluye conocimientos generales sobre el mundo, que los programas de ordenador no tienen. Por eso la investigación en traducción automática tardó mucho en dar resultados.
A finales de los años setenta, el gobierno japonés decidió emprender un proyecto que pusiera a su país a la cabeza de la informática mundial. Según explicaron, estaban cansados de que el resto del mundo considerara a los japoneses como copiadores eficientes de la tecnología desarrollada por otros países. Esta vez querían ser ellos los copiados. Por eso pusieron en marcha el proyecto de la quinta generación, que consistiría en lo siguiente:
·         En el hardware: ordenadores adaptados para simplificar la construcción de aplicaciones de inteligencia artificial.
·         En el software: programas capaces de interaccionar con el usuario en su propia lengua (inglés y japonés) y de traducir correctamente entre esas dos lenguas.
El proyecto de la quinta generación debía durar diez años y terminó a principios de los años noventa con un fracaso. Los supuestos ordenadores de quinta generación que iban a construirse resultaron ser ordenadores personales corrientes, dotados de un firmware que les permitía entender el lenguaje Prolog, lo cual no era nuevo, pues los primeros ordenadores personales llevaban firmware que les capacitaba para entender el lenguaje Basic. Los grandes objetivos (traducción automática y comprensión del lenguaje natural) no fueron alcanzados.
Icono de Google Translate
El éxito del proyecto consistió en empujar a otros países a lanzar proyectos menos ambiciosos, algunos de los cuales sí dieron lugar a resultados razonables. Por ejemplo, en la Unión Europea, donde la traducción de documentos entre lenguas oficiales se lleva una proporción importante del presupuesto, se puso en marcha el proyecto EUROTRA, cuyo objetivo inicial (traducir correctamente textos entre dos lenguas) se redujo al final a otro más simple, pero alcanzable: construir herramientas que ayuden a los traductores humanos a aumentar su rendimiento (traducción asistida por computadora).
Una herramienta moderna de este tipo es Google Translate. A menudo se toman a broma sus traducciones, con ejemplos como estos:
Google Translate traduce así la frase española Me daría de tortas: I would give of cakes.
Y la frase No se anda con chiquitas la traduce así: She does not hang out with little girls.
Sí, es gracioso, pero quien pretenda utilizar Google Translate para traducir textos entre dos idiomas cualesquiera y los acepte tal como salen, no ha entendido nada. Esta herramienta es una ayuda para el traductor humano, pero la actuación de este es ineludible. Es preciso corregir las traducciones que nos ofrece Google Translate, pero aun así la herramienta es muy útil. Ofrezco un ejemplo sacado de mi propia experiencia: antes de utilizar Google Translate, yo tardaba entre dos y tres meses en traducir una de mis propias novelas del español al inglés. Desde que utilizo la herramienta, ese tiempo ha disminuido a unas dos semanas, y la calidad final de la traducción es comparable a la antigua. Es decir, mi productividad como traductor se ha multiplicado por cuatro.

Manuel Alfonseca

12 comentarios:

  1. Yo felicito, como siempre al señor Alfonseca por su brillante artículo. Si, se hablo mucho de la victoria de Deep Blue, a Gary Kasparov, pero fueron seres humanos, quienes le introdujeron los datos para vencerlo. Respecto al programa de traducción. Creo, que un compañero mío de curso David Grajal Blanco, creo, que estaba trabajando en algo relativo a la traducción de textos. Estoy de acuerdo contigo el traductor de bgoogle es muy útil, y a mí me ayuda a buscar palabras difíciles en inglés, cuando estoy escribiendo críticas de libros en Goodreads.

    ResponderEliminar
  2. Hola Manuel, felicidades por tu artículo. En los ejemplos que pones no me parece que estén mal traducidos, me explico... el traductor necesitaría información sobre el contexto. Puede que para un español sean frases hechas pero para otro hispanohablante no. Soy de la opinión que en el caso de no disponer de más información para hacer un análisis global se haga una traducción literal.

    El mismo Google Translate ya hace esto. Prueba a introducir estos dos ejemplos:
    Me senté en un banco del parque --> I sat on a park bench
    Voy al banco a sacar dinero --> I'm going to the bank to get some money

    En cambio, si no disponemos de apenas información ofrecerá la traducción más común para el término "bank":
    Veo un banco --> I see a bank


    ResponderEliminar
    Respuestas
    1. Sí, lo que dices es exactamente lo que quiero decir en el artículo: que las ayudas a la traducción carecen de información sobre el contexto (la información a menudo está implícita en nuestro conocimiento del mundo) y que es necesario revisarlos para corregir los posibles errores. Los ejemplos que puse son simplemente anecdóticos. Hay muchos más.

      Eliminar
    2. Me ha encantado su artículo. En una reseña española de la película Batman Lego leí una frase concluyente que dice El que domina los contenidos, domina el mundo. Junto con este artículo me pareció algo que deben conocer los estudiantes si tienen dudas sobre el estudio de las humanidades, sobre todo la comunicación y el periodismo.

      Eliminar
  3. Manuel, me has recordado con lo del Prolog una charla sobre ese lenguaje que nos dio en el Centro Científico una señora (creo recordar que suramericana y de IBM EEUU), en la que se tomó como diez minutos para explicarnos cómo había que realizar una multiplicación en Prolog a base de doscientas recursiones y líos varios. O algo parecido, y con gran cachondeo del personal.

    ¿La recuerdas?

    Juan.

    ResponderEliminar
    Respuestas
    1. Claro que lo recuerdo. Prolog es un lenguaje enfocado a hacer deducciones lógicas, sin extensiones adecuadas no es bueno para realizar operaciones aritméticas. Por eso, cuando yo implementé el intérprete de APL, añadí un procesador auxiliar (AP998) capaz de hacer deducciones lógicas al estilo Prolog, que se podía combinar con la potencia de cálculo del APL. Así se combinaba lo mejor de ambos mundos.

      Eliminar
  4. Yo ahora, al tener la desgracia de presidir una comunidad de vecinos en la Costa del Sol con mayoría de belgas, estoy teniendo que desenterrar mi olvidado francés del colegio que llegó a ser razonablemente bueno (mis padres, muy pioneros ellos, me mandaban a horribles colonias en el Pirineo francés en verano).

    He comprobado que para mí la manera más rápida de redactar bien en francés es:

    1º: escribir el texto inicial en inglés y metérselo al Google para que lo pase al francés; me da la sensación de que las traducciones a y desde el inglés son las más logradas con diferencia.

    2º: editar el texto en francés para que me suene bien.

    3º meter el texto editado de vuelta al google para que lo devuelva al inglés, para así detectar posibles errores ortográficos en francés.

    ResponderEliminar
    Respuestas
    1. Yo tengo la misma percepción con la mayoría de idiomas, que suele ser mejor la traducción desde el inglés. Puede ser por el enfoque estadístico del Google Translate y el hecho de disponer de más corpus bilingües con el inglés como uno de los idiomas.

      Eliminar
  5. Disculpe señor Alfonseca que me salga del tema del post. Hoy acabo de leer un artículo en el blogsalmon.com, que a su vez remite a otro blog, sobre el "Palimpsesto de Arquímedes". Se dice que los monjes borraron el palimpsesto para colocar un libro de oraciones y que por ésta causa "se perdieron siglos de avance científico" ¿Sabe algo de ello? ¿Puede escribir sobre el punto? ¿Tendrá alguna incidencia importante, de ser cierto el asunto, con el "retraso de la ciencia?

    Gracias. Dios le guarde. Éxitos para su blog

    ResponderEliminar
    Respuestas
    1. En el "Palimpsesto de Arquímedes" había siete obras, de las que sólo una era la única copia conocida: "El método de los teoremas mecánicos". Las demás se conocían por otras copias. La obra perdida ahora recuperada explicaba el método exhaustivo para calcular números irracionales, que utilizaban los griegos y desarrolló Arquímedes, a falta de cálculo integral y diferencial, que no fueron descubiertos hasta el siglo XVII. En la obra oculta en el palimpsesto, Arquímedes utilizó ese método para resolver el problema de calcular el volumen de una cuña cilíndrica, problema resuelto después por Kepler en el siglo XVII.

      En cuanto a la pregunta de cuánto podría haber avanzado la ciencia si se hubiese conservado ese manuscrito en lugar de perderse, es un tanto ociosa. Con la caída del Imperio Romano de Occidente se perdieron muchas más cosas, entre ellas bastantes obras maestras de la literatura, que sabemos que existieron pero no han llegado hasta nosotros. Estos contrafactuales (¿qué habría ocurrido si no hubiese ocurrido lo que ocurrió?) son interesantes para la creación literaria (yo utilicé uno de ellos en mi novela "La Escala de Jacob") y han dado lugar a un género literario (la historia alternativa), pero no veo que puedan servir para mucho más.

      Eliminar
  6. Tengo la intención de traducir una novela de Español a Inglés. Como puedo lograrlo de manera personal, pues quiero aprender, pero también hacerlo bien. ¿Me pueden ayudar?


    ResponderEliminar
    Respuestas
    1. Mándeme un mensaje a mi dirección de correo (ni nombre . mi apellido en gmail . com) y le contestaré.

      Eliminar