Pruebe nuestro LLM Masker
Pruebe nuestro LLM Masker

4 minutos de lectura

04/09/2018

Traducción automática: el informe ALPAC

¿Qué es el informe ALPAC? El acontecimiento más conocido de la historia de la traducción automática es, sin duda, la publicación en noviembre de 1966 del informe del Automatic Language Processing Advisory Committee (Comité consultivo para el procesamiento avanzado del lenguaje, ALPAC por sus siglas en inglés).

La consecuencia del informe ALPAC fue poner punto y final a las importantes subvenciones que, durante unos veinte años, había recibido la investigación en traducción automática (TA) en Estados Unidos. Aunque esto responde a la pregunta inicial, quizá lo más significativo fue el mensaje sin ambages que se transmitió a la población y al resto de la comunidad científica: la TA era inútil. Todavía hoy, muchos hablan del «fracaso» de la TA como un hecho irrefutable. El impacto de ALPAC fue innegable. La primera mitad del informe abordaba las necesidades de traducción de los científicos y funcionarios gubernamentales estadounidenses, así como la oferta y la demanda general de traducciones de ruso a inglés. El informe ALPAC comenzaba cuestionando si, teniendo en cuenta el incontestable predominio del inglés como idioma de la literatura científica, no sería más sencillo y económico que los usuarios habituales de traducciones de ruso aprendieran a leer los documentos en su idioma original. Se podía lograr en unas 200 horas y cada vez más científicos e ingenieros americanos eran capaces de hacerlo. A continuación, determinaba que únicamente entre el 20 y el 30 % de artículos rusos de determinados ámbitos terminaban siendo publicados en revistas norteamericanas. Por tanto, no existía ningún tipo de urgencia en el campo de la traducción. Y había, sin embargo, varios problemas de traducción cruciales: principalmente la calidad, la velocidad y el coste. La calidad debía ser apropiada para las necesidades de los solicitantes, puesto que una traducción refinada y perfecta suponía una pérdida de tiempo y dinero si el destinatario tenía una capacidad lectora limitada. En cuanto a la velocidad, ALPAC observó que había mucho margen de mejora: el servicio más rápido, del Joint Publications Research Service (JPRS), tardaba 15 días para 50 páginas; los documentos que la Foreign Technology Division (FTD) de EE. UU. enviaba a contratistas externos tardaban un mínimo de 65 días y, al ser procesados por el sistema de TA de la FTD, tardaban 109 días (debido a los procesos de posedición y producción). En lo referente a los costes, ALPAC calculó cuánto pagaban las agencias gubernamentales a los traductores humanos, unas cantidades que oscilaban entre 9 $ y 66 $ por cada 1000 palabras. El cálculo de los costes se llevó a cabo sobre el coste por lector de las diferentes formas de traducción, incluyendo los resultados sin editar del sistema de la FTD. Estos costes incluían el gasto de tiempo de los lectores. Teniendo en cuenta que el lector medio tardaba el doble de tiempo en leer documentos de TA sin editar que traducciones humanas de calidad, el informe ALPAC concluía que, si más de 20 personas iban a leer los documentos, la traducción humana tradicional resultaba más barata que la TA. [caption id="attachment_3634" align="aligncenter" width="604"] John Robinson Pierce, informe ALPAC John Robinson Pierce, director de investigación en AT&T y director de ALPAC.[/caption] Posteriormente, el informe pasaba a relatar el estado en el que se encontraba la traducción automática. Comenzaba con una definición: la TA « significa, presuntamente, pasar con un algoritmo de un texto origen en lenguaje de computación a un texto meta útil, sin recurrir a la traducción o la edición humana y, en este contexto, no ha habido ninguna traducción automática de un texto científico general y tampoco hay ninguna en perspectiva inmediata». La alternativa que se barajaba era la TA con posedición. Sin embargo, el informe admitía no poder « evaluar la dificultad y el coste de la posedición».

¿Cuál fue el impacto del informe ALPAC?

En algunos aspectos, puede que se exagere el impacto de ALPAC: la investigación en TA en EE. UU. no se detuvo de forma abrupta en 1966. Algunos proyectos siguieron en marcha, en particular en la Universidad Estatal Wayne, con Harry Josselson hasta 1972, y en la Universidad de Texas, con Winfred Lehmann y Rold Stachowitz hasta 1975. Además, a posteriori, podemos estar de acuerdo con el hecho de que ALPAC tenía motivos fundados para ser escépticos con la TA, puesto que la calidad era indudablemente mala y parecía no justificar el nivel de apoyo financiero que estaba recibiendo. También acertó en detectar la necesidad de desarrollar máquinas que pudieran ayudar a los traductores y en enfatizar la necesidad de una investigación más básica en la lingüística computacional. Sin embargo, se le puede achacar haberse centrado demasiado en las necesidades de traducción de los científicos y agencias estadounidenses y no haber sido capaz de reconocer el mayor alcance de las necesidades del comercio e industria en una economía global ya en expansión. En segundo lugar, el informe se centró exclusivamente en las necesidades gubernamentales y militares de EE. UU. para el análisis y la digitalización de documentos en ruso. En ningún momento se interesó por otros usos o usuarios potenciales de sistemas de TA ni por otros idiomas. En el capítulo sobre « Procesamiento automático del lenguaje y lingüística computacional» se reflexiona sobre la contribución de la investigación en TA a los avances del PLN en general. Su influencia sobre los equipos informáticos había sido insignificante; aportó avances al software informático pero el resultado más importante habría sido, sin duda, su efecto sobre la lingüística. Aquí se resaltaban los conocimientos sobre sintaxis y gramática formal, la aparición de nuevas teorías a partir de corpus más ricos y se concluía que, si bien « la revolución en lingüística no se debe en exclusiva a los intentos de traducción automática y análisis sintáctico, es poco probable que la revolución hubiera sido grande o significativa sin dichos intentos». Sin embargo, ALPAC recordaba que, a pesar de esta influencia positiva, «no contamos con una traducción automática de utilidad y no hay perspectivas inmediatas ni cercanas de contar con ella». Hacía hincapié en las oportunidades potenciales para mejorar la calidad de la traducción, especialmente en diferentes herramientas de asistencia: « La traducción asistida por ordenador puede ser una importante vía hacia traducciones mejores, más rápidas y más baratas». Pero ALPAC no recomendaba una investigación básica: « Lo que más necesita la traducción asistida por ordenador es buena ingeniería». ALPAC recomendaba apoyar la investigación para aumentar la velocidad del proceso de traducción humana, la evaluación de la velocidad y los costes de varios tipos de traducción asistida por ordenador y, por último, la adaptación de los procesos existentes de edición mecanizada y producción en la traducción. Para más información sobre el informe ALPAC, haga clic aquí.