Problemas y soluciones a la traducción de archivos PDF
Los archivos en PDF son uno de los formatos más extendidos para mostrarnos contenidos de texto en documentos. Por ello, es frecuente que sea el único formato que tengamos para traducir un contrato, un folleto, una ficha técnica o un manual. Sin embargo, los archivos PDF son solo archivos de intercambio de contenido. De hecho, PDF son las siglas de Portable Document Format (formato de documento portátil, según la traducción oficial de Adobe).
El único sentido en la vida de un archivo PDF es que lo podamos ver y que lo podamos compartir sin problemas de compatibilidad. Es importante entender esto. Un archivo PDF se puede modificar, pero en realidad no está pensado para modificarse.
Índice de contenidos
Index of contents
Index du contenu
Inhaltsverzeichnis
Indice dei contenuti
Vamos a ver aquí qué tenemos que hacer para poder traducir un PDF utilizando los programas de traducción asistida que utilizan los traductores profesionales y las agencias de traducción. O para utilizar de manera fácil un traductor automático como Google Translator, si no necesitamos una traducción 100% fiable. O incluso si simplemente queremos traducir a la vieja usanza, sobrescribiendo el texto, pero guardando el formato de documento.
Para hacer uso de la tecnología lingüística vamos a necesitar tener el archivo PDF en un formato editable que podamos manejar fácilmente. La vía más normal para traducirlos es convertirlos a Word. Puede ser un documento .doc o .docx.
1.¿Cuál es la solución ideal para traducir un archivo PDF?
Esto va a sonar un poco estúpido, pero la mejor manera de traducir un archivo PDF es no traducirlo. Quiero decir, mejor no traducir el archivo PDF sino el archivo original y editable con el que se creó el PDF.
Por ejemplo, si ese archivo PDF se creó en Word, lo mejor es utilizar el archivo Word original. Si se creó con FrameMaker o InDesign, lo mejor utilizar estos formatos. Si tuvieras archivos de InDesign y puedes olvidar el PDF, quizá pueda interesarte nuestro blog: “Traducción: archivos de InDesign”.
Sin embargo, es muy posible que en tu empresa ya no sepan dónde están los archivos originales o quién los creó. O, en el caso de que seas un distribuidor o importador, es posible que el fabricante os haya facilitado únicamente los archivos PDF para hacer la traducción.
Sin embargo, merece la pena invertir un poco de tiempo en investigar si alguien los tiene todavía, o insistirle al fabricante que nos los envíe. Esto va a evitarnos muchos quebraderos de cabeza durante su traducción. Cuando digo quebraderos, me refiero a lo de siempre: tiempo y dinero.
Cuando queremos conservar el formato del texto original, conseguir los originales será todavía más importante. Los archivos PDF suelen estar creados en versiones de baja resolución, así que no valdrán si los necesitamos para imprenta.
Por otro lado, cuando convertimos los archivos de PDF a Word para hacer su traducción, veremos que el formato (me refiero aquí a la composición de textos e imágenes) puede cambiar bastante. Así que puede resultar muy laborioso y costoso reproducir al 100% el formato original.
En definitiva, los mejores resultados en cuanto a calidad y tiempo-dinero para el texto traducido, los vamos a conseguir trabajando desde los originales. Sin embargo, seguramente no estarías leyendo este artículo si los tuvieses, ¿no?
2. ¿Cómo saber el programa con el que se creó el PDF?
En general, vamos a poder averiguar con qué programa se creó el PDF original fácilmente. Si abrimos el PDF con Acrobat o Acrobat Reader y vamos a Archivos>Propiedades, podremos ver la aplicación utilizada para crearlo. Aquí vemos un ejemplo de un PDF creado en Word:
Como vemos también podemos ver quién es el autor y la fecha en la que se creó, lo que nos puede dar una pista de a quién preguntar por los originales.
3. ¿Por qué convertir un PDF a Word para su traducción?
Como he comentado, la solución estándar para la traducción de archivos PDF que utilizamos las empresas de traducción es pasar por Word. Sin embargo, alguien podría pensar que esto no tiene sentido porque los archivos PDF se pueden editar.
Bueno, esto es verdad hasta cierto punto. Primero, sí, se pueden modificar, pero para ello necesitaremos tener la versión profesional de pago de Acrobat. La mayoría de los traductores tendrán la versión gratuita: Acrobat Reader. Esta versión gratuita está limitada a unas pocas funciones.
Segundo, aun cuando utilicemos un traductor que sí tiene la versión profesional, cambiar el texto en Acrobat le llevará mucho más tiempo. Es posible que logremos convencer a traductores noveles de trabajar de esta forma a su tarifa habitual.
Sin embargo, es muy probable que los traductores profesionales más experimentados nos exijan un sobrecargo. En el peor de los casos, rechazarán directamente un proyecto de traducción en tales condiciones.
Estos dos problemas los podremos solucionar enviando un archivo de Word para traducir. Además, los archivos de Word les permitirán a los traductores o a las agencias de traducción utilizar herramientas de asistencia a la traducción. Estas herramientas crean una base de datos de las traducciones que realiza el traductor profesional.
Estas herramientas también permiten analizar cuanto texto repetido tienen los documentos a traducir. Esto es especialmente importante cuando hablamos de la traducción de manuales técnicos.
Los manuales técnicos suelen incluir mucho texto repetido tanto en el mismo manual como entre los manuales de productos similares. Muchos traductores o agencias de traducción, como nosotros mismos, aceptarán ofrecer descuentos en función del volumen de texto repetido.
La conversión de un PDF a Word puede ser un paso muy sencillo y eficiente. También hay casos en que será un verdadero quebradero de cabeza. A continuación, vamos a exponer cómo crear un archivo de Word en función del tipo de PDF que tengamos.
4. Cómo puedo traducir un archivo PDF editable
Una vez que nos hayamos asegurado de no tener los archivos originales, no habrá otra opción que la de utilizar los archivos PDF para traducirlos. La mejor situación que nos podremos encontrar es que los archivos sean editables.
Cuando decimos que sean editables, queremos decir que el texto del PDF podrá modificarse fácilmente. Es decir, no será una imagen como pasa con los PDF escaneados o con el texto trazado. Veremos estos casos más adelante.
La mejor solución será convertir el PDF en un documento de Microsoft Word. Este formato de archivo es hoy prácticamente un estándar. Esto significa que se los podremos enviar a cualquier traductor o empresa de traducción. Hoy en día todos los profesionales de la traducción tienen Word o un programa compatible.
Los documentos de Word también son fácilmente manejables por los programas de traducción. Con programas de traducción me refiere tanto a las herramientas de traducción asistida (como SDL o memoQ) o de traducción automática (como Google Translator).
El secreto de conseguir una buena conversión de PDF a Word es el programa que utilicemos. En el mercado existen toda una serie de programas llamados OCR que hacen conversiones muy decentes. Se trata de programas que llevan años en el mercado y son programas maduros.
Desde nuestra experiencia en nuestra agencia de traducción, los mejores programas son Adobe Acrobat, Omnipage y Abbyy FineReader. También existen otros buenos programas. Ver otros programas en este blog: Los 6 mejores programas OCR para escanear documentos.
La mejor práctica es tener varios de estos programas, si nuestro presupuesto lo permite. Dependiendo del documento, unas veces será Adobe Acrobat quien nos dé un resultado óptimo. Otras veces será OmniPage o Abby FineReader.
Una vez tengamos el documento convertido, habrá que revisar el formato y modificarlo si fuese oportuno. Por ejemplo, es posible que el conversor haya puesto una marca de párrafo partiendo las frases. Este formato complicará el proceso de traducción y deberán evitarse.
5. Cómo puedo traducir un archivo PDF escaneado (o trazado)
La conversión de un PDF escaneado no difiere de la de un PDF editable, excepto por el resultado que podemos esperar. En general, los PDF escaneados van a tener resultados más pobres.
En el caso de OmniPage, existe la posibilidad de darle instrucciones al programa para ayudar a interpretar el documento escaneado. Básicamente puedes indicarle si hay una tabla, si es un párrafo de texto o si se trata de una imagen. También permite indicar la orientación de texto cuando esta cambia. Estas instrucciones básicas pueden optimizar el texto que vamos a traducir.
Un problema que puede resultar insalvable es cuando la resolución del PDF escaneado no es suficiente para hacer el OCR. Los programas de OCR van a necesitar tener una resolución mínima para poder funcionar. En caso de encontrarnos de este problema, deberemos pedir que se vuelvan a escanear los documentos a mayor resolución. Si esto no fuese posible, podemos imprimir los documentos y escanearlos nosotros mismo, esto funciona a veces.
Un caso similar de PDF escaneados es el de los PDF cuyo texto se ha pasado a trazos. En programas de diseño como Illustrator, InDesign o Corel existe la función de pasar el texto a gráfico de curvas, perdiendo la capacidad de editarlos para poder traducirlos. Eso se hace para evitar tener que enviar las fuentes. En general, este tipo de PDF va a convertir el texto bien.
6. PDF generados de bases de datos
Existen multitud de programas que utilizan el formato PDF para crear documentos a partir de información incluida en la base de datos. Un ejemplo de esto puede ser una simple factura o informe generados a partir de un ERP o CMR.
Las fichas de seguridad son un ejemplo típico que nos encontramos habitualmente las empresas de traducción. La mayoría de fichas de seguridad de productos se generan a partir de un programa de gestión que tiene toda la información necesaria.
Como estos PDFs no se generan a partir de un diseño previo que se puede tener en Word o InDesign, suelen generar conversiones más problemáticas. Los problemas típicos son texto en cajas de texto partida, columnas cuyo texto no sigue un orden lógico, frases cortadas por marcas de párrafos.
Las marcas de agua suelen ser el mayor de los problemas que nos podemos encontrar en este tipo de documentos al querer traducirlos, ya que están generalmente puestas ahí precisamente para evitar la conversión del documento a un formato editable.
A modo de conclusión, decir que la traducción de archivos PDF suele ser unos de los quebraderos de cabeza para los gestores de proyecto de las agencias de traducción. Existe una gran variedad de problemas posibles, y algunas veces su gestión puede suponer un gran esfuerzo paralelo al de la traducción. Es importante que como cliente tengas claro el resultado que se puede conseguir a partir de la traducción de un PDF. En muchas ocasiones, conseguir el mismo formato del original implica un trabajo importante de maquetación que alguien tiene que hacer un pagar.
Quizá también te interesen estos otros artículos:
Josh Gambín es licenciado en Ciencias Biológicas por la Universidad de Valencia y en Traducción e Interpretación por la Universidad de Granada. Ha desarrollado diversas funciones como gestor de proyectos, maquetador, y traductor freelance y en plantilla. Desde 2002 es socio fundador de AbroadLink y actualmente desarrolla el cargo de Director de Ventas y Marketing.
Comentarios
Añadir nuevo comentario