Estudio comparativo de traductores

Páginas: 15 (3557 palabras) Publicado: 22 de abril de 2010
Proyecto de preparación
del corpus paralelo alineado español-inglés

José Angel Vera Félix, Grigori Sidorov

Centro de Investigación en Computación, CIC.
Av. Juan de Dios Batíz s/n, casi esq. Miguel Othón de Mendizabal,
Unidad Profesional "Adolfo López Mateos", Edificio CIC.
Col Nueva Industrial Vallejo, CP 07738, México D.F.
javera@sagitario.cic.ipn.mx, sidorov@cic.ipn.mxResumen. Se presenta la implementación de una metodología enfocada a la alineación de textos paralelos, a nivel de párrafos y oraciones, para los lenguajes inglés – español. Se describe el método a seguir y algunos de los resultados obtenidos hasta el momento. Al final, se presentan los trabajos futuros relacionados a este proyecto.

Abstract. An implementation of the methodology for alignment ofparallel texts at the paragraph level for English and Spanish languages is presented. The method and some preliminary results are described. Future directions of developoment are presented.

Palabras Clave: Alineación de textos, corpus paralelo alineado, detección de párrafos.

1 Introducción

Dentro de la lingüística computacional, existen campos de investigación que se apoyan, en granmedida, en recursos lingüísticos electrónicos tales como periódicos o revistas, siendo la traducción automática un ejemplo de ellos.
Mucho se ha dicho sobre la función de Internet como un gran corpus electrónico; los investigadores cuentan con una gran cantidad de material de estudio en esta vasta cantidad de textos electrónicos, en sus muy diversos lenguajes, que se generan hoy en día y quese distribuyen en Internet.
Un campo de trabajo de interés actual es el que está conformado por los corpus paralelos. Dicho campo se ve beneficiado por la disponibilidad, en Internet, de los textos multilingües que conforman este tipo de corpus. Un corpus paralelo es un caso especial de un corpus multilingüe, el cual agrupa el mismo texto en diversas lenguas. En nuestro caso, manejamos textos endos lenguas diferentes, a saber, el inglés y el español.
Para efectos de investigación, no basta con recopilar textos para formar un corpus paralelo; un material de este tipo no es de mucha utilidad pues los textos no son fácilmente procesados por los programas actuales usados en este campo. Para aprovechar al máximo el material, los textos deben estar estructurados de manera tal que sefacilite su análisis.
De tal suerte, se pone en evidencia la necesidad de procesar los corpus paralelos para que queden en un formato útil para los investigadores y manejables para el software. Uno de los tratamientos más importantes que se aplica al corpus paralelo es lo que se conoce como la alineación. La alineación de los textos es un primer paso, muy necesario, que generará lo que se conoce comoun corpus paralelo alineado. Alinear significa establecer la correspondencia entre los elementos estructurales de textos –párrafos, sentencias, o palabras.
Un tipo de software que trabaja con textos paralelos y que requiere que los textos estén alineados es el que contiene los programas de concordancias [1].
Para entender la gran importancia de los corpus paralelos alineados, y por ende,del proceso de alineación, basta con ver la gran influencia que estos recursos han tenido en los avances alcanzados en las investigaciones sobre traducción automática, enseñanza de lenguas extranjeras [3] y lingüística contrastiva [5].

2 Textos Paralelos y su Alineación

Los textos paralelos son textos que tienen el mismo contenido semántico, pero expresado en lenguajes diferentes [7].Reciben también el nombre de corpus paralelos, bilingües o bitextos. Son ejemplos de textos paralelos los manuales de productos electrónicos que presentan la misma información al usuario, pero en diferentes lenguajes.
El término “paralelo” no implica que los textos tengan una correspondencia exacta entre palabras, oraciones y/o párrafos; es decir, dos textos pueden estar completamente desalineados...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Estudio comparativo
  • estudio comparativo
  • Estudio Comparativo
  • Estudio comparativo
  • Estudio comparativo entre dos empresas
  • Epistemológica De Los Estudios Comparados
  • Estudio comparativo de dos textos
  • Estudio comparativo de las técnicas de indagación

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS