Tarea

Solo disponible en BuenasTareas
  • Páginas : 10 (2291 palabras )
  • Descarga(s) : 0
  • Publicado : 1 de diciembre de 2011
Leer documento completo
Vista previa del texto
2. Herramientas para la investigación lingüística

1. LA FUENTE DE DATOS Y LOS CORPUS INFORMATIZADOS 1.1. Las técnicas de obtención de datos y los corpus

Las técnicas de obtención de datos son sistemas utilizados por los lingüistas para conseguir datos de informantes nativos, datos que permiten revelar todos los posibles contextos de uso de una oración, o la forma en que cada elemento de laoración contribuye al impacto comunicativo del conjunto. Entre estos sistemas se encuentran los juicios de gramaticalidad, la reconstrucción de textos, la narración de eventos a partir de dibujos o fotos, entrevistas orales, etc. A excepción de los juicios de gramaticalidad, las demás fuentes de datos constituyen datos de realización, no de competencia, y sólo permiten deducir cómo es lacompetencia lingüística o comunicativa de forma indirecta. Por ejemplo, un fonólogo necesita recoger sonidos producidos por hablantes nativos de una lengua y ponerlos en relación con su estructura fónica (características como el tipo de onda sonora, amplitud, frecuencia, formantes, etc.), así como con su potencial para ser reconocidos por los propios hablantes como unidades con valor funcional en el usolingüístico. Así, mediante experimentos de identifcación de palabras, los fonólogos han comprobado que un hablante inglés no distingue entre pat y bat si la /p/ de pat es pronunciada a propósito sin aspiración. La especifcidad del nivel fonológico de descripción requiere del uso de laboratorios con instrumentos diversos, como los diseñados para medir el fujo de aire por las cavidades orales ynasales, o para realizar glotografías, pero también requiere programas informáticos para el análisis automático de datos, que incluyen conversores de grafemas a fonemas, segmentadotes automáticos de señales fónicas, sistemas de reconocimiento de habla, etc. Aunque tener en cuenta los juicios del hablante ha ayudado mucho al progreso de los modelos sobre el lenguaje, en la actualidad la investigaciónlingüística se ha benefciado del análisis de grandes corpus informatizados. Un corpus informatizado permite efectuar búsquedas automatizadas de palabras, sintagmas, categorías lingüísticas básicas (nombre, adjetivo, verbo, adverbio, preposición), colocaciones (palabras que aparecen en asociación frecuente unas con otras, como pan y queso) y los contextos en que aparecen los ítems más buscados. Enespañol, el más conocido es el Corpus de Referencia del Español Actual , de la Real Academia, con más de 150 millones de palabras. En inglés, dos de los corpus más conocidos y utilizados son el Corpus of Contemporary American English y el British National Corpus. 1.2. ¿Qué es un corpus?

Un corpus es un conjunto de evidencia lingüística generalmente compuesto por usos lingüísticos reales. Lostextos que integran los corpus pueden ser tanto muestras escritas como orales. Los datos de un corpus no deben proceder de las cavilaciones del investigador, no han de ser inventados.

Si bien los corpus pueden presentarse en papel o ser grabaciones sonoras, existe la tendencia generalizada a restringir el signifcado de la palabra “corpus” para referirse a las colecciones de textos en formatodigitalizado. Algunas de las propiedades que caracterizan a los corpus son las siguientes: • Tamaño. Algunos lingüistas, como Sinclair, se decantan por un corpus lo más amplio posible, aduciendo que cuanto mayor número de datos incorpore un corpus, más f ables o representativos serán los resultados derivados de su consideración. Otra postura al respecto la mantiene Haan, que cuestiona la existencia deun tamaño ideal de corpus. Este parámetro, argumenta, es variable puesto que depende del tipo de estudio que queramos acometer. Funcionalidad y representatividad. McEnery puntualiza que más allá del tamaño del corpus, lo que ha de tenerse en cuenta es la fnalidad del análisis que se pretende llevar a cabo. Por ejemplo, no tendría sentido indagar en cuanto al uso de metáforas que expresan...
tracking img