hrjerhhfig

Páginas: 11 (2514 palabras) Publicado: 16 de noviembre de 2013
La revisión bibliográfica y/o electrónica de aquellos materiales con los que cuenta el investigador de la lengua (bien sea un corpus u otro banco de datos) 1 muestra cómo, en la mayoría de los casos, el volumen de dichos materiales se describe no sólo en función del número de textos que se agrupan en ellos sino a partir del número de palabras que contienen. Por ejemplo:

1) The Brown Corpusown Corpus, 1961 (Francis & Kucera, 1967; Kucera, 1992), es un corpus compuesto por quinientos textos de dos mil palabras cada uno; contiene en total un millón de palabras escritas en inglés americano.

2) The London-Lund Corpus (LLC), 1960-1970 (Svartvik & Quirk, 1980), contiene quinientas mil palabras del habla culta británica.

3) The Birmingham Collection of English Text (BCET), 1980-1985(Renouf, 1984; Sinclair & Kirby, 1990), está compuesto por veinte millones de palabras de lengua oral y escrita (dieciocho millones quinientas mil y un millón quinientas mil, respectivamente).

En contraposición a los ejemplos presentados, los corpus lingüísticos venezolanos (Bentivoglio, 1998: 40) no se describen por el número de palabras sino por el número de muestras de habla que loscomponen. En consonancia con esta desventaja o carencia, el presente trabajo tiene como objetivo principal dar a conocer el número de palabras que tienen tres importantes corpus del habla de Caracas que han sido objeto de numerosos estudios en nuestro país: el Corpus sociolingüístico de 1977 (cf. Bentivoglio, 1998), el Corpus sociolingüístico de 19872 (cf. Bentivoglio y Sedano, 1993) y el Corpus dehabla infantil de 1996 (cf. Shiro, 1998).3

Más allá de ser utilizado como un simple criterio descriptivo, el número de palabras de cada hablante, el promedio de palabras de los hablantes según la edad o el nivel socioeconómico y el total de palabras que contiene cada uno estos corpus, también pueden utilizarse para otros fines; esencialmente para establecer comparaciones con otros corpus.

Elprocedimiento fundamental para establecer el número de palabras en cada uno de estos corpus consistió en convertir cada una de las muestras que los componen en un texto libre de anotaciones (cf. Caravedo, 1999). En principio, cada texto debía reflejar únicamente las palabras del hablante (el entrevistado).

En el caso de los corpus de 1977 y 1987, convertir las muestras en un texto puro supusollevar a cabo las siguientes tareas:

1) Eliminar las marcas que identifican el turno (o parlamento) de los entrevistadores (Enc.1:, Enc.2:) y del hablante. Al eliminar las marcas que identifican a los encuestadores, también debe eliminarse el texto que corresponde a sus intervenciones en la conversación, pues en el corpus no interesa lo que dicen los entrevistadores sino el entrevistado.42)Eliminar toda la información que se da entre corchetes, bien sea:

a) la descripción de un sonido que no puede reproducirse mediante la grafía (por ejemplo, [imita el sonido de un carro que se apaga], [aspiración exclamativa]); b) la interrupción en el; desarrollo de la conversación (por ejemplo, [ruido], [risas], [se oye la voz de una niña que trata de interrumpir], [ Está sonandoinsistentemente un timbre]) ; o c) para indicar que lo que dice el ; hablante es incomprensible ( [?] ).

3) Eliminar las grafías que aparecen entre paréntesis indicando la forma cómo el hablante pronuncia las palabras que provienen de otro idioma: shorts ("chores"), blue jean ("bluyín"), out ("ao"), etc.

Una vez realizadas todas estas modificaciones, debe verificarse que todos los signos depuntuación (comas, puntos, guiones, interrogación, barras oblicuas, etc.) permanezcan unidos a una palabra y que no haya ningún tipo de espacios entre ellos pues, de ser así, dichos signos también contarían como palabras cuando se ejecute el comando CONTAR PALABRAS de Microsoft Word.

Es importante destacar también algunas precisiones en cuanto a ciertos elementos que, si bien no son palabras en...
Leer documento completo

Regístrate para leer el documento completo.

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS