5
Aplicación das TIC aos estudos lingüísticos e literarios
Juan Ramón López Rodríguez
Obxectivos
O que imos aprender:
¿Que proveito poden tirar os estudos lingüísticos e literarios das
TIC?
¿Que novos eidos de investigación xurden da colaboración entre a
lingüística e a informática?
¿Qué é unha biblioteca virtual?
Bibliografía:
2
“Gestión Digital dela Información: de bits a bibliotecas digitales y la web” R. Peña,
R. Baeza-Yates, José V. Rodríguez. Ed. Ra-Ma
El portal educativo del Estado argentino:
http://aportes.educ.ar/lengua/nucleo_teorico/influencia_de_las_tic/
REAL ACADEMIA ESPAÑOLA: Banco de datos (CREA) [en línea]. Corpus de
referencia del español actual. http://www.rae.es
Tecnoloxías da Información e as Comunicacións
As TIC e osestudos lingüísticos e
literarios
Introdución. Lingüística computacional
3
Tecnoloxías da Información e as Comunicacións
TIC e lingüística
Relación con dúas vertentes:
Dominios da lingüística aplicada que utilizan ferramentas
informáticas
Programas informáticos baseados en elementos teóricos e
descritivos da lingüística:
Lingüística computacional: rama da lingüística que se
ocupa destecruce
4
Multidisciplinar. Perspectiva teórica e práctica
Involucrados: lingüistas, informáticos (IA), psicólogos cognitivos,
expertos en lóxica....
Tecnoloxías da Información e as Comunicacións
Lingüística computacional
Finalidade principal: elaboración de modelos computacionais que
reproduzan diferentes aspectos da linguaxe humana: procesamento
da linguaxe natural(http://www.sepln.org/)
¿Como representar e procesar a linguaxe natural usando ordenadores?
Potencial das computadoras: resolver problemas que utilizan a
linguaxe como fonte principal de datos
Porén, as formalizacións da lingüística computacional aínda están
moi lonxe de equipararse ás competencias humanas
Procedementos computacionais eficientes non son análogos aos
procesos humanos de uso dalinguaxe
Para un neno: máis complicado aprender a falar que recoñecer as palabras
Para un computador: xeración de voz relativamente simple; recoñecemento
de voz extremadamente complicado
5
Programas de síntese de voz moito mais avanzados que os de recoñecemento
Tecnoloxías da Información e as Comunicacións
Lingüística aplicada
Ramas da lingüística aplicada que utilizan ferramentasinformáticas:
Lingüística de corpus
Terminoloxía
TIC
Lingüística
Lexicografía
Programas informáticos que aproveitan/se basean en conceptos da
teoría lingüística:
Analizadores básicos
Correctores e tradutores automáticos
Programas de síntese e recoñecemento de voz
Outros programas complexos: buscadores intelixentes, resumo
automático...
Avances en intelixencia artificial: xeraciónautomatizada de
textos; resposta a preguntas...
Lingüística
6
TIC
Tecnoloxías da Información e as Comunicacións
TIC
Lingüística
As TIC e os estudos lingüísticos e
literarios
Ramas da lingüística aplicada que utilizan ferramentas TIC
7
Tecnoloxías da Información e as Comunicacións
Lingüística de corpus
Definición: análise de mostras de texto por medio do uso intensivo de programas decomputador
Baseada en coleccións extensas de textos naturais (corpora)
Necesidade de “preparar” os textos: anotar e pre-analizar
Lematización
Etiquetado (categoría gramatical, rasgos sintácticos)
Procedementos e criterios rigorosos para o deseño, recolección, dimensionamento e
organización dun corpus
Dúas xeracións de corpus:
Primeira xeración: corpora de un millón de palabras
Segundaxeración: megacorpora de mais de cen millóns de palabras
Tipos:
Corpora xerais/preexistentes: de propósito xeral
Corpora especializados: desenvolvidos para proxectos de investigación particulares
(p.ex. variedades lingüísticas)
8
• Lingüística de corpus
• Lexicografía
• Terminoloxía
Tecnoloxías da Información e as Comunicacións
Corpus: tipos de estudos
• Lingüística de corpus
•...
Regístrate para leer el documento completo.