Wordnet
Páginas: 24 (5753 palabras)
Publicado: 12 de abril de 2015
ITALICA
Universidad de Sevilla
José A. Troyano
Índice
•
•
•
•
•
Introducción
Nombres
Adjetivos
Verbos
Diseño e implementación
1
Introducción
Diccionarios, diccionarios electrónicos y WordNet
Diccionario: Define el léxico de un idioma. Apropiado para
uso humano. En la práctica, su uso supone una tarea
tediosa.
Diccionario electrónico: Recurso lingüístico. Se puede
derivar a partir delos diccionarios tradicionales. Apropiado
para el uso automático y humano vía interfaz.
WordNet: Recurso lingüístico ideado para uso automático.
Incorpora información psicolingüística. Organizado en base
a significados (thesaurus).
Introducción
Lo que aporta WordNet
Diccionarios convencionales:
- Descripciones semánticas (glosa)
- Deletreado
- Pronunciación
- Formas derivadas
- Etimología
-Información gramatical
- Usos
- Sinónimos/antónimos
Lo que aporta WordNet
- Descripciones basadas en conceptos
- Relaciones psicolingüísticas entre palabras
2
Introducción
Motivación y estructura básica
1985: Un grupo de lingüistas de la universidad de Princeton
decidieron construir una base de datos estructurada conforme a
criterios psicolingüistas. La idea original era buscar palabrasconceptualmente en lugar de alfabéticamente.
WordNet divide el lexicón en cinco categorías:
• nombres
• verbos
• adjetivos
• adverbios
• partículas
Evidentemente hay formas que pueden estar en más de una. Por
ejemplo, close, puede ser nombre, verbo, adjetivo y adverbio.
Introducción
Semántica léxica
Palabra: Asociación convencional entre un concepto
lexicalizado y un lexema (utterance) que desempeña unpapel sintáctico.
¿qué tipo de lexemas entran dentro de estas asociaciones
léxicas? (hay lexemas que no tienen una gran carga de
significado, cumpliendo básicamente una función sintáctica)
¿cuál es la naturaleza y organización de los conceptos
lexicalizados que pueden expresar las palabras?
¿qué papeles sintácticos juegan las diferentes palabras?
WordNet se centra en la segunda pregunta.
3Introducción
Una representación del concepto “palabra”
Parte de la confusión anterior se debe al doble uso del
término palabra.
Otra definición de palabra, más matemática, y por tanto más
adecuada para una representación formal puede servir para
aclarar los conceptos:
palabra =
La forma puede ser simple o múltiple (colocación).
De manera que se separa el aspecto de la palabra(word
form) de lo que significa la palabra (word meaning).
Introducción
La matriz léxica
La definición anterior abre las puertas a un sistema de
representación que combine las formas y los significados. En
esa representación se basa WordNet.
sinonimia
lexemas
F3 .....
significados
F1
F2
M1
M2
M3
.
.
Mm
E11
E12
E21
Fn
E33
polisemia
Emn
La E es simplemente una entrada y denota laexistencia
de una relación entre una forma y un significado.
4
Introducción
Otra posible representación
M1
F1
M2
palabra
M3
F2
F3
relación
léxica
relación
semántica
Mm
Fn
En un principio WordNet se orientó a la definición de palabras
y relaciones semánticas, pero con el tiempo se incorporaron
también relaciones léxicas.
Introducción
¿Cómo se representan los significados?
significados
sueloM1
M2
M3
M4
M5
E11
E21
E31
E41
lexemas
piso territorio planta
E12
E23
E52
E54
Synsets (synonym sets):
M1={suelo, piso}
M2={suelo, territorio}
M3={suelo, (superficie inferior de algunas cosas; p.e.,de las vasijas.)}
M5={suelo, (modalidad de gimnasia artística)}
M4={piso, planta}
5
Introducción
Relaciones: semánticas, léxicas y morfológicas
WordNet está organizado en base a relaciones. Dadoque
los significados se representan mediante synsets, las
relaciones semánticas se pueden representar mediante
enlaces entre synsets.
Las relaciones más importantes contempladas en WordNet
son:
• Sinonimia
• Antonimia
• Hiponimia/hiperonimia
• Holonimia/meronimia
• Morfológica
Introducción
Relaciones: sinonimia
Es la relación más importante de WordNet.
Definición: dos expresiones son sinónimas...
Leer documento completo
Regístrate para leer el documento completo.