Modele jezykoznawstwa

Solo disponible en BuenasTareas
  • Páginas : 7 (1557 palabras )
  • Descarga(s) : 0
  • Publicado : 21 de diciembre de 2011
Leer documento completo
Vista previa del texto
*mogą pojawiać się słowa wykluczone:
There burst into the room tree man with guns.
[Nagle wpadło do pokoju trzech mężczyzn z bronią]
John raisen his hand. [John podniósł *jego rękę] – konwencja językowa: w j.pol. nie mówimy *podniósł swoją rękę tylko podniósł rękę.
INTERLINGUA
Założenie reprezentacji wiedzy w sposób niezależny (nieidiomatyczny, uniwersalny) od języka. Jeśli zdania e różnychjęzykach są różne pod względem semantycznym (tj. budzą wątpliwości co do tłumaczenia) sprowadzamy je do takiej interpretacji, aby odpowiadały tej samej reprezentacji wiedzy.
1. Role tematyczne – SA zbiorem kategorii pozwalającym na klasyfikację obiektów odnoszących się do czynności opisywanej przez zdanie (nie jest to zbiór zakończony, zamknięty).
-pojawiają się różne zestawy:
AGENT =sprawca czynności [Adam otworzył szufladę]
FORCE = niezidentyfikowany sprawca [Wiatr rozwiewa liście]
THEME – oznacza uczestnika najbardziej dotkniętego czynnością, np. uderzył w stół.
INSTRUMENT – oznacza narzędzie użyte w czynności, np. uderzył w stół ręką.
2. Struktury atrybutów – hierarchiczne reprezentacje wiedzy; co z czym jest powiązane; korzystają z ról tematycznych.
Zdanie wyjściowe:There was an old man gardening.
EVENT gardening
AGENT man
(number: singular)
(definiteness: indef.) zdarzenie przez reprezentację wiedzy
ASPECT progressing
TENSE past

Przez taką rprezentację wiedzy powinno być łatwiej wykonać tłumaczenie. UWAGA! Uniwersalizm= jęz. angielski (w jęz. polskim już nie jest tak łatwo).

Zastosowanie opisu niezależnego od języka wymaga wprowadzeniapewnego systemu obiektów. Taki system złożony z pojęć i relacji między nimi nosi nazwę ONTOLOGII. Ontologia powinna być uzależniona od języków z którymi system ma współpracować.
Np. There was an old man gardening. dla maszyny “man” może być zbyt obszerne (“mężczyzna” = male human, “człowiek” = generic human). Maszyna nie jest wstanie zachowac takiej dwuznaczności tłumacząc jęz. ang. Maszynatłumacząc na jęz. polski w połowie drogi zatrzymuje się, nie wiedzą co wybrać: „człowiek” czy „mężczyzna”.
DEKOMPOZYCJA LEKSYKALNA [Anna Wierzbicka] prymitywy; rozkład słów na bardziej elementarne znaczenia.
DRINK ingest
fluid dekompozycja (która może usunąć jakieś niejednoznaczności)
by+mouth

Często jest tak, że transfery się przenikają (łączą syntaktykę z semantyką).
Największy problemw TM: nie można oderwać jednej dziedziny od drugiej.

METODY STATYSTYCZNE – zastosowanie statystyk do tłumaczenia, np. Google Translator.

KONCEPCJA ZORIENTOWANA OBIEKTOWO I KLASY OBIEKTOWE

Klasy obiektowe – (Gaston Gross, jego laboratorium – LDI – przejął Salah Mejsi) – to koncept, który zapoczątkowany został wraz z analizą złożonych słów francuskich. Punktem wyjścia było 100 000jednostek leksykalnych, które po sklasyfikowaniu odpowiadały ok. 500 różnym typom złożeń.
Między poszczególnymi poziomami języka nie powinno być sztucznych podziałów. wszelkie właściwości językowe danej jednostki musimy wyczerpująco opisać aby wygenerować jej użycia.
pojawia się rozróżnienie między słownikiem elektronicznym a słownikiem w wersji zelektronizowanej (CD).
Narzędzia automatyczne –przeznaczone do generowania zdania, muszą być bardzo precyzyjne i musi być spójna baza danych. Tan opis musi odzwierciedlić wszystkie użycia danego słowa.

Tworzenie słownika było związane ze zjawiskiem polisemii i skostnienia w języku.
Polisemia jest możliwa do wykluczenia tylko na poziomie zdania. W słowniku musiałaby pojawić się informacja o charakterze składniowym. Pojęcie klas obiektowychpozwala na rozwiązanie problemu polisemii.

Najmniejszą jednostką analizy języka jest ZDANIE. Tylko na poziomie zdania możemy obserwować jednostki leksykalne i dostrzec znaczenie w przypadku jednostki polisemicznej.
Większość predykatów jest polisemiczna – nie jesteśmy w stanie wskazać ich znaczenia bez wskazania natury argumentów.
Słownik Grossa był złożony z 13 pól: były m.in. pola, które...
tracking img