„ „ Algorytmy grupowania Algorytmy grupowania przedrostków i rozbudowy przedrostków i rozbudowy komputerowego słownika komputerowego słownika dla jęz. polskiego dla jęz. polskiego Ispell” Ispell” Promotor: prof. zw. dr hab. inż. Jacek Mościński Konsultant: mgr inż. Krzysztof Rzecki
20
Embed
„Algorytmy grupowania przedrostków i rozbudowy komputerowego słownika dla jęz. polskiego Ispell ”
„Algorytmy grupowania przedrostków i rozbudowy komputerowego słownika dla jęz. polskiego Ispell ”. Promotor: prof. zw. dr hab. inż. Jacek Mościński Konsultant: mgr inż. Krzysztof Rzecki Autor: Piotr Baran. Plan prezentacji. Cel i zakres pracy Budowa słownika Ispell Algorytmy deprefiksacji - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
„„Algorytmy grupowania Algorytmy grupowania przedrostków i rozbudowy przedrostków i rozbudowy komputerowego słownika dla komputerowego słownika dla jęz. polskiego Ispell”jęz. polskiego Ispell”
Promotor: prof. zw. dr hab. inż. Jacek MościńskiKonsultant: mgr inż. Krzysztof RzeckiAutor: Piotr Baran
Plan prezentacjiPlan prezentacjiCel i zakres pracyBudowa słownika IspellAlgorytmy deprefiksacjiNapotkane problemy i
rozwiązaniaOsiągnięte rezultaty
Zakres pracyZakres pracyPrzegląd i porównanie możliwości
oraz wydajności komputerowych słowników języka polskiego
Zaprojektowanie, implementacja i przetestowanie algorytmów służących odnajdywaniu prawidłowych przedrostków oraz grupowaniu wyrazów posiadających te same grupy przedrostków w plikach słownika dla języka polskiego Ispell
Cel pracyCel pracyZmniejszenie rozmiaru słownikaZmniejszenie wymagań
pamięciowychUłatwienie dodawania nowych
wyrazów do słownikaUłatwienie budowy narzędzi
bazujących na słowniku Ispell
Pliki Ispell’aPliki Ispell’apolish.dict – zawiera lematy
języka polskiego (ok. 290 tys.) oraz flagi, na podstawie których zachodzi odmiana
polish.aff – zawiera opis flag odmieniających
polish.hash – plik generowany automatycznie przez Ispell’a na podstawie polish.dict i polish.aff