Politechnika Warszawska - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Introduction to Natural Language Processing

Informacje ogólne

Kod przedmiotu: 1120-IN000-ISA-0695 Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Introduction to Natural Language Processing
Jednostka: Wydział Matematyki i Nauk Informacyjnych
Grupy: Elective courses, Computer Science
Elective courses, summer semester, 2018/2019
Przedmioty obieralne, wydz. MiNI PW
Punkty ECTS i inne: 4.00
Język prowadzenia: angielski
Skrócony opis: (tylko po angielsku)

Prerequisites

Statistics; theoretical foundations of computer science: algorithms and data structures, programming; English

Course objective

The course is devoted to the problem of natural language processing (NLP).

Pełny opis: (tylko po angielsku)

Lecture:

1. Introduction to natural language processing: basic notions, documents corpora, grammars. Applications of natural language processing. Various approaches to natural language processing.

2. Morphological and syntactic analysis, word tagging, sentence parsing.

3. Statistical methods in natural language processing: document representa-tion, word representation.

4. Supervised machine learning methods in natural language processing.

5. Unsupervised machine learning methods in natural language processing.

6. Documents similarity evaluation.

7. Topic mining.

8. Concluding lecture. Open problems in natural language processing.

Laboratory:

1. Introduction to the labs, discussion on a project assignment.

2. Elementary operations on a document.

3. Word tagging, sentence parsing.

4. Document representation, basic statistics for document and corpus eval-uation.

5. Presentation on current projects progress.

6. Supervised methods for text analysis.

7. Supervised methods for text analysis – continued.

8. Unsupervised methods for text mining.

9. Documents similarity evaluation.

10. Presentation on current projects progress.

11. Topic mining.

12. Topic mining - continued.

13. Methods for evaluation and presentation of documents processing results.

14. Tools and resources supporting natural language processing.

15. Projects presentation.

Literatura: (tylko po angielsku)

1. D. Jurafsky, J.H. Martin, Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 2nd Edition. Upper Saddle River, Prentice Hall, 2000.

2. Ch.D. Manning, H. Schutze, Foundations of Statistical Natural Language Processing, Cambridge, The MIT Press. 1999.

3. A. Przepiórkowski, Powierzchniowe przetwarzanie języka polskiego, Warsaw, EXIT, 2008. (in Polish)

4. Środowiska: Python oraz R. / Python and R environment

Metody i kryteria oceniania: (tylko po angielsku)

Course grade is obtained after completing one project assignment that is discussed and implemented during the semester. Project assignment will be discussed during the first laboratory class. Discussion on project progress is scheduled for laboratory classes number 5 and 10. Final project presentation is scheduled for laboratory class number 15.

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. letni" (zakończony)

Okres: 2019-02-18 - 2019-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Agnieszka Jastrzębska
Prowadzący grup: Władysław Homenda, Agnieszka Jastrzębska
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę

Zajęcia w cyklu "rok akademicki 2017/2018 - sem. letni" (zakończony)

Okres: 2018-02-19 - 2018-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Agnieszka Jastrzębska
Prowadzący grup: Agnieszka Jastrzębska
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Ocena łączna
Laboratorium - Zaliczenie
Wykład - Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.