Politechnika Warszawska - Centralny System Uwierzytelniania
Strona główna

Introduction to Natural Language Processing

Informacje ogólne

Kod przedmiotu: 1120-IN000-ISA-0695
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Introduction to Natural Language Processing
Jednostka: Wydział Matematyki i Nauk Informacyjnych
Grupy: Elective courses conducted in summer semester 2023/2024
Elective courses, Computer Science
Przedmioty obieralne, wydz. MiNI PW
Punkty ECTS i inne: 4.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: angielski
Skrócony opis: (tylko po angielsku)

Prerequisites

Statistics; theoretical foundations of computer science: algorithms and data structures, programming; English

Course objective

The course is devoted to the problem of natural language processing (NLP).

Pełny opis: (tylko po angielsku)

Lecture:

1. Introduction to natural language processing: basic notions, documents corpora, grammars. Applications of natural language processing. Various approaches to natural language processing.

2. Morphological and syntactic analysis, word tagging, sentence parsing.

3. Statistical methods in natural language processing: document representa-tion, word representation.

4. Supervised machine learning methods in natural language processing.

5. Unsupervised machine learning methods in natural language processing.

6. Documents similarity evaluation.

7. Topic mining.

8. Concluding lecture. Open problems in natural language processing.

Laboratory:

1. Introduction to the labs, discussion on a project assignment.

2. Elementary operations on a document.

3. Word tagging, sentence parsing.

4. Document representation, basic statistics for document and corpus eval-uation.

5. Presentation on current projects progress.

6. Supervised methods for text analysis.

7. Supervised methods for text analysis – continued.

8. Unsupervised methods for text mining.

9. Documents similarity evaluation.

10. Presentation on current projects progress.

11. Topic mining.

12. Topic mining - continued.

13. Methods for evaluation and presentation of documents processing results.

14. Tools and resources supporting natural language processing.

15. Projects presentation.

Literatura: (tylko po angielsku)

1. D. Jurafsky, J.H. Martin, Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 2nd Edition. Upper Saddle River, Prentice Hall, 2000.

2. Ch.D. Manning, H. Schutze, Foundations of Statistical Natural Language Processing, Cambridge, The MIT Press. 1999.

3. A. Przepiórkowski, Powierzchniowe przetwarzanie języka polskiego, Warsaw, EXIT, 2008. (in Polish)

4. Środowiska: Python oraz R. / Python and R environment

Metody i kryteria oceniania: (tylko po angielsku)

Course grade is obtained after completing one project assignment that is discussed and implemented during the semester. Project assignment will be discussed during the first laboratory class. Discussion on project progress is scheduled for laboratory classes number 5 and 10. Final project presentation is scheduled for laboratory class number 15.

Zajęcia w cyklu "rok akademicki 2023/2024 - sem. letni" (w trakcie)

Okres: 2024-02-19 - 2024-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin, 15 miejsc więcej informacji
Projekt, 15 godzin, 15 miejsc więcej informacji
Wykład, 15 godzin, 60 miejsc więcej informacji
Koordynatorzy: Agnieszka Jastrzębska
Prowadzący grup: Agnieszka Jastrzębska, Elżbieta Jowik, Mateusz Śliwka
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)

Okres: 2022-02-23 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Projekt, 15 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Agnieszka Jastrzębska
Prowadzący grup: Agnieszka Jastrzębska, Tomasz Piechula
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. letni" (zakończony)

Okres: 2019-02-18 - 2019-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Agnieszka Jastrzębska
Prowadzący grup: Władysław Homenda, Agnieszka Jastrzębska
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.
pl. Politechniki 1, 00-661 Warszawa tel: (22) 234 7211 https://pw.edu.pl kontakt deklaracja dostępności USOSweb 7.0.0.0-7 (2024-03-18)