Politechnika Warszawska - Centralny System Uwierzytelniania
Strona główna

Wprowadzenie do przetwarzania języka naturalnego

Informacje ogólne

Kod przedmiotu: 103A-INSZI-MSP-NLP
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Wprowadzenie do przetwarzania języka naturalnego
Jednostka: Wydział Elektroniki i Technik Informacyjnych
Grupy: ( Przedmioty techniczne )---EITI
( Przedmioty zaawansowane )-Inżynieria systemów informatycznych-mgr.-EITI
( Przedmioty zaawansowane techniczne )--mgr.-EITI
( Zastosowania )-Sztuczna inteligencja-mgr.-EITI
Punkty ECTS i inne: 4.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Jednostka decyzyjna:

103000 - Wydział Elektroniki i Technik Informacyjnych

Kod wydziałowy:

NLP

Numer wersji:

1

Skrócony opis:

Treść wykładu obejmuje zagadnienia związane z szeroko rozumianym przetwarzaniem języka naturalnego, ze szczególnym uwzględnieniem przetwarzania języka naturalnego wykorzystywanego w odniesieniu do zasobów sieci internet. W ramach wykładu omówione zostaną podstawowe pojęcia i metody wykorzystywane przy przetwarzaniu dokumentów tekstowych, włącznie z podstawowymi elementami lingwistyki. Omówione zostaną klasyczne metody przetwarzania wykorzystujące reprezentacje dokumentów w postaci przestrzeni wektorowych dokumentów, n-gramów oraz metody wykorzystujące wektory zanurzeń i głębokie sieci neuronowe. Wykorzystanie przedstawionych metod zostanie zaprezentowane w praktycznych zastosowaniach w grupowaniu i klasyfikacji dokumentów, w tłumaczeniu automatycznym, w automatycznej generacji streszczeń i wyszukiwaniu słów kluczowych. Zastosowanie tych metod pokazane zostanie także w odniesieniu do przetwarzania danych pochodzących z sieci internet.(...)

Literatura:

Literatura i oprogramowanie:

  1. Foundations of Statistical Natural Language Processing, Christopher Manning, Hinrich Schütze, 1999
  2. Natural Language Processing with Python. Analyzing Text with the Natural Language Toolkit, Steven Bird, Ewan Klein, Edward Loper, 2009
  3. Handbook of Natural Language Processing and Machine Translation, Olive, Joseph, Christianson, Caitlin, McCary, John (Eds.), 2011
  4. Deep Learning, Ian Goodfellow and Yoshua Bengio and Aaron Courville, 2016
  5. Deep Learning in Natural Language Processing, Li Deng, Yang Liu, 2018
  6. NLTK python
  7. Spacy library
  8. PyTorch
  9. Tensorflow

Zajęcia w cyklu "rok akademicki 2023/2024 - sem. letni" (w trakcie)

Okres: 2024-02-19 - 2024-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Piotr Andruszkiewicz
Prowadzący grup: Piotr Andruszkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2023/2024 - sem. zimowy" (zakończony)

Okres: 2023-10-01 - 2024-02-18
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Piotr Andruszkiewicz
Prowadzący grup: Piotr Andruszkiewicz, Mateusz Klimaszewski, Dominik Ryżko
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2022/2023 - sem. letni" (zakończony)

Okres: 2023-02-20 - 2023-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Piotr Andruszkiewicz
Prowadzący grup: Piotr Andruszkiewicz, Jerzy Chrząszcz, Mateusz Klimaszewski, Witold Wysota
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2022/2023 - sem. zimowy" (zakończony)

Okres: 2022-10-01 - 2023-02-19
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Piotr Andruszkiewicz
Prowadzący grup: Piotr Andruszkiewicz, Mateusz Klimaszewski, Dominik Ryżko
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)

Okres: 2022-02-23 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 68 miejsc więcej informacji
Wykład, 30 godzin, 68 miejsc więcej informacji
Koordynatorzy: Piotr Andruszkiewicz
Prowadzący grup: Piotr Andruszkiewicz, Dominik Ryżko
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. zimowy" (zakończony)

Okres: 2021-10-01 - 2022-02-22
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Piotr Andruszkiewicz
Prowadzący grup: Piotr Andruszkiewicz, Dominik Ryżko
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2020/2021 - sem. letni" (zakończony)

Okres: 2021-02-20 - 2021-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Piotr Andruszkiewicz
Prowadzący grup: Piotr Andruszkiewicz, Dominik Ryżko
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.
pl. Politechniki 1, 00-661 Warszawa tel: (22) 234 7211 https://pw.edu.pl kontakt deklaracja dostępności USOSweb 7.0.0.0-7 (2024-03-18)