Politechnika Warszawska - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Uczenie ze wzmocnieniem

Informacje ogólne

Kod przedmiotu: 1120-INMSI-MSP-0115 Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Uczenie ze wzmocnieniem
Jednostka: Wydział Matematyki i Nauk Informacyjnych
Grupy: Informatyka i Systemy Informacyjne, Metody sztucznej inteligencji, sem. 1 z 3 (edycja zimowa)
Informatyka i Systemy Informacyjne, Metody sztucznej inteligencji, sem. 2 z 3 (edycja letnia)
Punkty ECTS i inne: 4.00
Język prowadzenia: polski
Pełny opis:

Zawartość przedmiotu:

Cel przedmiotu:

Celem jest zapoznanie studentów z podstawowymi pojęciami, metodami i wybranymi algorytmami uczenia ze wzmocnieniem. W trakcie zajęć praktycznych (projekt) studenci zdobędą doświadczenia związane z implementacją i stosowaniem takich algorytmów.

Treści kształcenia:

Wykład:

Uczenie ze wzmocnieniem – podstawowe pojęcia: środowisko, nagrody/polityka, uczeń/agent. Przykładowe problemy. Procesy decyzyjne Markowa (MDP); funkcja wartości. Programowanie dynamiczne w rozwiązywaniu MDP. Predykcja funkcji wartości (metoda Monte-Carlo, TD-learning). Uczenie ze wzmocnieniem w dużej (nieograniczonej) przestrzeni stanów – algorytmy aproksymacyjne; algorytm TD(lambda), gradient TD-learning (algorytmy Suttona). Uczenie się optymalnej (prawie optymalnej) strategii; problem „wielorękiego bandyty”. Uczenie typu Q-learning. Metody aktor-krytyk (SARSA, metody zachłanne, ...).

Projekt:

Studenci wybierają temat projektu na drugich zajęciach. Wynikami projektu są: prezentacja końcowa, raport techniczny, udokumentowany kod.

Literatura:

Literatura i oprogramowanie:

1. 1. R. Sutton, A.G. Barto, Reinforcement Learning: an introduction.

2. C. Szepesv'ari, Algorithms for Reinforcement Learning.

3. S. Russel, P. Norvig, Artificial Intelligence: A Modern Approach.

4. T. Mitchell, Machine Learning.

Metody i kryteria oceniania:

Regulamin zaliczenia:

Ocena końcowa z przedmiotu ustalana jest według standardowej skali, na podstawie łącznej liczby punktów uzyskanych z egzaminu (50%) oraz projektu (50%).

Zajęcia w cyklu "rok akademicki 2020/2021 - sem. zimowy" (jeszcze nie rozpoczęty)

Okres: 2020-10-01 - 2021-02-19
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Maria Ganzha
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin

Zajęcia w cyklu "rok akademicki 2019/2020 - sem. zimowy" (zakończony)

Okres: 2019-10-01 - 2020-02-21
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Maria Ganzha
Prowadzący grup: Maria Ganzha
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. zimowy" (zakończony)

Okres: 2018-10-01 - 2019-02-17
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Maria Ganzha
Prowadzący grup: Maria Ganzha
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.