Politechnika Warszawska - Centralny System Uwierzytelniania
Strona główna

Synteza reguł decyzyjnych

Informacje ogólne

Kod przedmiotu: 103A-INSID-ISP-SRD
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Synteza reguł decyzyjnych
Jednostka: Wydział Elektroniki i Technik Informacyjnych
Grupy: ( Przedmioty podstawowe )-Systemy informacyjno-decyzyjne-mgr.-EITI
( Przedmioty techniczne )---EITI
( Systemy informacyjno decyzyjne )-Systemy informacyjno-decyzyjne-inż.-EITI
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Jednostka decyzyjna:

103000 - Wydział Elektroniki i Technik Informacyjnych

Kod wydziałowy:

SRD

Numer wersji:

1

Skrócony opis:

Cel przedmiotu w pierwszej jego części stanowi przedstawienie metodologii syntezy optymalnych reguł decyzyjnych dla wieloetapowych nieliniowych zadań, w warunkach niepewności, oraz pokazanie sposobów i możliwości wyznaczania tych reguł przy pomocy różnych wariantów metody programowania dynamicznego. Jednocześnie pokazane są trudności towarzyszące syntezie optymalnej w przypadku ogólnym. Druga część przedstawia praktyczne sposoby metody tworzenia reguł decyzyjnych (reguły parametryzowane, powtarzana optymalizacja wartości decyzji, układy uczące się) oraz warstwowych układów zarządzania i sterowania, a także przykłady ich zastosowania.

Pełny opis:

Cel przedmiotu w pierwszej jego części stanowi przedstawienie metodologii syntezy optymalnych reguł decyzyjnych dla wieloetapowych nieliniowych zadań, w warunkach niepewności, oraz pokazanie sposobów i możliwości wyznaczania tych reguł przy pomocy różnych wariantów metody programowania dynamicznego. Jednocześnie pokazane są trudności towarzyszące syntezie optymalnej w przypadku ogólnym. Druga część przedstawia praktyczne sposoby metody tworzenia reguł decyzyjnych (reguły parametryzowane, powtarzana optymalizacja wartości decyzji, układy uczące się) oraz warstwowych układów zarządzania i sterowania, a także przykłady ich zastosowania.


Treść wykładu

  • Zadanie syntezy optymalnej reguły (optymalnego prawa sterowania) w warunkach niepewności na skończonym horyzoncie czasu, formułowanie zadania, pierwotne i wtórne wskaźniki jakości, modele niepewności, zadanie syntezy stochastycznej, zadanie syntezy minimaksowej.

  • Metodyka i możliwości rozwiązania zadania syntezy optymalnej w układzie zamkniętym, dla skończonej liczby etapów decyzyjnych (skończony horyzont działania), z pełnym i niezakłóconym pomiarem stanu; metoda programowania dynamicznego; przykłady zadań optymalnej syntezy i ich rozwiązań, w tym zadanie liniowo-kwadratowe.

  • Zadania syntezy optymalnych reguł decyzyjnych dla nieskończonej liczby etapów (nieskończony horyzont działania): wskaźnik jakości z uwzględnieniem dyskonta (zadanie z dyskontem), wskaźnik w postaci wartości średniej kosztu i inne. Rozwiązanie zadania z dyskontem, warunki istnienia rozwiązania, równanie Bellmana, metody wyznaczania stacjonarnej reguły decyzyjnej w przypadku skończonej liczby wartości stanu.

  • Optymalna synteza reguł decyzyjnych w przypadku niepełnego i zakłóconego pomiaru stanu; algorytm programowania dynamicznego, statystyki wystarczające, zagadnienie filtracji i estymacji stanu. Efekt dualny i efekt ostrożności, własność separowalności. Zadanie liniowo-kwadratowo-gaussowskie (LQG).

  • Praktyczne sposoby podejmowania decyzji operacyjnych w warunkach niepewności: parametryzowane reguły decyzyjne o danej postaci, sterowanie i zarządzanie z powtarzaną optymalizacją decyzji, układy warstwowe.

  • Sposoby konstrukcji parametryzowanych reguł decyzyjnych: wykorzystanie reguł liniowych, sztucznych sieci neuronalnych oraz zbiorów rozmytych. Układy uczące się.

  • Bieżące podejmowanie decyzji (sterowanie) w oparciu o powtarzaną optymalizację w układzie otwartym oraz w oparciu o powtarzaną syntezę wykorzystującą uproszczony model niepewności, w tym model w postaci prognoz wielowariantowych. Przykłady współczesnych zastosowań reguł decyzyjnych do zarządzania (sterowania operacyjnego).

  • Warstwowe układy decyzyjne, układ sterowania procesem technologicznym i zagadnienie wyboru wielkości regulowanych. Przykład.




Zakres laboratorium
Laboratorium składa się z 6 ćwiczeń, realizowanych w zespołach 2-osobowych, podczas których studenci rozwiązują praktyczne zadania optymalnej syntezy z dziedziny ekonomii, sterowania systemami wodno-gospodarczymi, zarządzania sieciami teleinformatycznymi. Ważną częścią każdego ćwiczenia jest samodzielna implementacja algorytmu optymalizacyjnego oraz weryfikacja poprawności, na drodze wielokrotnej symulacji sterowania, w układzie zamkniętym, dla różnych przebiegów zakłóceń.

Program laboratorium został pomyślany tak, by jego uczestnicy opanowali wszystkie podstawowe schematy decyzyjne oraz metody obliczeniowe, w tym: klasyczny algorytm stochastycznego programowania dynamicznego w zadaniach z horyzontem skończonym, algorytmy kolejnych przybliżeń oraz iteracji polityki w zadaniach nieliniowych z horyzontem nieskończonym, metodologię LQG w wersji standardowej oraz rozszerzonej (uwzględnienie nieliniowości modelu oraz wskaźnika jakości), zastosowanie metod gradientowych optymalizacji trajektorii sterowań (wraz z rozwiązaniem równania sprzężonego) w podstawowych wersjach sterowania predykcyjnego z kilkoma scenariuszami zakłóceń.
Podczas zajęć w laboratorium wykorzystywane jest środowisko Matlab oraz jego dwie biblioteki: Optimization oraz Control Toolbox.



Poprzedniki
Typ poprzednikaNr poprzednikaKod poprzednikaNazwa poprzednika
Zalecany2103B-ARxxx-ISP-POBOPodstawy badań operacyjnych

Literatura:

    1. Wybrane fragmenty książek oraz artykuły zalecane przez prowadzącego przedmiot, w tym fragmenty książki D.P.Bertsekas "Dynamic Programming; Deterministic and Stochastic Models", Prentice Hall, 1987.
    2. Instrukcje do ćwiczeń laboratoryjnych.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.
pl. Politechniki 1, 00-661 Warszawa tel: (22) 234 7211 https://pw.edu.pl kontakt deklaracja dostępności USOSweb 7.0.2.0-2 (2024-03-29)