Zaawansowane przetwarzanie danych multimedialnych
Informacje ogólne
Kod przedmiotu: | 103A-TLTBM-MSP-ZPDM |
Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Zaawansowane przetwarzanie danych multimedialnych |
Jednostka: | Wydział Elektroniki i Technik Informacyjnych |
Grupy: |
( Przedmioty techniczne )---EITI ( Przedmioty zaawansowane obowiązkowe )-Techniki bezprzewodowe i multimedialne-mgr.-EITI ( Przedmioty zaawansowane techniczne )--mgr.-EITI |
Punkty ECTS i inne: |
5.00
|
Język prowadzenia: | polski |
Jednostka decyzyjna: | 103000 - Wydział Elektroniki i Technik Informacyjnych |
Kod wydziałowy: | ZPDM |
Numer wersji: | 1 |
Skrócony opis: |
Tematyka przedmiotu obejmuje: ugruntowanie podstaw przetwarzania A/C i C/A, metody czasowo-częstotliwościowe w danych multimedialnych, projektowanie algorytmów przetwarzania sygnałów muzycznych, mowy i obrazu, omówienie zagadnień: syntezy, rozpoznawania i klasyfikacji sygnałów mowy, muzyki i obrazu; redukcji szumów i zniekształceń w sygnałach; lokalizacji i śledzenia źródeł dźwięku i obiektów; zaawansowanych metod analizy czasowo-częstotliwościowej sygnałów; nowoczesnych metod kompresji danych cyfrowych; ekstrakcji cech sygnałów fonicznych. Przedstawione zostaną możliwości wykorzystania uczenia maszynowego w odniesieniu do: rozpoznawania i syntezy mowy, muzyki i obiektów, ekstrakcji cech dźwięku, etykietowania muzyki, lokalizacji źródeł dźwięku i obiektów, redukcji szumów i zniekształceń, wspomagania osób niesłyszących, modelowania toru słuchowego, rozpoznawania dźwięków środowiskowych, automatyzacji procedur przetwarzania sygnałów fonicznych w produkcji dźwięku i dźwięku w filmie. |
Pełny opis: |
Wykład (30h):
Laboratorium (15h): Ćwiczenia laboratoryjne są zorganizowane w formie pięciu bloków tematycznych po trzy godziny zajęć i są realizowane w zespołach 2 osobowych w grupach laboratoryjnych 8 osobowych. Treści zadań laboratoryjnych obejmują: (1) kompresję i kodowanie dźwięku oraz implementację algorytmów automatycznego rozpoznawania mowy (ASR), (2) implementację wybranych cyfrowych efektów dźwiękowych, (3) przetwarzanie sygnałów z macierzy mikrofonowych i głośnikowych oraz lokalizację i śledzenie, (4) detekcję i klasyfikację obiektów w sekwencji obrazów oraz (5) ekstrakcję i analizę cech danych multimedialnych. Student zapoznaje się również z technikami projektowania i programowania algorytmów. Projekt (15h): Projekt jest definiowany w formie wymagań i parametrów, jakie musi spełniać aplikacja i jest realizowany w grupach projektowych złożonych z 4-6 osób. Grupa projektowa wybiera implementację aplikacji z aktualnej listy projektów lub proponuje własną aplikację do akceptacji prowadzącego zajęcia projektowe. Treści zadań projektowych dotyczą zagadnień uczenia maszynowego w przetwarzaniu sygnałów fonicznych, obrazów i sekwencji wizyjnych. |
Literatura: |
|
Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)
Okres: | 2022-02-23 - 2022-09-30 |
![]() |
Typ zajęć: |
Laboratorium, 15 godzin, 32 miejsc
Projekt, 15 godzin, 32 miejsc
Wykład, 30 godzin, 32 miejsc
|
|
Koordynatorzy: | Piotr Garbat, Marcin Lewandowski | |
Prowadzący grup: | Piotr Garbat, Marcin Lewandowski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Egzamin | |
Jednostka realizująca: | 103400 - Instytut Radioelektroniki i Technik Multimedialnych |
Zajęcia w cyklu "rok akademicki 2021/2022 - sem. zimowy" (zakończony)
Okres: | 2021-10-01 - 2022-02-22 |
![]() |
Typ zajęć: |
Laboratorium, 15 godzin, 32 miejsc
Projekt, 15 godzin, 32 miejsc
Wykład, 30 godzin, 32 miejsc
|
|
Koordynatorzy: | Marcin Lewandowski | |
Prowadzący grup: | Piotr Garbat, Marcin Lewandowski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Egzamin | |
Jednostka realizująca: | 103400 - Instytut Radioelektroniki i Technik Multimedialnych |
Właścicielem praw autorskich jest Politechnika Warszawska.