Politechnika Warszawska - Centralny System Uwierzytelniania
Nie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Analiza i indeksowanie multimediów

Informacje ogólne

Kod przedmiotu: 103A-TLRTM-MSP-AIM Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Analiza i indeksowanie multimediów
Jednostka: Wydział Elektroniki i Technik Informacyjnych
Grupy: ( Przedmioty techniczne )---EITI
( Przedmioty zaawansowane obieralne )-Radiokomunikacja i techniki multimedialne-mgr.-EITI
( Przedmioty zaawansowane techniczne )--mgr.-EITI
Punkty ECTS i inne: 5.00
Język prowadzenia: polski
Jednostka decyzyjna:

103000 - Wydział Elektroniki i Technik Informacyjnych

Kod wydziałowy:

AIM

Numer wersji:

1

Skrócony opis:

Przedmiot dotyczy technik budowy systemów wyszukiwania a analizy informacji multimedialnej: projektowania architektury systemu wyszukiwania, projektowania indeksu, kompresji indeksu, budowy słowników, kwerendy przez przykład, kwerendy złożonej, ekstrakcji cech wizualnych, ekstrakcji cech dźwiękowych, klasyfikacji, śledzenia obiektów, reprezentacji meta-danych w XML. Dodatkowo omówiona będzie struktura standardu MPEG-7 i jego rola w indeksowaniu multimediów. W efekcie studenci opanują wiedzę o najnowszych metodach analizy i indeksowania danych multimedialnych oraz zdobędą doświadczenie praktyczne w projektowaniu i implementacji praktycznych systemów w tym zakresie.

Pełny opis:

Przedmiot dotyczy technik budowy systemów wyszukiwania a analizy informacji multimedialnej: projektowania architektury systemu wyszukiwania, projektowania indeksu, kompresji indeksu, budowy słowników, kwerendy przez przykład, kwerendy złożonej, ekstrakcji cech wizualnych, ekstrakcji cech dźwiękowych, klasyfikacji, śledzenia obiektów, reprezentacji meta-danych w XML. Dodatkowo omówiona będzie struktura standardu MPEG-7 i jego rola w indeksowaniu multimediów.
W efekcie studenci opanują wiedzę o najnowszych metodach analizy i indeksowania danych multimedialnych oraz zdobędą doświadczenie praktyczne w projektowaniu i implementacji praktycznych systemów w tym zakresie.


Treść wykładu

  • Wprowadzenie do indeksowania: system indeksowania a system
    wyszukiwania, miary selektywności atrybutu indeksowego (2h).

  • Kompresja indeksu: kody przedziałowe, kompresja interpolacyjna
    (2h).

  • Budowa słowników skalarnych: tablice skalarne, funkcje numeracji
    dokładnej, słowniki ortograficzne - drzewa trie i typu B, wydobywanie
    danych w sieci, silnik Google (4h).

  • Budowa słowników wektorowych: przedziały wektorowe, drzewa typu
    R, drzewa typu M, akceleracja kwerend przez przykład (2h).

  • Sygnatury SVD: wyszukiwanie dokumentów, detekcja
    repliki obrazu (4h).

  • Ekstrakcja cech wizualnych: cechy koloru, tekstury i kształtu
    obiektu w obrazie, charakterystyka ruchu (6h).

  • Analiza i indeksowanie obrazów i modeli twarzy:
    detekcja śledzenie twarzy 2D, akwizycja modelu 3D, klasyfikator
    dyskryminacyjny DLDA (4h).

  • Ekstrakcja cech dźwiękowych: cechy czasowe i widmowe,
    charakterystyka barwy dźwięku, opis linii melodycznej,
    sygnatura audio(4h).

  • Standardy indeksowania: MPEG-7, MPEG-21, MPEG-A: struktura i
    zakres standardów, reprezentacja binarna i XML, rola w
    indeksowaniu multimediów i w systemach wyszukiwania informacji (2h).


Zakres laboratorium
  1. Budowa słownika ortograficznego.

  2. Sygnatira obrazu: detekcja repliki obrazu.

  3. Deskryptor teksturowy: histogram krawędzi.

  4. Rozpoznawanie twarzy w technice DLDA.

  5. Rozpoznawanie komend głosowych.

Laboratorium rozwija umiejętności studentów w zakresie ekstrakcji cech
i budowy słowników, które są wykorzystywane w realizacji projektu.
Implementowane algorytmy rozpoznawania twarzy i rozpoznawania komend
głosowych zawarte są w praktycznych aplikacjach, które demonstrują
aplikacyjny potencjał prezentowanych metod.


Zakres projektu
Projekt do wyboru:

"System indeksowania"

Student wybiera typ obiektu multimedialnego i właściwy atrybut
selekcji, a następnie projektuje i realizuje elementy indeksu , w
tym algorytm kompresji list obiektowych, słownik cech i
opcjonalnie słownik identyfikatorów obiektów. Dodatkowo student
weryfikuje swój system realizując kwerendę przez przykład w prostym
interfejsie graficznym.

"System rozpoznawania"

Student wybiera obiekt, który będzie rozpoznawany a następnie
projektuje i realizuje system pozwalający na jego automatyczne
znalezienie w obrazie lub dźwięku. Do wykonania zadania student określa
poszczególne elementy analizy semantycznej umożliwiające skuteczne
działanie algorytmu.


Poprzedniki
Typ poprzednikaNr poprzednikaKod poprzednikaNazwa poprzednika
Wymagany1103A-TLRTM-ISP-PTOPodstawy techniki obrazowej
Zalecany2103A-TLRTM-ISP-OPAJava - obiektowe programowanie aplikacji multimedialnych


Przedmioty podobne
Kod przedmiotuNazwa przedmiotuDyskonto ECTS
103A-TCTCM-MSA-EADIRAdaptive Image Recognition2

Literatura:

  • Literatura podstawowa:

  1. Notatki wykładowe - materiały elektroniczne

  2. Dokumenty i raporty grupy MPEG

  • Literatura dodatkowa:

  1. Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents and
    Usage Data. Springer, 2007.

  2. T. Huang, Z. Wen: 3D Face Processing, Springer, 2007

  3. C. Bishop: Pattern Recognition and Machine Learning,
    Springer 2006

  4. Witten, Moffat, Bell: Managing Gigabytes, Morgan Kauffman
    Publishers,San Francisco, 1999.

  5. Knuth: Sztuka programowania - Wyszukiwanie i sortowanie ( tom 3),
    WNT, Warszawa, 2002.

Metody i kryteria oceniania:

Zaliczenie na podstawie wyników laboratorium, projektu i egzaminu.

Maksymalna liczba punktów za egzamin: 40

Maksymalna liczba punktów za projekt: 20

Maksymalna liczba punktów za laboratorium: 40

Do zaliczenia przedmiotu wymagane jest zdobycie min. 20 punktów za
egzamin i przekroczenie łącznej sumy 50 punktów. Pozostałe progi
punktowe według standardowej skali.

Zajęcia w cyklu "rok akademicki 2017/2018 - sem. zimowy" (zakończony)

Okres: 2017-10-01 - 2018-02-18
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 45 miejsc więcej informacji
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: (brak danych)
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103400 - Instytut Radioelektroniki i Technik Multimedialnych

Zajęcia w cyklu "rok akademicki 2014/2015 - sem. zimowy" (zakończony)

Okres: 2014-09-29 - 2015-02-22
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 45 miejsc więcej informacji
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Jacek Naruniec
Prowadzący grup: Jacek Naruniec
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103400 - Instytut Radioelektroniki i Technik Multimedialnych

Zajęcia w cyklu "rok akademicki 2013/2014 - sem. zimowy" (zakończony)

Okres: 2013-10-01 - 2014-02-23
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 45 miejsc więcej informacji
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Jacek Naruniec
Prowadzący grup: Jacek Naruniec
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103400 - Instytut Radioelektroniki i Technik Multimedialnych

Zajęcia w cyklu "rok akademicki 2012/2013 - sem. zimowy" (zakończony)

Okres: 2012-10-01 - 2013-02-19
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 45 miejsc więcej informacji
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Jacek Naruniec
Prowadzący grup: Jacek Naruniec
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103400 - Instytut Radioelektroniki i Technik Multimedialnych

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.