Politechnika Warszawska - Centralny System Uwierzytelniania
Strona główna

Analiza semantyczna obrazu

Informacje ogólne

Kod przedmiotu: 103A-xxxxx-MSP-ASO
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Analiza semantyczna obrazu
Jednostka: Wydział Elektroniki i Technik Informacyjnych
Grupy: ( Analiza multimediów )-Informatyka w multimediach-mgr.-EITI
( Przedmioty techniczne )---EITI
( Przedmioty zaawansowane obieralne )-Techniki bezprzewodowe i multimedialne-mgr.-EITI
( Przedmioty zaawansowane techniczne )--mgr.-EITI
( Zastosowania )-Sztuczna inteligencja-mgr.-EITI
Punkty ECTS i inne: 4.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Jednostka decyzyjna:

103000 - Wydział Elektroniki i Technik Informacyjnych

Kod wydziałowy:

ASO

Numer wersji:

1

Skrócony opis:

Przedmiot zawiera, dyskusję podstawowych i zaawansowanych metod analizy semantycznej obrazu. W ramach przedmiotu słuchacz zostanie zaznajomiony z metodami analizy obrazów statycznych, zmiennych w czasie, wielospektralnych. Pokazanie skuteczności wprowadzonych metod w rozwiazywaniu praktycznych problemów automatycznego rozpoznawania (np.: kodu pocztowego, zdjęć twarzy, poleceń dla komputera wydawanych głosem).

Pełny opis:

Treść wykładu

  1. Wprowadzenie. Ilustracja toru analizy obrazu na przykładach (aktywizacja sygnału, przetwarzanie wstępne, segmentacja, ekstrakcja cech, klasyfikacja, przetwarzanie danych klasyfikacyjnych).
  2. Analiza kształtu. Omówienie zagadniej z zakresu: cech geometrycznych, cech momentowych, operatorów morfologicznych.
  3. Zastosowania reprezentacji sygnału w dziedzinie częstości. Reprezentacja Fouriera, DWT, EMD, VMD i ich zastosowanie w ekstrakcji cech z obrazu.
  4. Transformacje Hougha. Podstawowy algorytm Hougha, detekcja linii,dwystopniowy algorytm Hougha i jego optymalizacja, algorytm Hougha z informacją gradientową, zastosowanie do lokalizacji twarzy w obrazie, metoda Ballarda detekcji dowolnych kszałtów;
  5. Algorytmy klasteryzacji danych: algorytm centroidów (LGB), jego analiza i postać neuronowa, metoda ewolucyjna VQ, algorytm neuronowy LVQ. Redukcjia wymiarowości sygnału – analiza obrazów hiperspektralnych.
  6. Zaawansowane techniki analizy i indeksowania obrazów - metody przetwarzania i analizy obrazu, detekcja zdarzeń, śledzenie ruchu, indeksowanie obrazu. Segmentacja obrazów cyfrowych i metody jej realizacji. Metody statystyczne w przetwarzaniu obrazów cyfrowych.
  7. Podstawy projektowania systemów semantycznej analizy obrazów - omówienie pełnej ścieżki projektowania, od analizy wymagań, poprzez tworzenie projektu właściwego po końcowe testowanie. Testowanie systemów - metody testowania jakości toru przetwarzania obrazu. Przegląd metodyk, narzędzi i architektur.
  8. Zastosowanie głebokich sieci neuronowych do semantycznej analizy danych obrazowych. Przegląd rozwiązań. Przykładowe architektury i modele.

Projekt:

Celem projektu jest opracowanie kompletnego systemu bazującego na metodach sementycznej analizy obrazów rozwiązującego konkretne zadanie. System powinien zawierać moduły:

  • pozyskiwania danych obrazowych
  • przetwarzania obrazów
  • analizy obrazów



W ramach realizacji zadania projektowego przewidziane są cztery spotkania ewaluacyjne mające na celu wspólną ocenę osiągniętych kamieni milowych projektu.

  1. Analiza przedstawionego problemu i zaproponowanie rozwiązań,
  2. Przygotowanie danych obrazowych i/lub budowa układu wizyjnego,
  3. Implementację systemu realizującego główne wymagania techniczne projektu,
  4. Przeprowadzenie eksperymentu umożliwiającego testowanie opracowanego rozwiązania.
Literatura:

Literatura i oprogramowanie:

  1. Cremers Daniel, Video Processing and Computational Video, International Seminar, Dagstuhl Castle, Germany, 2010,
  2. McAndrew Alasdair, Computational Introduction to Digital Image Processing
  3. A.J. Jain: Fundamentals of digital image processing, Prentice-Hall, 1995
  4. C. Bishop: Neural networks for recognition, Clarendon Press, 1995
  5. A. Pandya, R. Macy: Pattern recognition with neural networks in C++, CRC Press, 1996
  6. Richard Szeliski, Computer Vision: Algorithms and Applications, Springer 2010

Zajęcia w cyklu "rok akademicki 2023/2024 - sem. letni" (w trakcie)

Okres: 2024-02-19 - 2024-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Piotr Garbat, Agnieszka Mossakowska-Wyszyńska
Prowadzący grup: Aleksandra Dzieniszewska, Piotr Garbat
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103500 - Instytut Mikroelektroniki i Optoelektroniki

Zajęcia w cyklu "rok akademicki 2022/2023 - sem. letni" (zakończony)

Okres: 2023-02-20 - 2023-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 55 miejsc więcej informacji
Wykład, 30 godzin, 55 miejsc więcej informacji
Koordynatorzy: Piotr Garbat, Agnieszka Mossakowska-Wyszyńska
Prowadzący grup: Aleksandra Dzieniszewska, Piotr Garbat
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103500 - Instytut Mikroelektroniki i Optoelektroniki

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)

Okres: 2022-02-23 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Piotr Garbat, Agnieszka Mossakowska-Wyszyńska
Prowadzący grup: Piotr Garbat
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103500 - Instytut Mikroelektroniki i Optoelektroniki

Zajęcia w cyklu "rok akademicki 2020/2021 - sem. letni" (zakończony)

Okres: 2021-02-20 - 2021-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 30 miejsc więcej informacji
Wykład, 30 godzin, 30 miejsc więcej informacji
Koordynatorzy: Piotr Garbat
Prowadzący grup: Piotr Garbat
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103400 - Instytut Radioelektroniki i Technik Multimedialnych
103500 - Instytut Mikroelektroniki i Optoelektroniki

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.
pl. Politechniki 1, 00-661 Warszawa tel: (22) 234 7211 https://pw.edu.pl kontakt deklaracja dostępności USOSweb 7.0.0.0-7 (2024-03-18)