Politechnika Warszawska - Centralny System Uwierzytelniania
Nie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Image and Speech Recognition

Informacje ogólne

Kod przedmiotu: 103A-CTCSN-MSA-EIASR Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Image and Speech Recognition
Jednostka: Wydział Elektroniki i Technik Informacyjnych
Grupy: ( Computer Systems and Networks - Advanced )-Computer Systems and Networks-M.Sc.-EITI
( Courses in English )--eng.-EITI
( Przedmioty techniczne )---EITI
( Przedmioty zaawansowane )-Systemy informacyjno-decyzyjne-mgr.-EITI
( Przedmioty zaawansowane obieralne )-Automatyka i robotyka-mgr.-EITI
( Przedmioty zaawansowane techniczne )--mgr.-EITI
( Technical Courses )--eng.-EITI
Punkty ECTS i inne: 6.00
Język prowadzenia: angielski
Jednostka decyzyjna:

103000 - Wydział Elektroniki i Technik Informacyjnych

Kod wydziałowy:

EIASR

Numer wersji:

1

Skrócony opis:

Celem przedmiotu jest zapoznanie z metodami komputerowej analizy obrazów cyfrowych i sygnałów mowy. W szczególności w zakresie rozpoznawania obrazów omawiane są zagadnienia: cyfrowej reprezentacji i segmentacji obrazów, rozpoznawania 2-wym. i 3-wym. obiektów oraz detekcji ruchu w sekwencji obrazów. W zakresie rozpoznawania mowy prezentowane są zagadnienia: reprezentacji cyfrowego sygnału, detekcji cech segmentu i jego klasyfikacji w terminach pod-fonemów oraz rozpoznawania słów. Podczas ćwiczeń metody wprowadzone na wykładzie są wyjaśniane na praktycznych przykładach. W ramach projektu wymagana jest programowa realizacja wybranego zadania, dotyczącego rozpoznawania obrazów lub sygnału mowy.

Pełny opis: (tylko po angielsku)

The goal is to introduce computational methods for image and speech analysis. In particular the following topics of image recognition are presented: image compression and segmentation, image classification, object recognition and motion detection in image sequences. In the area of speech recognition the methods for speech signal representation and segmentation, phoneme-based classification and isolated word recognition, are introduced. During exercises the methods, introduced in the lecture, are applied for solutions of practical problems. The project consists of programming some image or speech recognition task.


Lecture contents

  1. Introduction to image recognition (2h).

    • Digital image representation.
    • Scene-to-image mapping.
    • Statistics in pattern description.

  2. Image segmentation (4h).

    • Edge images.
    • Line segment detection.
    • Region detection.
    • Texture features.


  3. Classification of patterns (3h)

    • The optimum classifier.
    • Numerical classifiers.
    • Neural classifiers.


  4. Recognition of image objects (3h).

    • Dynamic programming.
    • Hypothesise-and-test approach for 2-D and 3-D objects.
    • Optimum space search.
    • The MAP estimation of generic 3-D objects.

  5. Motion detection and estimation (2h)

    • Image motion detection.
    • Optical flow estimation.
    • Motion of discrete image features.


  6. Introduction to speech recognition systems (1h).

    • System structure.
    • Features.
    • Acoustic-phonetic model.
    • Word model.

  7. Speech representation and enhancement (3h).

    • Digital speech representation.
    • Blind source separation and deconvolution.


  8. Feature detection and classification (3h).

    • Fourier Transform.
    • Mel-cepstral features.
    • LPC featurs.
    • Feature classification.


  9. Acoustic-phonetic word models (4h).

    • Phonetic sound categories.
    • Spectrogram reading.
    • Context-dependent sub-sounds


  10. Word model training and recognition (3h).

    • A HMM word model.
    • Viterbi search.
    • Baum-Welch and Viterbi training.




Tutorial contents
  1. Statistics in pattern recognition. A simple word recognition system.

  2. Image segmentation.

  3. Pattern classification.

  4. 2-D and 3-D object recognition.

  5. Motion estimation.

  6. Speech source separation.

  7. Speech feature detection and classification.

  8. Sound and word modelling.



  9. Projects contents
    Region growing and motion detection. Contour-based object recognition. Model-based 3-D object recognition. Texture detection and classification. The blind separation of sound sources. Phoneme-based word recognition. Word recognition by spectrogram-image classification.


Similar Courses
CodeNameDiscount ECTS
103A-INSID-MSP-ROSMRozpoznawanie obrazów i sygnałów mowy6

Literatura: (tylko po angielsku)

    Basic bibliography:

    1. W. Kasprzak: Image and speech recognition, lecture notes, WUT, Warszawa, 2001-3, 170 pages.

    2. W. Kasprzak: Image and speech recognition. Exercises,WUT, Warszawa, 2001-3, 13 pages.


    Additional bibliography:

    1. H. Niemann: Pattern Analysis and Understanding, Springer, Berlin, 1990.

    2. Documentation of the CSLU Speech Toolkit. Oregon Graduate Institute, 2000.

    3. L. Rabiner, B.-H. Juang: Fundamentals of speech recognition. Prentice Hall, New York, 1993.

    4. R. Duda, P. Hart, D. Stork, Pattern Classification, 2nd edition, John Wiley, 2001.

Zajęcia w cyklu "rok akademicki 2020/2021 - sem. zimowy" (w trakcie)

Okres: 2020-10-01 - 2021-02-12
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 45 miejsc więcej informacji
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak, Maciej Stefańczyk, Artur Wilkowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2019/2020 - sem. zimowy" (zakończony)

Okres: 2019-10-01 - 2020-02-21
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 45 miejsc więcej informacji
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak, Maciej Stefańczyk, Artur Wilkowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. letni" (zakończony)

Okres: 2019-02-18 - 2019-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 1 miejsc więcej informacji
Projekt, 15 godzin, 1 miejsc więcej informacji
Wykład, 30 godzin, 1 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. zimowy" (zakończony)

Okres: 2018-10-01 - 2019-02-17
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 45 miejsc więcej informacji
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak, Maciej Stefańczyk, Artur Wilkowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2017/2018 - sem. letni" (zakończony)

Okres: 2018-02-19 - 2018-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 35 miejsc więcej informacji
Projekt, 15 godzin, 35 miejsc więcej informacji
Wykład, 30 godzin, 35 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak, Maciej Stefańczyk
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2017/2018 - sem. zimowy" (zakończony)

Okres: 2017-10-01 - 2018-02-18
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 48 miejsc więcej informacji
Projekt, 15 godzin, 48 miejsc więcej informacji
Wykład, 30 godzin, 48 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2016/2017 - sem. zimowy" (zakończony)

Okres: 2016-10-01 - 2017-02-19
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 35 miejsc więcej informacji
Projekt, 15 godzin, 35 miejsc więcej informacji
Wykład, 30 godzin, 35 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2015/2016 - sem. zimowy" (zakończony)

Okres: 2015-10-01 - 2016-02-22
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 35 miejsc więcej informacji
Projekt, 15 godzin, 35 miejsc więcej informacji
Wykład, 30 godzin, 35 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2014/2015 - sem. zimowy" (zakończony)

Okres: 2014-09-29 - 2015-02-22
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 35 miejsc więcej informacji
Projekt, 15 godzin, 35 miejsc więcej informacji
Wykład, 30 godzin, 35 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2013/2014 - sem. zimowy" (zakończony)

Okres: 2013-10-01 - 2014-02-23
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 30 miejsc więcej informacji
Projekt, 15 godzin, 30 miejsc więcej informacji
Wykład, 30 godzin, 30 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2012/2013 - sem. zimowy" (zakończony)

Okres: 2012-10-01 - 2013-02-19
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 35 miejsc więcej informacji
Projekt, 15 godzin, 35 miejsc więcej informacji
Wykład, 30 godzin, 35 miejsc więcej informacji
Koordynatorzy: Włodzimierz Kasprzak
Prowadzący grup: Włodzimierz Kasprzak
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.