Analiza i przetwarzanie dźwięku
Informacje ogólne
Kod przedmiotu: | 1120-IN000-ISP-0693 |
Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Analiza i przetwarzanie dźwięku |
Jednostka: | Wydział Matematyki i Nauk Informacyjnych |
Grupy: |
Przedmioty obieralne, Informatyka Przedmioty obieralne, wydz. MiNI PW |
Punkty ECTS i inne: |
4.00
|
Język prowadzenia: | polski |
Liczba godzin zajęć praktycznych: | 15 godz. - laboratorium 15 godz. - projekt |
Liczba godzin zajęć teoretycznych: | 30 godz. - wykład |
Skrócony opis: |
Wymagania wstępne / przedmioty poprzedzające: Elementy algebry liniowej, analizy matematycznej i statystyki, podstawy informatyki i metod numerycznych. Cel przedmiotu: Zdobycie wiedzy w zakresie metod i algorytmów analizy i przetwarzania dźwięku, w szczególności mowy. Nabycie umiejętności w implementacji oraz zastosowaniu technik przetwarzania dźwięku i mowy. Zdobycie podstawowych umiejętności modyfikacji oraz rozwoju metod przetwarzania dźwięku, w szczególności metod związanych z syntezą mowy. |
Pełny opis: |
Wykład: Właściwości słuchu człowieka, wysokość, natężenie, barwa dźwięku. Tor głosowy człowieka. Cyfrowe reprezentacje sygnału dźwiękowego; próbko-wanie, kwantyzacja; transformacja Z; transformacja kosinusowa, transfor-macja falkowa. Architektura cyfrowego toru dźwiękowego. Konwertery analogowo-cyfrowy i cyfrowo-analogowy. Podstawowe operacje na cyfrowym sygnale dźwiękowym: miksowanie sy-gnałów, filtracja sygnałów, obliczenie czasowych charakterystyk sygnału: wartość średnia, energia, liczba przejść przez zero, przekształcenie Fouriera; wyodrębnianie pauz, filtracja, oszacowanie podstawowej częstotliwości dźwięku. Przetwarzanie sygnału dźwiękowego: ograniczenie i kompansja, predykcja liniowa, filtracja adaptacyjna, metody rekonstruowania sygnału dźwiękowego. Kodowanie i kompresja sygnału dźwiękowego. Kodowanie protekcyjne, kanałowe, perceptualne. Mechanizm wytwarzania sygnału mowy. Modele procesu wytwarzania mowy. Parametry mowy: częstotliwość tonu podstawowego, formanty, parametry cepstralne, parametry LPC. Perceptualne skale częstotliwości: oktawowa, melowa, barkowa, parametry mel-cepstralne. Podstawy fonetyczne analizy i syntezy mowy. Rodzaje syntezatorów. Synteza formantowa, konkatenacyjna, korpusowa, HMM. Laboratorium: Metody cyfrowej reprezentacji sygnału dźwiękowego. Zastosowania analizy częstotliwościowej dźwięku: detekcja częstotliwości podstawowej dźwięku, analiza sygnału mowy, filtracja, kompresja. Metody syntezy dźwięku: elementy syntezy parametrycznej, elementy syntezy konkatenacyjnej. Metody rozpoznawania mowy: parametryczne, DTW, HMM. Projekt: Projekty związany z przetwarzaniem dźwięku lub mowy, opracowanie i im-plementacja. „Zajęcia zostały przygotowane i będą prowadzone z wykorzystaniem umiejętności prezentacyjnych” |
Literatura: |
1. E. Ozimek, Dźwięk i jego percepcja. Aspekty fizyczne i psychoakustyczne, PWN 2002. 2. W. M. Hartmann, Signals, Sound, and Sensation, AIP Press, Springer-Verlag, New York 1998. 3. T. P. Zieliński, Cyfrowe przetwarzanie sygnałów. Od teorii do zastosowań, 2014. 4. P. Taylor, Text-to-speech Synthesis, Cambridge University Press, 2009. Oprogramowanie: 5. Praat, Matlab, MS-VS. |
Efekty uczenia się: |
Wiedza: W01 - Zna pojęcia z zakresu analizy i przetwarzania sygnałów dźwiękowych; zna zagadnienia związane z cyfrowym przetwarzaniem, kompresją oraz kodowaniem dźwięku (K_W03, K_W08) W02 - Zna zagadnienia związane z wytwarzaniem, analizą oraz przetwarzaniem sygnału mowy; zna podstawy fonetycznej analizy mowy oraz systemy syntezy mowy (K_W03, K_W08) Umiejętności: U01 - Potrafi dokonać analizy sygnału dźwiękowego w oparciu o jego parametry w dziedzinie czasu i dziedzinie częstotliwości oraz przeprowadzić modyfikacje cyfrowego sygnału dźwiękowego: miksowanie sygnałów, filtrację sygnałów, kompresję; umie zaimplementować algorytmy analizy i przetwarzania dźwięku (K_U08, K_U09, K_U11) U02 - Potrafi przeprowadzić analizę sygnału mowy, wyznaczyć parametry mowy oraz zaprojektować i zaimplementować układy przetwarzania mowy (K_U08, K_U09, K_U11) Kompetencje społeczne: K01 - Potrafi pracować indywidualnie i w zespole oraz zarządzać swoim czasem i dotrzymywać terminów (K_K05, K_K06) |
Metody i kryteria oceniania: |
Projekt: Ocena punktowa każdego etapu projektu. Zalicza 51% punktów. Zaliczenie laboratorium: Oceniana praca na zajęciach, oraz ocena prezentacji. Zaliczone laboratorium i projekt uprawniają do podejścia do zaliczenia wykładu. Zaliczenie wykładu w formie testu pisemnego. Ocena końcowa jest średnią ważoną ocen z zaliczenia laboratorium i projektu i wykładu. |
Zajęcia w cyklu "rok akademicki 2022/2023 - sem. letni" (zakończony)
Okres: | 2023-02-20 - 2023-09-30 |
Przejdź do planu
PN WT ŚR CZ WYK
PT LAB
PRO
LAB
PRO
LAB
PRO
LAB
PRO
|
Typ zajęć: |
Laboratorium, 15 godzin
Projekt, 15 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Janusz Rafałko | |
Prowadzący grup: | Janusz Rafałko | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)
Okres: | 2022-02-23 - 2022-09-30 |
Przejdź do planu
PN WT ŚR CZ PT WYK
PRO
LAB
LAB
PRO
|
Typ zajęć: |
Laboratorium, 15 godzin
Projekt, 15 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Janusz Rafałko | |
Prowadzący grup: | Janusz Rafałko | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "rok akademicki 2020/2021 - sem. letni" (zakończony)
Okres: | 2021-02-20 - 2021-09-30 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 15 godzin
Projekt, 15 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Janusz Rafałko | |
Prowadzący grup: | Janusz Rafałko | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "rok akademicki 2019/2020 - sem. letni" (zakończony)
Okres: | 2020-02-22 - 2020-09-30 |
Przejdź do planu
PN WT ŚR WYK
CZ LAB
PRO
LAB
PRO
PT |
Typ zajęć: |
Laboratorium, 15 godzin, 15 miejsc
Projekt, 15 godzin, 15 miejsc
Wykład, 30 godzin, 30 miejsc
|
|
Koordynatorzy: | Janusz Rafałko | |
Prowadzący grup: | Janusz Rafałko | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "rok akademicki 2018/2019 - sem. letni" (zakończony)
Okres: | 2019-02-18 - 2019-09-30 |
Przejdź do planu
PN WT ŚR CZ WYK
LAB
PRO
PT |
Typ zajęć: |
Laboratorium, 15 godzin
Projekt, 15 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Janusz Rafałko | |
Prowadzący grup: | Janusz Rafałko | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Właścicielem praw autorskich jest Politechnika Warszawska.