Politechnika Warszawska - Centralny System Uwierzytelniania
Strona główna

Analiza i przetwarzanie dźwięku

Informacje ogólne

Kod przedmiotu: 1120-IN000-ISP-0693
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Analiza i przetwarzanie dźwięku
Jednostka: Wydział Matematyki i Nauk Informacyjnych
Grupy: Przedmioty obieralne, Informatyka
Przedmioty obieralne, wydz. MiNI PW
Punkty ECTS i inne: 4.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Liczba godzin zajęć praktycznych:

15 godz. - laboratorium

15 godz. - projekt

Liczba godzin zajęć teoretycznych:

30 godz. - wykład

Skrócony opis:

Wymagania wstępne / przedmioty poprzedzające:

Elementy algebry liniowej, analizy matematycznej i statystyki, podstawy informatyki i metod numerycznych.

Cel przedmiotu:

Zdobycie wiedzy w zakresie metod i algorytmów analizy i przetwarzania dźwięku, w szczególności mowy. Nabycie umiejętności w implementacji oraz zastosowaniu technik przetwarzania dźwięku i mowy. Zdobycie podstawowych umiejętności modyfikacji oraz rozwoju metod przetwarzania dźwięku, w szczególności metod związanych z syntezą mowy.

Pełny opis:

Wykład:

Właściwości słuchu człowieka, wysokość, natężenie, barwa dźwięku. Tor głosowy człowieka. Cyfrowe reprezentacje sygnału dźwiękowego; próbko-wanie, kwantyzacja; transformacja Z; transformacja kosinusowa, transfor-macja falkowa. Architektura cyfrowego toru dźwiękowego. Konwertery analogowo-cyfrowy i cyfrowo-analogowy.

Podstawowe operacje na cyfrowym sygnale dźwiękowym: miksowanie sy-gnałów, filtracja sygnałów, obliczenie czasowych charakterystyk sygnału: wartość średnia, energia, liczba przejść przez zero, przekształcenie Fouriera; wyodrębnianie pauz, filtracja, oszacowanie podstawowej częstotliwości dźwięku.

Przetwarzanie sygnału dźwiękowego: ograniczenie i kompansja, predykcja liniowa, filtracja adaptacyjna, metody rekonstruowania sygnału dźwiękowego. Kodowanie i kompresja sygnału dźwiękowego. Kodowanie protekcyjne, kanałowe, perceptualne.

Mechanizm wytwarzania sygnału mowy. Modele procesu wytwarzania mowy. Parametry mowy: częstotliwość tonu podstawowego, formanty, parametry cepstralne, parametry LPC. Perceptualne skale częstotliwości: oktawowa, melowa, barkowa, parametry mel-cepstralne. Podstawy fonetyczne analizy i syntezy mowy. Rodzaje syntezatorów. Synteza formantowa, konkatenacyjna, korpusowa, HMM.

Laboratorium:

Metody cyfrowej reprezentacji sygnału dźwiękowego.

Zastosowania analizy częstotliwościowej dźwięku: detekcja częstotliwości podstawowej dźwięku, analiza sygnału mowy, filtracja, kompresja.

Metody syntezy dźwięku: elementy syntezy parametrycznej, elementy syntezy konkatenacyjnej.

Metody rozpoznawania mowy: parametryczne, DTW, HMM.

Projekt:

Projekty związany z przetwarzaniem dźwięku lub mowy, opracowanie i im-plementacja.

„Zajęcia zostały przygotowane i będą prowadzone z wykorzystaniem umiejętności prezentacyjnych”

Literatura:

1. E. Ozimek, Dźwięk i jego percepcja. Aspekty fizyczne i psychoakustyczne, PWN 2002.

2. W. M. Hartmann, Signals, Sound, and Sensation, AIP Press, Springer-Verlag, New York 1998.

3. T. P. Zieliński, Cyfrowe przetwarzanie sygnałów. Od teorii do zastosowań, 2014.

4. P. Taylor, Text-to-speech Synthesis, Cambridge University Press, 2009.

Oprogramowanie:

5. Praat, Matlab, MS-VS.

Efekty uczenia się:

Wiedza:

W01 - Zna pojęcia z zakresu analizy i przetwarzania sygnałów dźwiękowych; zna zagadnienia związane z cyfrowym przetwarzaniem, kompresją oraz kodowaniem dźwięku (K_W03, K_W08)

W02 - Zna zagadnienia związane z wytwarzaniem, analizą oraz przetwarzaniem sygnału mowy; zna podstawy fonetycznej analizy mowy oraz systemy syntezy mowy (K_W03, K_W08)

Umiejętności:

U01 - Potrafi dokonać analizy sygnału dźwiękowego w oparciu o jego parametry w dziedzinie czasu i dziedzinie częstotliwości oraz przeprowadzić modyfikacje cyfrowego sygnału dźwiękowego: miksowanie sygnałów, filtrację sygnałów, kompresję; umie zaimplementować algorytmy analizy i przetwarzania dźwięku (K_U08, K_U09, K_U11)

U02 - Potrafi przeprowadzić analizę sygnału mowy, wyznaczyć parametry mowy oraz zaprojektować i zaimplementować układy przetwarzania mowy (K_U08, K_U09, K_U11)

Kompetencje społeczne:

K01 - Potrafi pracować indywidualnie i w zespole oraz zarządzać swoim czasem i dotrzymywać terminów (K_K05, K_K06)

Metody i kryteria oceniania:

Projekt: Ocena punktowa każdego etapu projektu. Zalicza 51% punktów. Zaliczenie laboratorium: Oceniana praca na zajęciach, oraz ocena prezentacji.

Zaliczone laboratorium i projekt uprawniają do podejścia do zaliczenia wykładu.

Zaliczenie wykładu w formie testu pisemnego.

Ocena końcowa jest średnią ważoną ocen z zaliczenia laboratorium i projektu i wykładu.

Zajęcia w cyklu "rok akademicki 2022/2023 - sem. letni" (zakończony)

Okres: 2023-02-20 - 2023-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Projekt, 15 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Janusz Rafałko
Prowadzący grup: Janusz Rafałko
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)

Okres: 2022-02-23 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Projekt, 15 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Janusz Rafałko
Prowadzący grup: Janusz Rafałko
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę

Zajęcia w cyklu "rok akademicki 2020/2021 - sem. letni" (zakończony)

Okres: 2021-02-20 - 2021-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Projekt, 15 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Janusz Rafałko
Prowadzący grup: Janusz Rafałko
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę

Zajęcia w cyklu "rok akademicki 2019/2020 - sem. letni" (zakończony)

Okres: 2020-02-22 - 2020-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin, 15 miejsc więcej informacji
Projekt, 15 godzin, 15 miejsc więcej informacji
Wykład, 30 godzin, 30 miejsc więcej informacji
Koordynatorzy: Janusz Rafałko
Prowadzący grup: Janusz Rafałko
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. letni" (zakończony)

Okres: 2019-02-18 - 2019-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Projekt, 15 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Janusz Rafałko
Prowadzący grup: Janusz Rafałko
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.
pl. Politechniki 1, 00-661 Warszawa tel: (22) 234 7211 https://pw.edu.pl kontakt deklaracja dostępności USOSweb 7.0.2.0-2 (2024-03-29)