Politechnika Warszawska - Centralny System Uwierzytelniania
Strona główna

Metody bioinformatyki

Informacje ogólne

Kod przedmiotu: 103A-INxxx-MSP-MBI
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Metody bioinformatyki
Jednostka: Wydział Elektroniki i Technik Informacyjnych
Grupy: ( Przedmioty techniczne )---EITI
( Przedmioty zaawansowane )-Inżynieria systemów informatycznych-mgr.-EITI
( Przedmioty zaawansowane obieralne )-Elektronika i informatyka w medycynie-mgr.-EITI
( Przedmioty zaawansowane obieralne )-Informatyka biomedyczna-mgr.-EITI
( Przedmioty zaawansowane obieralne )-Inżynieria biomedyczna-mgr.-EITI
( Przedmioty zaawansowane techniczne )--mgr.-EITI
( Zastosowania )-Sztuczna inteligencja-mgr.-EITI
Punkty ECTS i inne: 4.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Jednostka decyzyjna:

103000 - Wydział Elektroniki i Technik Informacyjnych

Kod wydziałowy:

MBI

Numer wersji:

1

Skrócony opis:

Celem przedmiotu jest zapoznanie słuchaczy z zagadnieniami przetwarzania informacji o sekwencjach biologicznych. Współcześnie biologia wykorzystuje najnowsze osiągnięcia w dziedzinie sztucznej inteligencji w celu odkrywania informacji zawartej w sekwencjach cząstek DNA, RNA i białek. Wykład dostarcza niezbędnej wiedzy o biologii molekularnej z punktu widzenia informatyki, a następnie skupia się na głównych zagadnieniach analizy sekwencji biologicznych. Prezentowane zagadnienia mają szerokie zastosowanie we współczesnej biologii i medycynie, np. do diagnozowania chorób. Ćwiczenia pozwalają praktycznie wykonać typowe analizy.

Pełny opis:

Celem przedmiotu jest zapoznanie słuchaczy z zagadnieniami przetwarzania informacji o sekwencjach biologicznych. Współcześnie biologia wykorzystuje najnowsze osiągnięcia w dziedzinie sztucznej inteligencji w celu odkrywania informacji zawartej w sekwencjach cząstek DNA, RNA i białek. Wykład dostarcza niezbędnej wiedzy o biologii molekularnej z punktu widzenia informatyki, a następnie skupia się na głównych zagadnieniach analizy sekwencji biologicznych. Prezentowane zagadnienia mają szerokie zastosowanie we współczesnej biologii i medycynie, np. do diagnozowania chorób. Ćwiczenia pozwalają praktycznie wykonać typowe analizy.


Treść wykładu

  1. Omówienie zagadnień biologii molekularnej dla potrzeb informatyki, budowa cząsteczek DNA, RNA, białka, podstawowe reakcje, budowa genomu, procesy pozyskiwania sekwencji biologicznych, rola informatyki we współczesnej biologii i medycynie.

  2. Badanie podobieństw sekwencji biologicznych, programowanie dynamiczne, podobieństwa lokalne i podobieństwa globalne, tworzenie macierzy podobieństwa, badanie podobieństw grup sekwencji, profile, wyszukiwanie motywów, algorytmy heurystyczne, FASTA, BLAST, filtr Blooma.

  3. Bazy danych dla sekwencji biologicznych, przechowywanie, wyszukiwanie, istotność wyników wyszukiwania, formaty danych.

  4. Odczyt sekwencji genomu, tworzenie map fizycznych i genetycznych, mapy restrykcyjne. Analiza wyników sekwenatorów, assembling DNA, algorytmy oparte o graf de Brujna, algorytmy oparte o grafy pokrycia, obliczanie konsensusu, uwzględnianie par odczytów, kontig fizyczny, kontig sekwencyjny.

  5. Analizy wykorzystujące genom referencyjny, transformata Burrowsa-Wheelera, pliki BAM, wykrywanie wariantów genetycznych.

  6. Budowa i analiza drzew filogenetycznych.

  7. Algorytmy redukcji wymiarów, grupowanie hierarchiczne i niehierarchiczne.

  8. Analizy haplotypów, rozkład wariantów na chromosomach, analiza mieszanin DNA.

  9. Adnotacja DNA, sekwencje kodujące i niekodujące, algorytmy oparte o ukryty model Markowa, problem dekodowania, algorytm Viterbiego, algorytm prefiksowy i sufiksowy, estymacja parametrów modelu Markowa, algorytm Bauma-Welcha.

  10. Wybrane algorytmy wykorzystywane w biologii syntetycznej, przewidywanie struktur drugorzędowych cząsteczek DNA i RNA.

  11. Wykorzystanie DNA do obliczeń, DNA komputer.


Zakres projektu
Projekt polega na analizie danych bilogicznych z użyciem otwartego oprogramowania. Projekt demonstruje często wykonywane analizy danych biologicznych. Przygotowano cztery zadania opisane niżej. Każde zadanie zajmuje ok. 2 godziny pracy przy komputerze typu PC. Zadanie można wykonać samodzielnie lub z pomocą i asystą prowadzącego; udostepniamy odpowiednio skonfigurowane oprogramowanie dla systemu Linux.
  1. Assembling DNA. Pobranie sekwencji z ogólnodostępnej bazy danych, generowanie odczytów zawierających błędy, uruchomienia assemblera de-novo, generowanie statystyk opisujących wyniki, analiza wyników.

  2. Adnotacja DNA. Pobranie zbioru kontigów (wyjście assemblera de-novo), adnotacja strukturalna - znajdowanie części kodujących i niekodujących, adnotacja funkcjonalna wykorzystując podobieństwo do opisanych elementów w bazie danych, analiza wyników.

  3. Resekwencjonowanie. Pobranie sekwencji chromosomu ludzkiego z ogólnie dostępnej bazy danych, pobranie genomu referencyjnego, generowanie odczytów, mapowanie odczytów na genom referencyjny, znajdowanie wariantów (różnic pomiędzy genomem badanym a referencyjnym).

  4. Analiza wariantów. Pobranie listy wariantów genetycznych oraz zbioru odczytów, analizy związane z głębokością pokrycia, wykrywanie zmian strukturalnych, szeregowanie znalezionych zmian uwzględniając ich istotność.

Literatura:

  1. Jin Xiong, Podstawy bioinformatyki, PWN, 2011.

  2. P. Higgs, T. Attwood, Bioinformatyka i ewolucja molekularna, PWN, 2008.

  3. V. Makinen, D. Belazzougui, F. Cunial, A. Tomescu, Genome-Scale Algorithm design, Cambridge 2015.

  4. Wing-Kin Sung, Algorithms for next-generation sequencing, CRC Press 2017.

Zajęcia w cyklu "rok akademicki 2023/2024 - sem. letni" (w trakcie)

Okres: 2024-02-19 - 2024-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Tomasz Gambin, Wiktor Kuśmirek, Jan Mulawka, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2023/2024 - sem. zimowy" (zakończony)

Okres: 2023-10-01 - 2024-02-18
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Tomasz Gambin, Wiktor Kuśmirek, Jan Mulawka, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2022/2023 - sem. letni" (zakończony)

Okres: 2023-02-20 - 2023-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Tomasz Gambin, Wiktor Kuśmirek, Jan Mulawka, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2022/2023 - sem. zimowy" (zakończony)

Okres: 2022-10-01 - 2023-02-19
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Tomasz Gambin, Wiktor Kuśmirek, Jan Mulawka, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)

Okres: 2022-02-23 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Tomasz Gambin, Wiktor Kuśmirek, Jan Mulawka, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. zimowy" (zakończony)

Okres: 2021-10-01 - 2022-02-22
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Wiktor Kuśmirek, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2020/2021 - sem. letni" (zakończony)

Okres: 2021-02-20 - 2021-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Tomasz Gambin, Wiktor Kuśmirek, Jan Mulawka, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2020/2021 - sem. zimowy" (zakończony)

Okres: 2020-10-01 - 2021-02-19
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 60 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2019/2020 - sem. letni" (zakończony)

Okres: 2020-02-22 - 2020-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Tomasz Gambin, Wiktor Kuśmirek, Jan Mulawka, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2019/2020 - sem. zimowy" (zakończony)

Okres: 2019-10-01 - 2020-02-21
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 48 miejsc więcej informacji
Wykład, 30 godzin, 48 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. letni" (zakończony)

Okres: 2019-02-18 - 2019-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Tomasz Gambin, Wiktor Kuśmirek, Jan Mulawka, Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. zimowy" (zakończony)

Okres: 2018-10-01 - 2019-02-17
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Projekt, 15 godzin, 48 miejsc więcej informacji
Wykład, 30 godzin, 48 miejsc więcej informacji
Koordynatorzy: Robert Nowak
Prowadzący grup: Robert Nowak
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Jednostka realizująca:

103200 - Instytut Informatyki

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.
pl. Politechniki 1, 00-661 Warszawa tel: (22) 234 7211 https://pw.edu.pl kontakt deklaracja dostępności USOSweb 7.0.0.0-7 (2024-03-18)