Wstęp do bioinformatyki
Informacje ogólne
Kod przedmiotu: | 1120-IN000-MSP-0703 |
Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Wstęp do bioinformatyki |
Jednostka: | Wydział Matematyki i Nauk Informacyjnych |
Grupy: |
Przedmioty obieralne - Inżynieria i analiza danych Przedmioty obieralne, Informatyka Przedmioty obieralne, wydz. MiNI PW |
Punkty ECTS i inne: |
4.00
|
Język prowadzenia: | polski |
Skrócony opis: |
Celem wykładów jest wprowadzenie studentów w podstawowe metody i idee bioinformatyki ze specjalnym uwzględnieniem algorytmów informatycznych. Wymagania wstępne / przedmioty poprzedzające: Algorytmy i struktury danych, Statystyka, Bazy danych |
Pełny opis: |
Bioinformatyka to interdyscyplinarna dziedzina, której celem jest przetwarzanie i analiza danych biologicznych. Obejmuje ona budowę, rozwój i zastosowanie metod obliczeniowych, służących do badania struktury, funkcji, ewolucji białek. Ważnym celem bioinformatyki, szczególnie w ostatnich latach (w związku z coraz powszechniejszym zastosowaniem w biologii molekularnej tzw. technik wysokoprzepustowych) jest rozwój metod wykorzystywanych do zarządzania ogromnymi ilościami danych, zawartymi w biologicznych i medycznych bazach danych, oraz ich eksploracji (ang. data mining). Wykład obejmie różne biologiczne bazy danych i algorytmy stosowane w bioinformatyce, genetyce, biologii molekularnej i biotechnologii, a także powiązania między różnymi typami danych. Omówione zostaną podstawowe operacje na pojedynczych sekwencjach, jak również ich masowych zbiorach (metagenomika), trójwymiarowych strukturach białek i metabolitów wraz z metodami umożliwiającymi ich porównywanie, przeszukiwanie baz danych z sekwencjami nukleotydowymi, aminokwasowymi i strukturami białka. Podczas wykładu wprowadzimy koncepcję rodzin białkowych, motywy sekwencyjne i strukturalne związane z funkcją biologiczną, segregację komórek i segregację sygnałów oraz modelowanie na poziomie pojedynczej komórki. Wprowadzimy zaawansowane metody wykrywania podobieństwa między sekwencjami i strukturami oraz oceny zmienności sekwencyjnej i strukturalnej między białkami, metabolitami i kompleksami. Wykład będzie dotyczył teorii baz danych białkowych i metabolicznych, narzędzi wykorzystywanych do wizualizacji, modelowania struktur białkowych i metabolitów, reprezentacje struktury biopolimerów, kompleksów białko-metabolit, inhibitor, projektowanie leków i inhibitorów małocząsteczkowych, sieci sygnałowych i metabolicznych białek, typów sieci biologicznych, motywów funkcjonalnych białek, a także analizę danych „omicznych” w powiązaniu z podstawowymi pojęciami w biologii systemów. Wykładom będą towarzyszyły zajęcia praktyczne, na których studenci mają przeprowadzić proste zadania bioinformatyczne, w tym samodzielnie programować i przeprowadzać analizę statystyczną. Studenci zaznajomią się z podstawowymi algorytmami bioinformatycznymi, jak również istniejącymi zasobami danych biologicznych. Istotnym celem jest nauczenie studenta przeszukiwania, manipulacji i analizy danych proteomicznych, metabolicznych i systemowych. Planujemy wykorzystywanie istniejących narzędzi do budowy uliniowienia sekwencji, przewidywania struktury białek, anotacji funkcjo oraz analizy mikromacierzy, jak również bibliotek języków programowania Python i R do bioinformatycznej analizy danych (w szczególności biologicznych). Wykład: 1. Wprowadzenie. Formaty i pochodzenie analizowanych danych. Krótki zarys ich znaczenia biologicznego. Przegląd najważniejszych baz danych. 2. Analiza danych sekwencyjnych - algorytmy porównywania sekwencji, zastosowanie programowania dynamicznego, ukrytych łańcuchów Markowa, statystyczna ocena dopasowania sekwencji. 3. Algorytmy szybkiego wyszukiwania informacji z sekwencyjnych baz danych. 4. Najważniejsze metody do przewidywania struktur trzeciorzędowych i funkcji białek na podstawie sekwencji. 5. Analiza ekspresji genów. Zastosowanie metod rzutowania i wykrywania zmiennych ukrytych do analizy mikromacierzy. 6. Biologia systemowa. Algorytmy przewidywania i badania złożonych oddziaływań występujących w systemach biologicznych. 7. Metody eksploracji niesekwencyjnych baz danych, w tym danych bibliograficznych, klinicznych, struktur molekularnych czy ścieżek metabolicznych i oddziaływań pomiędzy cząsteczkami biologicznymi. 8. Wykorzystanie języków programowania do omawianych wcześniej zagadnień (Python/R). Laboratorium: 1. Wprowadzenie do biologicznych baz danych. 2. Wprowadzenie do języka programowania Python. 3. Budowa uliniowień sekwencji aminokwasowych i nukleotydowych z użyciem biblioteki BioPython. 4. Testowanie wybranego algorytmu szybkiego wyszukiwania informacji z sekwencyjnych baz danych z użyciem biblioteki BioPython. 5. Zastosowanie metod klasyfikacji opartych na rozkładach prawdopodobieństwa oraz na nieparametrycznej estymacji rozkładów prawdopodobieństwa do odtwarzania ewolucji molekularnej. 6. Budowa modeli struktur trzeciorzędowych białek na podstawie sekwencji. 7. Wprowadzenie do środowiska R. 8. Analiza ekspresji genów. Analizy mikromacierzy z zastosowaniem bibliotek dostępnych w R. 9. Metody eksploracji niesekwencyjnych baz danych, w tym danych bibliograficznych, klinicznych, struktur molekularnych czy ścieżek metabolicznych i oddziaływań pomiędzy cząsteczkami biologicznymi. |
Literatura: |
1. S. Hartmann, J. Selbig, Introductory Bioinformatics, Fourth Edition, 2013 2. J. Pevsner, Bioinformatics and Functional Genomics, Second Edition, 2009 3. J.-M. Claverie, C. Notredame, Bioinformatics for Dummies, 2nd Ed., 2011 4. J.T.L. Wang, et al., Data Mining in Bioinformatics, Springer, 2010 5. G. Alterovitz, M. Ramoni, Knowledge-Based Bioinformatics: From analysis to interpretation, Wiley, 2010 |
Metody i kryteria oceniania: |
Zaliczenie opiera się na stworzeniu w ciągu semestru czterech programów bioinformatycznych związanych z wykładem, każdy program wraz z jego opisem to maksymalnie 10 punktów. Aby zaliczyć przedmiot należy uzyskać co najmniej 20 punktów. Ocena dobra (4) to 30 punktów lub więcej, ocena bardzo dobra (5) to 38 punktów lub więcej. Student może poprawić ocenę końcową poprzez opcjonalną odpowiedź ustną. |
Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)
Okres: | 2022-02-23 - 2022-09-30 |
![]() |
Typ zajęć: |
Laboratorium, 30 godzin, 15 miejsc
Wykład, 30 godzin, 30 miejsc
|
|
Koordynatorzy: | Dariusz Plewczyński | |
Prowadzący grup: | Dariusz Plewczyński | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "rok akademicki 2020/2021 - sem. letni" (zakończony)
Okres: | 2021-02-20 - 2021-09-30 |
![]() |
Typ zajęć: |
Laboratorium, 30 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Dariusz Plewczyński | |
Prowadzący grup: | Michał Denkiewicz, Dariusz Plewczyński, Zofia Tojek | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "rok akademicki 2019/2020 - sem. zimowy" (zakończony)
Okres: | 2019-10-01 - 2020-02-21 |
![]() |
Typ zajęć: |
Laboratorium, 30 godzin, 15 miejsc
Wykład, 30 godzin, 30 miejsc
|
|
Koordynatorzy: | Dariusz Plewczyński | |
Prowadzący grup: | Dariusz Plewczyński, Michał Własnowolski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "rok akademicki 2018/2019 - sem. zimowy" (zakończony)
Okres: | 2018-10-01 - 2019-02-17 |
![]() |
Typ zajęć: |
Laboratorium, 30 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Dariusz Plewczyński | |
Prowadzący grup: | Agnieszka Kraft, Dariusz Plewczyński | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Właścicielem praw autorskich jest Politechnika Warszawska.