Analiza i wizualizacja danych w języku R
Informacje ogólne
Kod przedmiotu: | 6603A-KDPL-AWDJR |
Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Analiza i wizualizacja danych w języku R |
Jednostka: | Wydział Fizyki |
Grupy: | |
Punkty ECTS i inne: |
2.00
|
Język prowadzenia: | polski |
Skrócony opis: |
Język R jest otwartym, darmowym i szybko rozwijającym się środowiskiem przeznaczonym przede wszystkim do analizy i wizualizacji danych. Dzięki bardzo łatwej składni i wielkiej liczbie bibliotek jest wykorzystywany zarówno w nauce jak i w biznesie przez zespoły badawczo-rozwojowe na całym świecie. Celem przedmiotu jest zapoznanie słuchaczy z podstawami języka R oraz nauczenie ich metod analizy i wizualizacji danych w tym języku. |
Pełny opis: |
Język R jest otwartym, darmowym i szybko rozwijającym się środowiskiem przeznaczonym przede wszystkim do analizy i wizualizacji danych. Dzięki bardzo łatwej składni i wielkiej liczbie bibliotek jest wykorzystywany zarówno w nauce jak i w biznesie przez zespoły badawczo-rozwojowe na całym świecie. Celem przedmiotu jest zapoznanie słuchaczy z podstawami języka R oraz nauczenie ich metod analizy i wizualizacji danych w tym języku. Treści kształcenia 1. Wprowadzenie do języka R. a) Zmienne, instrukcje sterujące, zapis i odczyt danych do pliku. b) Operacje na wektorach i macierzach. c) Generacja liczb losowych z zadanego rozkładu. d) Generowanie raportów w języku Markdown. e) Połączenie i praca z bazą danych MySQL. 2. Wizualizacja w języku R. a) Wykresy XY i skrzynkowe. b) Histogramy, binowanie. c) Biblioteka ggplot2. d) Generacja plików w formatach PNG, JPG i EPS. 3. Wstępne przetwarzanie danych, podstawowe testy i modele statystyczne. a) Transformacja danych. b) Testowanie zgodności hipotezy metodami parametrycznymi i nieparametrycznymi. c) Dopasowywanie rozkładów teoretycznych do danych eksperymentalnych. d) Test chi2. e) Jedno i wielowymiarowa analiza wariancji. f) Regresje liniowa, logistyczna i Poissona. 4. Eksploracja danych (uczenie maszynowe). a) Skuteczność klasyfikacji. b) Walidacja krzyżowa. c) Analiza dyskryminacyjna. d) Analiza skupień. e) Skalowanie wielowymiarowe. f) Analiza składowych głównych. g) Analiza przeżycia. Metody kształcenia Zajęcia mają formę warsztatów (laboratoriów) z użyciem komputerów. Podczas pierwszej części zajęć prowadzący wprowadza nowe treści i ilustruje je przykładami, natomiast w trakcie drugiej części słuchacze samodzielnie rozwiązują zadanie punktowane. Zadania punktowane mogą być dokańczane również po zajęciach. Metody i kryteria oceniania Zadania punktowane: 10 x 5 pkt = 50 pkt Kolokwium końcowe z zadań praktycznych: 20 pkt Razem do uzyskania: 70 pkt Oceny: 35-41 dst, 42-48 dst+, 49-55 db, 56-62 db+, 63-70 bdb |
Literatura: |
[1] M. Gogolewski, Programowanie w języku R, Wydawnictwo Naukowe PWN, Warszawa 2014 [2] P. Biecek, Przewodnik po pakiecie R, Oficyna Wydawnicza Gis, Wrocław 2011. [3]. T. Górecki, Podstawy statystyki z przykładami w R, Wydawnictwo BTC, Legionowo 2011. [4] M. Walesiak, E. Gatnar , Statystyczna analiza danych z wykorzystaniem pakietu R, Wydawnictwo Naukowe PWN, Warszawa 2013. [5] A. Petrie, C. Sabin, Statystyka medyczna w zarysie, Wydawnictwo Lekarskie PZWL, Warszawa 2006. [6] K. Seefeld, E. Linder, Statistics Using R with Biological Examples, https://cran.r-project.org/doc/contrib/Seefeld_StatsRBio.pdf [7] A. Coghlan, A Little Book of R For Biomedical Statistics, http://a-little-book-of-r-for-biomedical-statistics.readthedocs.io/en/latest/ [8] A. Coghlan, A Little Book of R for Multivariate Analysis, http://little-book-of-r-for-multivariate-analysis.readthedocs.io/en/latest/ |
Efekty uczenia się: |
Student, który zaliczył przedmiot: - Zna i rozumie podstawowe metody analizy i wizualizacji danych (P8S_WG). - Potrafi wnioskować na podstawie wyników uzyskanych podczas analizy i wizualizacji danych (P8S_UW). - Potrafi wygenerować raport w języku Markdown prezentujący uzyskane wyniki i wnioski (P8S_UK). - Jest gotów do samodzielnego prowadzenia badań naukowych obejmujących analizę I wizualizację danych (P8S_KR) |
Metody i kryteria oceniania: |
Zadania punktowane: 10 x 5 pkt = 50 pkt Kolokwium końcowe z zadań praktycznych: 20 pkt Razem do uzyskania: 70 pkt Oceny: 35-41 dst, 42-48 dst+, 49-55 db, 56-62 db+, 63-70 bdb |
Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)
Okres: | 2022-02-23 - 2022-09-30 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin, 9 miejsc
|
|
Koordynatorzy: | Robert Paluch | |
Prowadzący grup: | Robert Paluch | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
|
Uwagi: |
Preferowane godziny to 12-14 lub 14-16. Preferowane dni to poniedziałek, wtorek, czwartek. |
Właścicielem praw autorskich jest Politechnika Warszawska.