Politechnika Warszawska - Centralny System Uwierzytelniania
Strona główna

Analiza i wizualizacja danych w języku R

Informacje ogólne

Kod przedmiotu: 6603A-KDPL-AWDJR
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Analiza i wizualizacja danych w języku R
Jednostka: Wydział Fizyki
Grupy:
Punkty ECTS i inne: 2.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Skrócony opis:

Język R jest otwartym, darmowym i szybko rozwijającym się środowiskiem przeznaczonym przede wszystkim do analizy i wizualizacji danych. Dzięki bardzo łatwej składni i wielkiej liczbie bibliotek jest wykorzystywany zarówno w nauce jak i w biznesie przez zespoły badawczo-rozwojowe na całym świecie. Celem przedmiotu jest zapoznanie słuchaczy z podstawami języka R oraz nauczenie ich metod analizy i wizualizacji danych w tym języku.

Pełny opis:

Język R jest otwartym, darmowym i szybko rozwijającym się środowiskiem przeznaczonym przede wszystkim do analizy i wizualizacji danych. Dzięki bardzo łatwej składni i wielkiej liczbie bibliotek jest wykorzystywany zarówno w nauce jak i w biznesie przez zespoły badawczo-rozwojowe na całym świecie. Celem przedmiotu jest zapoznanie słuchaczy z podstawami języka R oraz nauczenie ich metod analizy i wizualizacji danych w tym języku.

Treści kształcenia

1. Wprowadzenie do języka R.

a) Zmienne, instrukcje sterujące, zapis i odczyt danych do pliku.

b) Operacje na wektorach i macierzach.

c) Generacja liczb losowych z zadanego rozkładu.

d) Generowanie raportów w języku Markdown.

e) Połączenie i praca z bazą danych MySQL.

2. Wizualizacja w języku R.

a) Wykresy XY i skrzynkowe.

b) Histogramy, binowanie.

c) Biblioteka ggplot2.

d) Generacja plików w formatach PNG, JPG i EPS.

3. Wstępne przetwarzanie danych, podstawowe testy i modele statystyczne.

a) Transformacja danych.

b) Testowanie zgodności hipotezy metodami parametrycznymi i nieparametrycznymi.

c) Dopasowywanie rozkładów teoretycznych do danych eksperymentalnych.

d) Test chi2.

e) Jedno i wielowymiarowa analiza wariancji.

f) Regresje liniowa, logistyczna i Poissona.

4. Eksploracja danych (uczenie maszynowe).

a) Skuteczność klasyfikacji.

b) Walidacja krzyżowa.

c) Analiza dyskryminacyjna.

d) Analiza skupień.

e) Skalowanie wielowymiarowe.

f) Analiza składowych głównych.

g) Analiza przeżycia.

Metody kształcenia

Zajęcia mają formę warsztatów (laboratoriów) z użyciem komputerów. Podczas pierwszej części zajęć prowadzący wprowadza nowe treści i ilustruje je przykładami, natomiast w trakcie drugiej części słuchacze samodzielnie rozwiązują zadanie punktowane. Zadania punktowane mogą być dokańczane również po zajęciach.

Metody i kryteria oceniania

Zadania punktowane: 10 x 5 pkt = 50 pkt

Kolokwium końcowe z zadań praktycznych: 20 pkt

Razem do uzyskania: 70 pkt

Oceny: 35-41 dst, 42-48 dst+, 49-55 db, 56-62 db+, 63-70 bdb

Literatura:

[1] M. Gogolewski, Programowanie w języku R, Wydawnictwo Naukowe PWN, Warszawa 2014

[2] P. Biecek, Przewodnik po pakiecie R, Oficyna Wydawnicza Gis, Wrocław 2011.

[3]. T. Górecki, Podstawy statystyki z przykładami w R, Wydawnictwo BTC, Legionowo 2011.

[4] M. Walesiak, E. Gatnar , Statystyczna analiza danych z wykorzystaniem pakietu R, Wydawnictwo Naukowe PWN, Warszawa 2013.

[5] A. Petrie, C. Sabin, Statystyka medyczna w zarysie, Wydawnictwo Lekarskie PZWL, Warszawa 2006.

[6] K. Seefeld, E. Linder, Statistics Using R with Biological Examples, https://cran.r-project.org/doc/contrib/Seefeld_StatsRBio.pdf

[7] A. Coghlan, A Little Book of R For Biomedical Statistics, http://a-little-book-of-r-for-biomedical-statistics.readthedocs.io/en/latest/

[8] A. Coghlan, A Little Book of R for Multivariate Analysis, http://little-book-of-r-for-multivariate-analysis.readthedocs.io/en/latest/

Efekty uczenia się:

Student, który zaliczył przedmiot:

- Zna i rozumie podstawowe metody analizy i wizualizacji danych (P8S_WG).

- Potrafi wnioskować na podstawie wyników uzyskanych podczas analizy i wizualizacji danych (P8S_UW).

- Potrafi wygenerować raport w języku Markdown prezentujący uzyskane wyniki i wnioski (P8S_UK).

- Jest gotów do samodzielnego prowadzenia badań naukowych obejmujących analizę I wizualizację danych (P8S_KR)

Metody i kryteria oceniania:

Zadania punktowane: 10 x 5 pkt = 50 pkt

Kolokwium końcowe z zadań praktycznych: 20 pkt

Razem do uzyskania: 70 pkt

Oceny: 35-41 dst, 42-48 dst+, 49-55 db, 56-62 db+, 63-70 bdb

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. letni" (zakończony)

Okres: 2022-02-23 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 9 miejsc więcej informacji
Koordynatorzy: Robert Paluch
Prowadzący grup: Robert Paluch
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Uwagi:

Preferowane godziny to 12-14 lub 14-16. Preferowane dni to poniedziałek, wtorek, czwartek.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.
pl. Politechniki 1, 00-661 Warszawa tel: (22) 234 7211 https://pw.edu.pl kontakt deklaracja dostępności USOSweb 7.0.0.0-7 (2024-03-18)