Politechnika Warszawska - Centralny System Uwierzytelniania
Nie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Techniki analizy sieci społecznych

Informacje ogólne

Kod przedmiotu: 103A-INSID-MSP-TASS Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Techniki analizy sieci społecznych
Jednostka: Wydział Elektroniki i Technik Informacyjnych
Grupy: ( Przedmioty techniczne )---EITI
( Przedmioty zaawansowane )-Systemy informacyjno-decyzyjne-mgr.-EITI
( Przedmioty zaawansowane techniczne )--mgr.-EITI
( Wytwarzanie )-Inteligentne systemy-mgr.-EITI
( Zastosowania )-Sztuczna inteligencja-mgr.-EITI
Punkty ECTS i inne: 4.00
Język prowadzenia: polski
Jednostka decyzyjna:

103000 - Wydział Elektroniki i Technik Informacyjnych

Kod wydziałowy:

TASS

Numer wersji:

1

Skrócony opis:

Celem przedmiotu jest przedstawienie studentom fenomenu powiązań społecznych, reprezentowanych przez obfitość i różnorodność śladów cyfrowych, pozostawianych przez ludzi. Struktura tych śladów może być ściśle zdefiniowana (np. w rejestrach połączeń telefonicznych, śladach GPS tras ruchu, danych biomedycznych), częściowo otwarta (dane opatrzone etykietami) lub zupełnie swobodna (wiadomości tekstowe, artykuły itp.). Kojarzenie ze sobą danych z różnych źródeł, choć w sposób naturalny niedoskonałe, prowadzi do uzyskania baz o zupełnie nowej wartości. Kojarzone dane są obecnie stosunkowo łatwo dostępne, a proste techniki ich analizy wspomagają uzyskiwanie informacji niezbędnej w objaśnianiu, przewidywaniu lub inżynierii określonych zjawisk, takich jak np. tworzenie grup, rozprzestrzenianie informacji. Wiedza ta ma obecnie konkretną wartość użytkową. Studenci zostają zapoznani z podstawowymi pojęciami dotyczącymi modelowania sieci, oraz z dostępnymi narzędziami i technikami (...)

Pełny opis:

Celem przedmiotu jest przedstawienie studentom fenomenu powiązań społecznych, reprezentowanych przez obfitość i różnorodność śladów cyfrowych, pozostawianych przez ludzi. Struktura tych śladów może być ściśle zdefiniowana (np. w rejestrach połączeń telefonicznych, śladach GPS tras ruchu, danych biomedycznych), częściowo otwarta (dane opatrzone etykietami) lub zupełnie swobodna (wiadomości tekstowe, artykuły itp.). Kojarzenie ze sobą danych z różnych źródeł, choć w sposób naturalny niedoskonałe, prowadzi do uzyskania baz o zupełnie nowej wartości. Kojarzone dane są obecnie stosunkowo łatwo dostępne, a proste techniki ich analizy wspomagają uzyskiwanie informacji niezbędnej w objaśnianiu, przewidywaniu lub inżynierii określonych zjawisk, takich jak np. tworzenie grup, rozprzestrzenianie informacji. Wiedza ta ma obecnie konkretną wartość użytkową. Studenci zostają zapoznani z podstawowymi pojęciami dotyczącymi modelowania sieci, oraz z dostępnymi narzędziami i technikami pozyskiwania, magazynowania i obróbki danych. Poznają również techniki prezentacji wyników oraz przykłady tworzenia konkretnych, specjalizowanych aplikacji autorskich, wykorzystujących analizę danych społecznych różnorodnego pochodzenia. Przedstawiane są techniki analizy powiązań semantycznych definiowanych w sposób formalny, jak i nieformalny. Dodatkowo, przedstawiane są przykłady zrealizowanych projektów, wykorzystujących w sposób nieoczywisty grafy powiązań społecznych.

Studenci, zaliczający ten przedmiot, będą umieli wytypować źródła danych, zastosować istniejące mechanizmy lub opracować własne, w celu pobrania i połączenia danych, wybrać sposób przechowywania danych, a następnie zastosować techniki i narzędzia analizy powiązań społecznych, adekwatne do rozwiązywanego zadania.


Treść wykładu


  • Organizacja przedmiotu. Demonstracja przykładowej interaktywnej aplikacji analizującej sieć zrekonstruowaną z danych heterogenicznych, np. będących wynikiem połączenia danych o ruchu drogowym z danymi o gęstości zaludnienia. Podstawowe pojęcia z teorii grafów.
  • Pojęcia podstawowe cd. (ścieżka, podgrafy itp.). Miary statystyczne dla grafu. Miary dla wierzchołka (stopień, pośrednictwo, ranking itp.). Algorytmy do wyznaczania w/w miar.
  • Specyfika grafów opisujących sieci społeczne - rozkład potęgowy stopni wierzchołków, kręgi i role społeczne w grafie, istotność słabych powiązań, dyfuzja w grafie. Koncepty związane z dynamiką grafu (model Erdősa-Rényiego, powstanie spójnej składowej grafu).
  • Prezentacja narzędzi do analizy grafów (gotowych aplikacji i modułów dostępnych w różnych językach programowania). Przegląd dostępnych źródeł danych i sposobów tworzenia z nich grafowych reprezentacji powiązań.
  • Semantyka powiązań i węzłów - mikroformaty i HTML5. Taksonomie i folksonomie.
  • Narzędzia i techniki pozyskiwania danych. Przechowywanie pozyskanych danych - bazy nieustrukturyzowane.
  • Techniki łączenia danych z różnych źródeł - miary podobieństwa i istotności (Levenshteina, TF-IDF itp.), algorytmy gronowania. Techniki analizy języka naturalnego.
  • Język zapytań semantycznych SPARQL i zastosowania praktyczne.
  • Grafy dwudzielne. Model Isinga. Kwestie wydajnościowe implementacji wielowątkowych algorytmów analizy danych.
  • Tworzenie aplikacji osadzonych w konkretnych serwisach społecznościowych.
  • Techniki tworzenia dedykowanych aplikacji interaktywnych łączących dane z wielu źródeł (mashups). Komercyjne środowiska analizy danych.
  • Przykłady praktyczne: modelowanie procesu odejść klientów, procesu sprzedaży, rekonstrukcji grafu na podstawie rejestru połączeń telefonicznych, estymacji macierzy ruchu.
  • Kolokwium.

    Zakres projektu
    Studenci realizują indywidualnie dwa zadania projektowe. Pierwsze (3 tyg.) polega na pobraniu danych, skonstruowaniu grafu i wyznaczeniu szeregu jego standardowych parametrów. W tym projekcie zarówno dane, jak i narzędzia ich analizy są gotowe, istniejące, wcześniej zbadane. Funkcją pierwszego projektu jest zaznajomienie studentów z istniejącymi, gotowymi modułami programistycznymi. Drugie zadanie (5 tyg.) polega na wykonaniu aplikacji typu mashup, tj. łączącej dane z wielu źródeł i dokonującej ich analizy w aspekcie semantycznym. W tym przypadku zarówno pobranie danych, jak i ich połączenie oraz analiza wymaga albo wytworzenia przez studentów fragmentów specyficznego oprogramowania, albo właściwego skonfigurowania oprogramowania istniejącego.


Poprzedniki
Typ poprzednikaNr poprzednikaKod poprzednikaNazwa poprzednika
Zalecany1103B-INxxx-ISP-PROZProgramowanie zdarzeniowe
Zalecany1103C-INxxx-ISP-PROZProgramowanie zdarzeniowe

Literatura:


    1. J. Wojciechowski, K. Pieńkosz, Grafy i sieci, PWN 2013
    2. A. Fronczak, P. Fronczak Świat sieci złożonych, PWN 2009
    3. E. Kolaczyk Statistical Analysis of Network Data, Springer 2009
    4. M. Russell Mining the Social Web, O`Reilly 2011
    5. M. Tsvetovat, A. Kouznetsov Social Network Analysis for Startups, O`Reilly 2011
    6. J.G. Breslin, A. Passant, S. Decker The Social Semantic Web, Springer 2009

Metody i kryteria oceniania:

Kolokwium: 50 pkt, projekty: 20+30 pkt.

Warunek zaliczenia: co najmniej 26 pkt z kolokwium, co najmniej 26 pkt łącznie z obu projektów.

Zajęcia w cyklu "rok akademicki 2021/2022 - sem. zimowy" (w trakcie)

Okres: 2021-10-01 - 2022-02-22
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Piotr Arabas
Prowadzący grup: Piotr Arabas, Mariusz Kamola
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2020/2021 - sem. zimowy" (zakończony)

Okres: 2020-10-01 - 2021-02-19
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Piotr Arabas
Prowadzący grup: Piotr Arabas, Mariusz Kamola
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2019/2020 - sem. zimowy" (zakończony)

Okres: 2019-10-01 - 2020-02-21
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Piotr Arabas
Prowadzący grup: Piotr Arabas, Mariusz Kamola
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. zimowy" (zakończony)

Okres: 2018-10-01 - 2019-02-17
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin, 45 miejsc więcej informacji
Wykład, 30 godzin, 45 miejsc więcej informacji
Koordynatorzy: Piotr Arabas
Prowadzący grup: Piotr Arabas, Mariusz Kamola
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2017/2018 - sem. zimowy" (zakończony)

Okres: 2017-10-01 - 2018-02-18
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin, 48 miejsc więcej informacji
Wykład, 30 godzin, 48 miejsc więcej informacji
Koordynatorzy: Piotr Arabas
Prowadzący grup: Piotr Arabas
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2016/2017 - sem. zimowy" (zakończony)

Okres: 2016-10-01 - 2017-02-19
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin, 48 miejsc więcej informacji
Wykład, 30 godzin, 48 miejsc więcej informacji
Koordynatorzy: Piotr Arabas
Prowadzący grup: Piotr Arabas
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2015/2016 - sem. zimowy" (zakończony)

Okres: 2015-10-01 - 2016-02-22
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin, 48 miejsc więcej informacji
Wykład, 30 godzin, 48 miejsc więcej informacji
Koordynatorzy: Piotr Arabas
Prowadzący grup: Piotr Arabas
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Zajęcia w cyklu "rok akademicki 2014/2015 - sem. letni" (zakończony)

Okres: 2015-02-23 - 2015-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Projekt, 30 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Piotr Arabas
Prowadzący grup: Piotr Arabas
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103100 - Instytut Automatyki i Informatyki Stosowanej

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.