Politechnika Warszawska - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Data Mining

Informacje ogólne

Kod przedmiotu: 103B-CSCSN-MSA-EDAMI Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Data Mining
Jednostka: Wydział Elektroniki i Technik Informacyjnych
Grupy: ( Computer Systems and Networks - Advanced )-Computer Systems and Networks-M.Sc.-EITI
( Courses in English )--eng.-EITI
( Przedmioty techniczne )---EITI
( Przedmioty zaawansowane )-Informatyka-dr.-EITI
( Przedmioty zaawansowane )-Inżynieria systemów informatycznych-mgr.-EITI
( Przedmioty zaawansowane techniczne )--mgr.-EITI
( Technical Courses )--eng.-EITI
Punkty ECTS i inne: 6.00
Język prowadzenia: angielski
Jednostka decyzyjna:

103000 - Wydział Elektroniki i Technik Informacyjnych

Kod wydziałowy:

EDAMI

Numer wersji:

2

Skrócony opis:

Na treść wykładu składa się szeroki zakres tematów z obecnie bardzo intensywnie rozwijanej dziedziny eksploracji danych. Prezentowane techniki i algorytmy mają istotne znaczenie praktyczne - dobrze nadają się do wydobywania wzorców ukrytych w olbrzymich zasobach danych rzeczywistych. Przewiduje się, że prezentowane metody będą miały pierwszorzędne znaczenie dla ewolucji systemów baz danych do postaci efektywnych systemów baz wiedzy. Zostaną przedstawione przykłady języków eksploracji danych (zwanych także językami specyfikacji wiedzy), które już obecnie można efektywnie zaimplementować w środowisku współczesnych systemów baz danych. Oprócz omówienia zagadnień odkrywania różnych typów wiedzy zostaną przedstawione najnowsze znaczące osiągnięcia w efektywnym pozyskiwaniu wiedzy poprzez stosowanie zwięzłych bezstratnych modeli. Zostanie dokonany krótki przegląd wybranych systemów eksploracji danych, które pojawiły się w komercyjnym użyciu, jak i obiecujących prototypów (...)

Pełny opis: (tylko po angielsku)



Lecture contents
Data mining as a multidisciplinary area: Roots and development of data mining area. Current challenges in data mining. Classification of data mining tasks.

Data warehouse and OLAP technology for data mining: Basic notions of data warehouses and multidimensional bases. Usage of these technologies for data mining.
Data preprocessing: Data cleaning. Data integration and transformation. Data reduction. Discretization and concept hierarchy generation.
Data mining language: Specifying required properties of knowledge to be discovered by means of a sample data mining language.

Frequent patterns and association rules: Scalable methods of discovering frequent patterns and association rules in transactional and relational databases. Modifications of algorithms capable to deal with hierarchy and negation. Usage of imposed constraints for efficient reduction of a discovery process.

Concise models of frequent patterns: Generators, closed itemsets and k-disjunction-free sets as basic elements of lossless representations of frequent patterns. Discovery of concise representations of frequent patterns. Usage of the models for derivation of all frequent patterns.
Concise models of association rules: Generators, closed itemsets, and pseudo-closed sets as building blocks of lossless representations of association rules. Mechanisms of deriving association rules from their representations.
Functional and approximate dependencies: Scalable methods of discovering functional and approximate dependencies in large databases.
Other patterns and rules: Scalable methods of discovering sequential patterns, episode rules, quantitative rules, decision tree classifiers, and rough set decision rules.
Clustering: Scalable methods of clustering objects. Usage of multidimensional indexing techniques to support the process of discovering clusters and outliers.
Reasoning under incompleteness: Legitimate approach to reasoning from data with missing values. Mining from partial knowledge.

Data mining applications: Sample applications of data mining in the financial, telecommunication, biomedical and DNA areas. Brief overview of selected data mining systems.



Projects contents
A project task is to design, implement and perform an experimental evaluation of selected data mining algorithms.

Sample algorithms to be implemented:

  1. Discovering frequent patterns and rules with the Apriori algorithm.

  2. Discovering rough set reducts with GRA-like algorithms.

  3. Discovering sequential patterns with the GSP and SPAM algorithms;

  4. Discovering clusters with the DBSCAN algorithms supported by the usage of a multidimensional index;


  5. Discovering functional and approximate dependencies with the TANE algorithm;



Similar Courses
CodeNameDiscount ECTS
103B-INxxx-MSP-MEDMetody eksploracji danych w odkrywaniu wiedzy4

Literatura: (tylko po angielsku)

    1. Han J., Kamber M., Data Mining: Concepts and Techniques, The Morgan Kaufmann Series in Data Management Systems, Morgan Kaufmann Publishers, 2000

    2. Advances in Knowledge Discovery and Data Mining, eds. U.M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy, AAAI, Menlo Park, California, 1996

    3. Kryszkiewicz M., Concise Representations of Frequent Patterns and Association Rules, Prace Naukowe, Elektronika, Oficyna Wydawnicza Politechniki Warszawskiej, z. 142 (2002)

    4. Communications of the ACM, November 1996, Vol. 39. No 11., 1996

    5. Ganter B., Wille R., Formal Concept Analysis, Mathematical Foundations, Springer-Verlag, 1999

    6. and a number of recent data mining publications accessible via Internet. The instructor will recommend the respective publications during the course.

Zajęcia w cyklu "rok akademicki 2019/2020 - sem. letni" (w trakcie)

Okres: 2020-02-22 - 2020-09-30

Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Marek Kozłowski, Marzena Kryszkiewicz, Grzegorz Protaziuk, Kamil Żbikowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2019/2020 - sem. zimowy" (zakończony)

Okres: 2019-10-01 - 2020-02-21
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Robert Bembenik, Marzena Kryszkiewicz, Grzegorz Protaziuk
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. letni" (zakończony)

Okres: 2019-02-18 - 2019-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Marek Kozłowski, Marzena Kryszkiewicz, Grzegorz Protaziuk, Kamil Żbikowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2018/2019 - sem. zimowy" (zakończony)

Okres: 2018-10-01 - 2019-02-17
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Robert Bembenik, Marzena Kryszkiewicz, Piotr Maciąg, Grzegorz Protaziuk
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2017/2018 - sem. letni" (zakończony)

Okres: 2018-02-19 - 2018-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Tomasz Gambin, Marzena Kryszkiewicz, Grzegorz Protaziuk, Kamil Żbikowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2017/2018 - sem. zimowy" (zakończony)

Okres: 2017-10-01 - 2018-02-18
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2016/2017 - sem. letni" (zakończony)

Okres: 2017-02-20 - 2017-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Marzena Kryszkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2015/2016 - sem. letni" (zakończony)

Okres: 2016-02-23 - 2016-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Marzena Kryszkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2014/2015 - sem. letni" (zakończony)

Okres: 2015-02-23 - 2015-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Marzena Kryszkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2013/2014 - sem. letni" (zakończony)

Okres: 2014-02-24 - 2014-09-28
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Marzena Kryszkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Zajęcia w cyklu "rok akademicki 2012/2013 - sem. letni" (zakończony)

Okres: 2013-02-20 - 2013-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 36 miejsc więcej informacji
Projekt, 15 godzin, 36 miejsc więcej informacji
Wykład, 30 godzin, 36 miejsc więcej informacji
Koordynatorzy: Marzena Kryszkiewicz
Prowadzący grup: Marzena Kryszkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Ocena łączna
Jednostka realizująca:

103200 - Instytut Informatyki

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Warszawska.