Logo - Fakult�t f�r Mathematik und Informatik Moving Point - Secondo Logo

Seminar 01912/19912 Data Mining

Seminar 01912 für alle Informatikstudiengänge und Bachelor Wirtschaftsinformatik

Seminar 19912 für Master Wirtschaftsinformatik

Inhalt

Das Thema dieses Seminars ist Data Mining - ein Begriff, der sich ins Deutsche grob mit "Wissensentdeckung in Datenmengen/-banken" übersetzen lässt.

Mittlerweile werden in zunehmend vielen Bereichen der Wirtschaft, des privaten Lebens und der Wissenschaft aus sehr großen Datenmengen Informationen bzw. Wissen gewonnen. Vor der Jahrtausendwende noch undenkbar, sind die weltweit wertvollsten und erfolgreichsten Unternehmen heute im Kerngeschäft Meister der Datenanalyse, beispielsweise basierend auf einer werbegestützten Internetsuchmaschine mit Ergebnispriorisierung, einem weltweiten Marktplatz, der Käufe und Käuferwünsche analysiert oder einem sozialen Netzwerk mit auf Nutzerprofile zugeschnittener Informationsauswahl. Auch abseits von Großkonzernen oder der klassischen IT-Branche ist es heute in vielen Bereichen hilfreich oder notwendig, große Mengen von Daten zu analysieren. Ob wir an Verkaufstransaktionen von Supermarktketten und Onlinehändlern denken, den weltweiten Wertpapierhandel, an Energieversorgung, den internationalen Flugverkehr oder an Telekommunikationsunternehmen mit Mobilfunknetzen und Transatlantikkabeln, an Messergebnisse unzähliger Sensoren in Wissenschaft und Entwicklung, Streams bzw. Downloads von Filmen, Serien und Sportereignissen, GPS-Positionsdaten von Mobiltelefonen, Tablets und Fahrzeugen - der Überfluss an erzeugten und gespeicherten Daten als Folge und gleichzeitig als Treiber gesellschaftlicher und technischer Veränderung ist offensichtlich. Die Erfordernis, daraus wertvolle Informationen abzuleiten, macht Data Mining zu einem bedeutsamen Forschungsbereich.

Im Rahmen des Seminars "Data Mining" werden zentrale Aufgaben bzw. Verfahren vorgestellt, darunter Visualisierung, Reduktion und Transformation von Daten, Techniken für die Suche nach häufigen Mustern sowie Klassifikationsalgorithmen.

Durchführung

Neben den aktiven Teilnehmerinnen/Teilnehmern werden in begrenztem Umfang auch Anmeldungen von Zuhörern/Zuhörerinnen angenommen. Die aktiven Teilnehmerinnen/Teilnehmer des Seminars bereiten jeweils einen Vortrag vor, der auf englischsprachigen Artikeln basiert. Teilnehmerinnen/Teilnehmer des Seminars 19912 bereiten zwei Vorträge vor.

Zu jedem Vortrag ist eine schriftliche Ausarbeitung zu erstellen, die zusammen mit den Vortragsmaterialien (Präsentationsfolien) vor der Präsenzphase einzureichen ist. Während der Präsenzphase hält jeder aktive Teilnehmer/jede aktive Teilnehmerin seine/ihre erarbeiteten Vorträge, die jeweils mit einer Diskussionsrunde abgeschlossen werden.

Die Teilnahme an der kompletten Präsenzphase ist für alle aktiven Teilnehmer/innen verpflichtend.

Zeitlicher Ablauf

Anmeldung 01.12.2018 bis 10.01.2019
Themenvergabe 11.03.2019 bis 17.03.2019
Abgabe der Gliederung bis 21.04.2019
Abgabe der Präsentation und Ausarbeitung bis 23.06.2019
Präsenzphase 19.07.2019 bis 20.07.2019

Ablauf der Präsenzphase

Die Präsenzphase findet am 19. und 20. Juli im Informatikzentrum (Gebäude 3), Raum H 04, statt. Die für jeden Vortrag angesetzte Stunde enthält jeweils den 45minütigen Vortrag sowie eine 15minütige Diskussionsrunde.
Freitag, 19.07.2019
Zeit Vortragender Thema
08:30 - 09:00Vorstellungsrunde
09:00 - 10:00 Marcel Grün Thema 2: Geometrische Visualisierungsverfahren
10:00 - 11:00 Robert Schwesig Thema 4: Diskrete Wavelet-Transformation
11:00 - 12:00 Robert Schwesig Thema 5: Hauptkomponentenanalyse
12:00 - 13:00 Dennis Bursch Thema 6: Apriori-Algorithmus
13:00 - 13:45Mittagspause
13:45 - 14:45 Rene Helbig Thema 7: Frequent-Pattern-Growth-Methode
14:45 - 15:45 Rene Helbig Thema 8: Eclat-Algorithmus
15:45 - 16:45 Dennis Bursch Thema 10: Entscheidungsbäume
16:45 - 17:45 Yauhen Makhotsin Thema 11: Klassifikation nach Bayes
 
Samstag, 20.07.2019
Zeit Vortragender Thema
09:00 - 10:00 Marvin Peters Thema 12: Evaluation von Klassifikationsverfahren
10:00 - 11:00 Alkuin Denninghoff Thema 13: Ensemblemethoden
11:00 - 12:00 Ingo Bader Thema 14: Partitionierungsverfahren
12:00 - 12:45Mittagspause
12:45 - 13:45 Robert Großmann Thema 16: Dichtebasierte Verfahren
13:45 - 14:45 Wolfgang Rülfing Thema 17: Gitterbasierte Verfahren
14:45 - 15:00 Abschluss
Einen Lageplan des Campus finden Sie hier.

Themen und Hinweise

Im folgenden Dokument (das Sie bereits per E-Mail erhalten haben) finden Sie neben einer kurzen Vorstellung der einzelnen Themen des Seminars auch Hinweise zur Themenauswahl, zur Bearbeitung des Themas, zur Gliederung, zur Ausarbeitung und zur Präsentation. Lesen Sie sich das Dokument gründlich durch und beachten Sie die dort angegebenen Termine und Hinweise.

Um Sie bei der Erstellung Ihrer Ausarbeitung zu unterstützen, wird nachfolgend ein Beispiel für ein Titelblatt sowie eine LaTeX-Vorlage für die Ausarbeitung bereitgestellt.

Bitte senden Sie die Prioritätenliste, die Gliederung, die Ausarbeitung (als PDF-Dokument) sowie die Vortragsfolien (als PDF-Dokument) an fabio.valdes@fernuni-hagen.de.

Literatur

Die Basisliteratur können Sie als Seminarteilnehmer/in unter dem folgenden Link (geschützter Bereich) einsehen.

Auskunft erteilt

Dr. Fabio Valdés
LG Datenbanksysteme für neue Anwendungen
FernUniversität in Hagen
58097 Hagen
Tel.: +49 (0) 2331 987 4282
Email: fabio.valdes@fernuni-hagen.de



Letzte Änderung: 2019-06-27 (FV)
FernUni-Logo FernUniversität in Hagen, Lehrgebiet Datenbanksysteme für neue Anwendungen, D-58084 Hagen, Telefon: +49 (2331) 987-4277