Der Begriff "Data Mining" umfasst eine Vielzahl von Verfahren zum Auffinden interessanter Muster in großen Datenmengen ("knowledge discovery from data", KDD). In der Entwicklung der Datenbanktechnologien kann Data Mining als ein weiterer natürlicher Schritt aufgefasst werden. Nachdem bereits die Erzeugung, Speicherung und Verwaltung enormer Datenmengen in Datenbanksystemen ermöglicht wurde, besteht nun seitens der Anwender der naheliegende Wunsch, diese Daten effektiv zu nutzen.
Erste Teilschritte eines KDD-Prozesses sind die Datenbereinigung, Datenintegration und Datentransformation. Häufig werden dabei Daten aus mehreren unterschiedlichen Quellen in einem Data Warehouse integriert. Automatisierte Methoden werden zum Auffinden von Charakterisierungen, Unterscheidungen, Assoziationen, Klassifikationen, Clustern, Ausreißern oder Trends innerhalb der Datenbestände verwendet. Zuletzt schließen sich die Schritte der Musterauswertung und Wissensrepräsentation an.
Neuere Trends im Data Mining greifen zunehmend auch Probleme wie höherdimensionale Datenanalyse und die Analyse komplexer Datentypen (Datenströme, Multimedia-Daten, WWW, Texte, Netzwerke, räumliche und raumzeitliche Daten) auf.
Neben den aktiven Teilnehmern werden auch in begrenztem Umfang Anmeldungen von Zuhörern angenommen. Die aktiven Teilnehmer bereiten einen Vortrag vor, der auf englischsprachigen Artikeln basiert. Zum Vortrag ist eine schriftliche Ausarbeitung zu erstellen, die zusammen mit einer Version des Vortrags (Folien als PDF, OpenOffice-, PowerPoint-Präsentation o.ä.) vor der Präsenzphase einzureichen ist.
Anmeldung | 01.12.07 - 31.01.08 |
Themenvergabe bis Themenliste mit Literaturangaben | 24.02.08 |
Abgabe der Gliederung bis | 02.04.08 |
Abgabe der Präsentation und Ausarbeitung bis | 23.05.08 |
Präsenzphase | 04.07. (10.00-16.45 Uhr) - 05.07.08 (9.00-13.00 Uhr) FernUniversität in Hagen, Informatikzentrum, Raum H 05, Universitätsstraße 1, 58097 Hagen |
Der Seminarband mit den Ausarbeitungen zu allen Vorträgen ist als PDF-Datei erhältlich.
Zur Orientierung bezüglich Form und Umfang geben wir hier einige Hinweise zur Ausarbeitung und zum Vortrag. Die Informationen stammen aus dem Seminar 1912 im Jahr 2005; sie sind aber von allgemeiner Natur und sollen auch hier angewendet werden.
Bitte senden Sie einen Ausdruck Ihrer Arbeiten zu den oben genannten Abgabeterminen per Post an Herrn Düntgen.
Gute Kenntnisse der Konzepte und möglichst der Implementierung von Datenbanksystemen, etwa anhand der Kurse 01665 Datenbanksysteme, 01671 Datenbanken I, 01664 Implementierung von Datenbanksystemen
Nützlich jedoch keine Voraussetzung sind Kenntnisse aus den Kursen 01845 Methoden der Wissensrepräsentation oder 01696 Wissensbasierte Systeme.
Falls Sie sich ausschließlich als Zuhörer anmelden möchten, so melden Sie sich bitte nicht über das Web-Formular an, sondern teilen uns dies bitte informell per E-Mail mit.
Für die aktive Teilnahme können Sie sich ausschließlich vom 1.12.2007 bis spätestens 31.1.2008, 24:00 Uhr, per Web-Formular anmelden. Beachten Sie bitte, dass die Teilnehmerzahl zu diesem Seminar begrenzt ist. Sollte die Zahl der Anmeldungen die Zahl der Seminarplätze übersteigen, wird der Fortschritt im Studium bei der Auswahl der Teilnehmer berücksichtigt.
Bitte beachten Sie auch die Hinweise zur Seminar-Anmeldung im Infoheft 06 vom 27.11.2007 der FernUniversität in Hagen.
Prof. Dr. Ralf Hartmut Güting, Praktische Informatik IV, FernUniversität Hagen, 58084 Hagen,
Tel.: (02331) 987-4279, Email: rhg@fernuni-hagen.de