Logo - Fakult�t f�r Mathematik und Informatik Moving Point - Secondo Logo

Seminar 01912/19912 Datenströme und das semantische Web

Seminar 01912 für alle Informatikstudiengänge und Bachelor Wirtschaftsinformatik

Seminar 19912 für Master Wirtschaftsinformatik

Inhalt

In diesem Seminar gehen wir einmal von einer konkreten Veröffentlichung aus und erarbeiten ihre Grundlagen. Die Ausgangsarbeit ist:

Xiangnan Ren, Olivier Curé: Strider: A Hybrid Adaptive Distributed RDF Stream Processing Engine.
International Semantic Web Conference (1) 2017: 559-576

Das führt uns dazu, zwei Themenbereiche und ihre Kombination zu betrachten.

Im ersten Teil des Seminars geht es um die Verarbeitung von Datenströmen. Grundlagen für dieses Gebiet wurden in der ersten Dekade dieses Jahrtausends gelegt mit der Entwicklung von Data Stream Management Systems. In solchen Systemen kann man Anfragen registrieren, die dann kontinuierlich ausgewertet werden, meist über Fenstern über Datenströmen (z.B. die letzten 100 Elemente). Klassische Arbeiten und Systeme sind z.B. CQL, die Continuous Query Language, und Systeme wie NiagaraCQ oder Aurora/Borealis. Aber auch aktuell ist die Verarbeitung von Datenströmen ein heißes Thema, insbesondere in verteilten und skalierbaren Systemen wie Spark Streaming, Flink oder Kafka.

Im zweiten Teil des Seminars geht es um das „semantic web“. Die Grundidee kam von Tim Berners-Lee, dem Erfinder des „world wide web“ Während das klassische WWW ein Netz von Webseiten zur Verfügung stellt, die von menschlichen Benutzern "konsumiert" werden können, soll das semantische Web es Softwareagenten ermöglichen, Informationen aus zahlreichen Internetquellen zusammenzuführen und Schlüsse daraus zu ziehen. Wir fokussieren im Seminar auf das RDF-Datenmodell, das die Welt in Form von Tripeln der Form (Subjekt-Prädikat-Objekt) darstellt; solche Tripel kann man als Kanten eines Graphen auffassen. Deshalb sind Graph-Datenbankysteme wie Neo4j und Anfrageprachen wie SPARQL, Gremlin oder Cipher von Interesse.

Im dritten und letzten Teil des Seminars betrachten wir die Verarbeitung von RDF-Datenströmen, also Arbeiten wie die oben zitierte.

Durchführung

Neben den aktiven Teilnehmer/innen werden in begrenztem Umfang auch Anmeldungen von Zuhörer/innen angenommen. Die aktiven Teilnehmer/innen bereiten jeweils einen Vortrag vor, der auf englischsprachigen Artikeln basiert. Zum Vortrag ist eine schriftliche Ausarbeitung zu erstellen, die zusammen mit den Vortragsmaterialien in digitaler Form vor der Präsenzphase einzureichen ist. Während der Präsenzphase hält jede/r aktive Teilnehmer/in einen Vortrag, der mit einer Diskussionsrunde abgeschlossen wird.

Die Teilnahme an der kompletten Präsenzphase ist für alle aktiven Teilnehmer/innen verpflichtend.

Zeitlicher Ablauf

Anmeldung 01.12.2017 bis 31.01.2018
Themenvergabe 05.03.2018 bis 15.03.2018
Abgabe der Gliederung bis 15.04.2018
Abgabe der Präsentation und Ausarbeitung bis 17.06.2018
Präsenzphase 12.07.2018 bis 14.07.2018

Zeitplan für die Präsenzphase

Die Präsenzphase findet vom 12. bis 14. Juli 2018 im Raum F09 (Erdgeschoss) des Informatikzentrums statt.

Voraussetzungen

Kenntnisse über Datenbanken und Datenbanksysteme, z.B. aus dem Kurs 01671, sind erforderlich. Nützlich aber nicht vorausgesetzt sind weitergehende Kenntnisse aus den vertiefenden Kursen zu Datenbanken und Datenbanksystemen, wie sie in den Kursen 01672, 01664 und 01665 vermittelt werden.

Auskunft erteilen

Prof. Dr. Ralf Hartmut Güting
Datenbanksysteme für neue Anwendungen
FernUniversität Hagen
58084 Hagen
Tel.: (02331) 987-4279
Email: rhg@fernuni-hagen.de


Holger Helmut Hennings
Datenbanksysteme für neue Anwendungen
FernUniversität Hagen
58084 Hagen
Tel.: (02331) 987-4285
Email: holger-helmut.hennings@fernuni-hagen.de



Letzte Änderung: 2017-10-27 ()
FernUni-Logo FernUniversität in Hagen, Lehrgebiet Datenbanksysteme für neue Anwendungen, D-58084 Hagen, Telefon: +49 (2331) 987-4277