Logo - Fakult�t f�r Mathematik und Informatik Moving Point - Secondo Logo

Seminar 01912/19912 Big Data Management

Seminar 01912 für alle Informatikstudiengänge und Bachelor Wirtschaftsinformatik

Seminar 19912 für Master Wirtschaftsinformatik

Inhalt

Angesichts der rasant anwachsenden weltweiten Informationsmenge, verursacht u.a. durch Standort- und Verbindungsdaten von Mobiltelefonen, Logdaten von IT-Systemen, Social-Media-Daten, Videoaufzeichnungen oder Kreditkartentransaktionen – im Jahr 2012 werden laut IBM täglich 2,5 Trillionen Bytes produziert; über Facebook werden monatlich 135 Mrd. Nachrichten geschrieben; Twitter speichert täglich 7 Terabyte Daten –, müssen Datenbanksysteme große Datenmengen schnell für komplexe Anfragen von immer mehr Nutzern bereitstellen. SQL-Datenbanken sind dafür nur eingeschränkt geeignet. Big Data Management ist der Oberbegriff für neue Methoden und Technologien zur Erfassung, Speicherung und Analyse von Daten verschiedener Strukturen in nichtrelationalen verteilten Datenbanken.

Durchführung

Neben den aktiven Teilnehmern/Teilnehmerinnen werden in begrenztem Umfang auch Anmeldungen von Zuhörern/Zuhörerinnen angenommen. Die aktiven Teilnehmer/Teilnehmerinnen bereiten jeweils einen Vortrag vor, der auf englischsprachigen Artikeln basiert. Zum Vortrag ist eine schriftliche Ausarbeitung zu erstellen, die zusammen mit den Vortragsmaterialien (Folien, PowerPoint-Präsentation o.Ä.) vor der Präsenzphase einzureichen ist. Während der Präsenzphase hält jeder aktive Teilnehmer/jede aktive Teilnehmerin einen Vortrag, der mit einer Diskussionsrunde abgeschlossen wird.

Zeitlicher Ablauf

Anmeldung 1.12.2012 bis 31.1.2013
Themenvergabe 1.3.2013 bis 11.3.2013
Abgabe der Gliederung bis 12.4.2013
Abgabe der Präsentation und Ausarbeitung bis 12.6.2013
Präsenzphase 18.7.2013 bis 20.7.2013

Zeitplan für die Präsenzphase

Die Präsenzphase findet vom 18. bis 20. Juli im Raum H 04 im Erdgeschoss des Informatikzentrums statt.
Donnerstag, 18. Juli 2013
11:00 Parallele Datenbanken (Klaus Nieswand)
12:00 Pause
12:15 Spaltenorientierte Datenbanken (Nico Geisler)
13:15 Mittagspause
14:15 MapReduce (Johannes Unterstein)
15:15 Pause
15:30 Google File System (Simon Eiersbrock)
16:30 Pause
16:45 Kontroverse: Parallele Datenbanken vs. MapReduce (Alica Moser)
Freitag, 19. Juli 2013
09:00 HadoopDB & SQL/MapReduce (Michael Küpper)
10:00 Pause
10:15 Hive (Markus Höhnerbach)
11:15 Pause
11:30 Pig (Roland Hellwig)
12:30 Mittagspause
13:30 Überblick: NoSQL-Datenbanken & Key-Value Stores (Steffi Uhl)
14:30 Pause
14:45 Dynamo (Jana Stehmann)
15:45 Pause
16:00 Bigtable (Felix Siegrist)
Samstag, 20. Juli 2013
09:00 CouchDB (Kristina Steiger)
10:00 Pause
10:15 MongoDB (Wiebke Wilken)
11:15 Pause
11:30 Cassandra (Jan Kristof Nidzwetzki)
12:30 Mittagspause
13:30 H-Store & VoltDB (Anette Naffin-Rehorst)
14:30 Verabschiedung

Hinweise

Zur Orientierung bezüglich Form und Umfang geben wir hier einige Hinweise zur Ausarbeitung und zum Vortrag.

Bitte senden Sie Ihre Ausarbeitung (als PDF-Dokument) sowie Ihre Vortragsfolien (als PDF oder Powerpoint-Präsentation) an fabio.valdes@fernuni-hagen.de.

Voraussetzungen

Gute Kenntnisse der Konzepte und möglichst der Implementierung von Datenbanksystemen, etwa anhand der Kurse 01665 Datenbanksysteme, 01671 Datenbanken I, 01664 Implementierung von Datenbanksystemen

Themen

Eine Beschreibung der im Seminar behandelten Themen finden Sie unter diesem Link:

Literatur

Die Basisliteratur können Sie als Seminarteilnehmer/in unter folgendem Link (geschützter Bereich) einsehen.

Auskunft erteilt

Fabio Valdés
Datenbanksysteme für neue Anwendungen
FernUniversität Hagen
58084 Hagen

Tel.: (02331) 987-4282
Email: fabio.valdes@fernuni-hagen.de



Letzte Änderung: 2013-06-26
FernUni-Logo FernUniversität in Hagen, Lehrgebiet Datenbanksysteme für neue Anwendungen, D-58084 Hagen, Telefon: +49 (2331) 987-4277