Logo - Fakult�t f�r Mathematik und Informatik Moving Point - Secondo Logo

Seminar "Ähnlichkeitssuche in Datenbanken" im Sommersemester 2007

Inhalt

Die klassische Datenbanktechnologie beschäftigt sich mit exakt dargestellten Objekten und Werten (z.B. Tupeln, Attributen) und ihren Beziehungen und formuliert Anfragen, bei denen man genau weiß, was gesucht wird. In vielen neueren Anwendungen ist die Struktur der dargestellten Werte komplex und man kann bzw. will nicht präzise formulieren, wonach man sucht. Stattdessen versucht man, Objekte in der Datenbank zu finden, die insgesamt oder in Teilen ähnlich zu einem vorgegebenen Muster sind. Beispiele dafür sind

  • Webseiten
  • Bilder (z.B. Suche nach Sonnenuntergängen, Personen, Autos)
  • Formen in zwei oder drei Dimensionen, etwa mechanische Teile in CAD-Datenbanken, Tumore in Röntgenbildern, Fingerabdrücke, Gesichter
  • Moleküle, Proteine, DNA-Sequenz
  • Börsenkurse, allgemein zeitlich geordnete Folgen
  • Bewegungsverläufe beweglicher Objekte
  • Textabschnitte oder Sätze in Texten
  • Videosequenzen in Filmen
  • Melodien oder Klangmuster in Musikstücken

Eingesetzte Techniken sind u.a. Abbildung auf hochdimensionale Räume (Feature-Vektoren), Indexieren ausschließlich über ein Abstandsmaß in metrischen Räumen, Verwendung von Editier-Distanzen (wieviele Änderungen sind nötig, um Objekt A in Objekt B zu verwandeln), Ähnlichkeit von Histogrammen, Entdeckung von Invarianzen in Formen (etwa rotationsinvariante Darstellungen). Als Ergebnis einer Suche erhält man eine Rangfolge von Objekten, die nach aufsteigenem Abstand (fallender Ähnlichkeit) sortiert sind.

Durchführung

Neben den aktiven Teilnehmern werden auch in begrenztem Umfang Anmeldungen von Zuhörern angenommen. Die aktiven Teilnehmer bereiten einen Vortrag vor, der auf englischsprachigen Artikeln basiert. Zum Vortrag ist eine schriftliche Ausarbeitung zu erstellen, die zusammen mit einer Version des Vortrags (Folien als PDF, OpenOffice-, PowerPoint-Präsentation o.ä.) vor der Präsenzphase einzureichen ist.

Zeitlicher Ablauf

Anmeldung01.12.06 - 31.01.07
Themenvergabe bis
Themenliste, Literatur
23.02.07 (verschoben auf den 09.03.07)
Abgabe der Gliederung bis04.04.07
Abgabe der Präsentation und Ausarbeitung bis25.05.07 (verschoben auf den 31.05.07)
Präsenzphase28.06 - 30.06.07

Hinweise

Zur Orientierung bezüglich Form und Umfang geben wir hier einige Hinweise zur Ausarbeitung und zum Vortrag. Die Informationen stammen aus dem Seminar 1912 im Jahr 2005; sie sind aber von allgemeiner Natur und sollen auch hier angewendet werden.

Bitte senden Sie einen Ausdruck Ihrer Arbeiten zu den oben genannten Abgabeterminen per Post an Herrn Spiekermann.

Voraussetzungen

Gute Kenntnisse der Konzepte und möglichst der Implementierung von Datenbanksystemen, etwa anhand der Kurse 01665 Datenbanksysteme, 01671 Datenbanken I, 01664 Implementierung von Datenbanksystemen

Anmeldung

Sie können sich ausschließlich vom 1.12.2006 bis spätestens 31.1.2007, 24:00 Uhr, per Web-Formular anmelden. Beachten Sie bitte, daß die Teilnehmerzahl zu diesem Seminar begrenzt ist. Sollte die Zahl der Anmeldungen die Zahl der Seminarplätze übersteigen, wird der Fortschritt im Studium bei der Auswahl der Teilnehmer berücksichtigt. Geben Sie dazu bitte eine Liste der von Ihnen erworbenen Leistungsnachweise und erfolgreich abgelegter Prüfungen an.

Falls Sie einfach nur als Zuhörer teilnehmen möchten, so teilen Sie uns dies bitte informell per E-Mail mit.

Auskunft erteilen

Prof. Dr. Ralf Hartmut Güting, Praktische Informatik IV, FernUniversität Hagen, 58084 Hagen,
Tel.: (02331) 987-4279, Email: rhg@fernuni-hagen.de

Dipl.-Math. Markus Spiekermann, Praktische Informatik IV, FernUniversität Hagen, 58084 Hagen,
Tel.: (02331) 987-4285, Email: markus.spiekermann@fernuni-hagen.de



Letzte Änderung: 2016-11-22 ()
FernUni-Logo FernUniversität in Hagen, Lehrgebiet Datenbanksysteme für neue Anwendungen, D-58084 Hagen, Telefon: +49 (2331) 987-4277