Sprungmarken

Servicenavigation

       

Hauptnavigation

Bereichsnavigation

Hauptinhalt

Clustering Algorithmen

Wintersemester 2009/2010

Veranstalter:Prof. Dr. Christian Sohler
Termine: Donnerstag 12:15-13:45 Uhr OH 14, 304
Beginn: 15. Oktober 2009


[Inhalt] [Begleitmaterial] [Übungen]


Inhalt

In dieser Vorlesung werden wir uns mit einem wichtigen Werkzeug zur Analyse von Datensätzen beschäftigen: Clustering. Unter Clustering versteht man sinnvolles und/oder nützliches Aufteilen von Daten in Gruppen. Eine sinnvolle Aufteilung sollte dabei die natürliche Struktur der Daten wiedergeben. In anderen Anwendungen ist z.B. das Ziel in den einzelnen Clustern möglichst viele ähnliche Daten zu haben (z.B. bei der Datenkompression). Clustering ist eine sehr natürliche (vom Menschen häufig genutzte) Herangehensweise bei der Analyse und Strukturierung von Daten.

In fast allen Bereichen der Wissenschaft und auch im täglichen Sprachgebrauch werden Objekte nach ihrem Typ in Gruppen aufgeteilt. Insbesondere in der Wissenschaft haben wir es hüufig mit Daten zu tun deren Struktur wir nicht kennen. Ein bekanntes Beispiel ist die menschlichen DNA, deren Bedeutung wir zu entschlüsseln versuchen. Bei solchen Aufgaben kann computerunterstütztes Clustering wertvolle Dienste leisten.
Inhalt der Vorlesung:

  • Grundlegende Clustering Algorithmen (k-center, k-means)
  • Clustering großer Datenmengen
  • Dimensionsreduktion und metrische Einbettungen


Begleitmaterial

  1. Skript (nur aus dem Uni-internen Netz verfügbar - z.B. via SSL VPN des ITMC)


Übungen

Übungsgruppen (alle 2 Wochen):

Zeit: Ort:
Gruppe 1: Donnerstag, 14.15-15.45 Uhr OH 14, 304


Übungsblätter:

  1. Übungsblatt
  2. Übungsblatt

  1. Präsenzübungsblatt
  2. Präsenzübungsblatt
  3. Präsenzübungsblatt


Letzte Änderung am 26.11.2009 von H. Spiegel