goto contents


Ludmila Himmelspach

Vergleich von Strategien zum Clustern von Daten mit fehlenden Werten

Universität Rostock, 2009

in: 21. Workshop Grundlagen von Datenbanken : 02.-05. Juni 2009, Rostock-Warnemünde : Proceedings, Seiten 129-133

https://doi.org/10.18453/rosdok_id00002202

Abstract: Die klassischen Methoden zur Clusteranalyse wurden entwickelt, um auf vollständigen Daten Analysen durchzuführen. Oft fehlen aber in Daten einzelne Werte - systematisch oder unsystematisch -, z.B. infolge der Probleme bei der Datenerfassung, Datenübertragung, Datenbereinigung oder weil Daten aus unterschiedlichen Quellen stammen. Demzufolge können die traditionellen Clusteringmethoden zur Analyse solcher Daten nicht ohne weiteres angewendet werden. Im Rahmen dieses Beitrags werden unterschiedliche Strategien zum Umgang mit fehlenden Werten in Daten für das Clusteringproblem vorgestellt, analysiert und miteinander verglichen. Dabei wird das besondere Augenmerk auf die Untersuchung der Leistungsfähigkeit dieser Verfahren in Abhängigkeit von den Ausfallmechanismen, die den fehlenden Werten zugrundeliegen, und von dem Anteil fehlender Werte in Daten gelegt.

article   free access    


Portals

OPACGVKDataCite Commons

Rights

all rights reserved

This work may only be used under the terms of the German Copyright Law (Urheberrechtsgesetz).