Несмотря на эти ограничения сила кластеризации методом k-средних заключается в ее элегантной простоте. Хороший подход состоит в том, чтобы начинать с кластеризации методом k-средних для изначального понимания структуры данных, а затем привлекать более продвинутые методы, лишенные его недостатков.
Теоретический минимум по Big Data. Все что нужно знать о больших данных
·
Анналин Ын