Теоретический минимум по Big Data. Все что нужно знать о больших данных
Қосымшада ыңғайлырақҚосымшаны жүктеуге арналған QRRuStore · Samsung Galaxy Store
Huawei AppGallery · Xiaomi GetApps

автордың кітабынан сөз тіркестері  Теоретический минимум по Big Data. Все что нужно знать о больших данных

Андрей Алексеев
Андрей Алексеевдәйексөз келтірді4 жыл бұрын
Более того, исключение элементов данных может привести к искаженным результатам в отношении отдельных групп. Например, коты могут менее охотно, чем другие, раскрывать информацию о количестве приобретаемых фруктов. Если мы удалим такие покупки, коты будут недостаточно представлены в итоговой выборке.
2 Ұнайды
Комментарий жазу
Кирилл К.
Кирилл К.дәйексөз келтірді1 жыл бұрын
Если пропущено значение бинарного или категориального типа, его можно заменить самым типичным значением (модой) переменной
1 Ұнайды
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді6 сағат бұрын
анализ независимых компонент (АНК).
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді6 сағат бұрын
Поэтому метод главных компонент относят к техникам уменьшения размерности.
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді6 сағат бұрын
Несмотря на эти ограничения сила кластеризации методом k-средних заключается в ее элегантной простоте. Хороший подход состоит в том, чтобы начинать с кластеризации методом k-средних для изначального понимания структуры данных, а затем привлекать более продвинутые методы, лишенные его недостатков.
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді6 сағат бұрын
Хотя кластеризация методом k-средних очень полезна, у нее есть ограничения:
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді6 сағат бұрын
Одним из способов определить оптимальное количество кластеров является использование так называемого графика каменистой осыпи, или графика Кеттела (scree plot) (рис.
Комментарий жазу
Булат М.
Булат М.дәйексөз келтірді1 ай бұрын
Лувенский метод — один из способов определения кластеров сети. Он подбирает различные кластерные конфигурации, чтобы: 1) максимизировать число и силу связей между узлами в одном кластере; 2) минимизировать при этом связи между узлами различных кластеров. Степень удовлетворения этим двум условиям известна как модулярность (modularity), и более высокая модулярность — признак более оптимальных кластеров.
Комментарий жазу
Булат М.
Булат М.дәйексөз келтірді1 ай бұрын
Кроме группировки в кластеры мы также проранжировали отдельные страны по уровню их влияния, воспользовавшись алгоритмом PageRank
Комментарий жазу
Булат М.
Булат М.дәйексөз келтірді1 ай бұрын
После анализа получившейся сети лувенским методом (Louvain Method
Комментарий жазу