Теоретический минимум по Big Data. Все что нужно знать о больших данных
Қосымшада ыңғайлырақҚосымшаны жүктеуге арналған QRRuStore · Samsung Galaxy Store
Huawei AppGallery · Xiaomi GetApps

автордың кітабынан сөз тіркестері  Теоретический минимум по Big Data. Все что нужно знать о больших данных

Андрей Алексеев
Андрей Алексеевдәйексөз келтірді4 жыл бұрын
Более того, исключение элементов данных может привести к искаженным результатам в отношении отдельных групп. Например, коты могут менее охотно, чем другие, раскрывать информацию о количестве приобретаемых фруктов. Если мы удалим такие покупки, коты будут недостаточно представлены в итоговой выборке.
2 Ұнайды
Комментарий жазу
Кирилл К.
Кирилл К.дәйексөз келтірді1 жыл бұрын
Если пропущено значение бинарного или категориального типа, его можно заменить самым типичным значением (модой) переменной
1 Ұнайды
Комментарий жазу
Такое исследование включает четыре ключевых шага. Сначала обрабатываются и подготавливаются данные. Потом составляется краткий перечень соответствующих исследованию алгоритмов. Затем для улучшения результатов настраиваются параметры этих алгоритмов. И наконец, строятся модели для выбора лучшей из них
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді3 апта бұрын
анализ независимых компонент (АНК).
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді3 апта бұрын
Поэтому метод главных компонент относят к техникам уменьшения размерности.
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді3 апта бұрын
Несмотря на эти ограничения сила кластеризации методом k-средних заключается в ее элегантной простоте. Хороший подход состоит в том, чтобы начинать с кластеризации методом k-средних для изначального понимания структуры данных, а затем привлекать более продвинутые методы, лишенные его недостатков.
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді3 апта бұрын
Хотя кластеризация методом k-средних очень полезна, у нее есть ограничения:
Комментарий жазу
zamaziz
zamazizдәйексөз келтірді3 апта бұрын
Одним из способов определить оптимальное количество кластеров является использование так называемого графика каменистой осыпи, или графика Кеттела (scree plot) (рис.
Комментарий жазу
Булат М.
Булат М.дәйексөз келтірді2 ай бұрын
Лувенский метод — один из способов определения кластеров сети. Он подбирает различные кластерные конфигурации, чтобы: 1) максимизировать число и силу связей между узлами в одном кластере; 2) минимизировать при этом связи между узлами различных кластеров. Степень удовлетворения этим двум условиям известна как модулярность (modularity), и более высокая модулярность — признак более оптимальных кластеров.
Комментарий жазу
Булат М.
Булат М.дәйексөз келтірді2 ай бұрын
Кроме группировки в кластеры мы также проранжировали отдельные страны по уровню их влияния, воспользовавшись алгоритмом PageRank
Комментарий жазу