отличить интересные паттерны данных от случайного шума. Кроме того, эта глава знакомит вас с опасностями неверного применения статистического вывода и способами избежать их.
• В главе 8 описывается библиотека Pandas, которую можно задействовать для предварительной обработки табличных данных перед статистическим анализом.
• В главе 9 приводится решение данного практического задания.
Третье практическое задание посвящено неуправляемой кластеризации географических данных.
• В главе 10 показано, как измерение центральности можно использовать для кластеризации данных по группам. Здесь также вводится библиотека scikit-learn, которая позволит выполнять кластеризацию более эффективно.
• В главе 11 разбирается тема извлечения и визуализации географических данных. Извлечение из текста выполняется с помощью библиотеки GeoNamesCache, а для визуализации