Когда люди не инженерных специальностей слышат «аналитика и Data Science», то представляют разное. Кто-то видит таблицы и графики. Кто-то неподъемно сложные математические формулы. Кто-то программирование и искусственный интеллект… Но истоки этих понятий из области статистики, которая делится на описательную и аналитическую. И эта кажущаяся непостижимой аналитика — на самом деле нескучная, интересная и простая вещь. Чтобы ею пользоваться, не нужно ни изучение сложных формул, ни программирования…
Знаете, господа, я не феминистка и против феминизма. Но автор просто зациклен на идее, что "курица не птица, баба не человек". Рисунок номер 105 из этой малополезной книжицы-для иллюстрации. Это позорище, такое писать. Видно, военный опыт сказывается на дяде, хотя сейчас женщины служат не то что наравне с мужчинами, а лучше мужчин, и по Красной площади шагают. Омерзительно читать такие примеры! Местами книга полезная, Но не более того точка можно посмотреть в рамках бесплатной подписки, деньги тратить не советую
Хороший материал для формирования общего впечатления по описываемым направлениям. Кого-то привлечет заняться этой сферой глубже, кто-то просто поймёт, что это не его. Автору спасибо за книгу.
С каждым днем все сложнее становится провести границу между любой современной профобластью (от биологии и медицины до управления организациями и персоналом) и аналитикой. А все социально-экономические исследования практически неотделимы от сравнений выборок, корреляционного, факторного и регрессионного анализа.
1. Есть описательная и аналитическая статистика. Описательная статистика «ужимает» миллионы и миллиарды цифр к какому-то компактному числу, типичному для всего миллиона цифр. Аналитика позволяет находить скрытые закономерности, которые дают нам больше понимания о реальности и как она работает, а также строить прогнозы. 2. Выборка и генеральная совокупность. Генеральная совокупность — вся целиком популяция исследуемых объектов. Выборка — выбранные из этой популяции объекты (часть генеральной совокупности). Но выборка должна быть репрезентативной — т.е., отражать генеральную совокупность. 3. Переменные — это признаки / характеристики изучаемых нами объектов (люди, животные, товар, клиенты, организации и т.д.), которые могут принимать разные значения. Доход, пол, возраст, цвет и т. д. 4. В практике стоит различать три типа шкал для измерения переменных. Номинальная: шкала наименований — город, пол, профессия и т. д. Ординальная / порядковая: отражающая степень проявления какого-либо свойства, без точных измерений — высокий-низкий; больше-меньше; I — II — III место и т. д. Интервальная: отражает размерность или масштаб каждой переменной — доход, возраст в годах, расстояние и т. д. 5. Мы выдвигаем наши предположения / суждения (как в виде мнений или домыслов, так и опыта) в виде гипотез, которые потом проверяем цифрами и аналитикой. В статистике фигурируют две гипотезы. Нулевая гипотеза (H0), гласящая что закономерностей, взаимосвязей, различий в генеральной совокупности не существует — все что мы обнаружили всего лишь нелепая случайность в нашей выборке. И альтернативная (H1), которая гласит, что обнаруженные в выборке различия нельзя объяснить случайностью: они вероятнее всего имеют место и «материальны» в генеральной совокупности. 6. Практическая статистика оперирует не вероятностью наступления события (или истинности утверждения), а вероятностью ошибиться в случае применения обнаруженной закономерности ко всей генеральной совокупности. Самым страшным и критичным в анализе считается именно обнаружить закономерности, взаимосвязи или различия, которых на самом деле в генеральной совокупности не существует. 7. Все закономерности (взаимосвязи, различия), по которым вероятность ошибки относительно их отсутствия в генеральной совокупности менее 5% (менее 0,05), считаются статистически значимыми. 8. В социально-экономической реальности Вы редко будете встречать нормальное распределение. Оно будет скорее скошено вправо или влево, или очень сжато к оси ОХ или ОY. 90% жителей страны владеют 2% капитала, 2 певца забирают 95% популярности, 99% тиража всех книг приходится на 1% авторов и т. д.
Есть еще, конечно, креативная отсебятина (кстати, очень часто встречаемая в менеджменте, социально-экономических и гуманиртарных направлениях). Когда человек что-то увидел, чего-то нахватался — и из этого породил в голове какую-то ерунду и, уверовав в нее, обозвал некой моделью