автордың кітабынан сөз тіркестері Роман с Data Science. Как монетизировать большие данные
Роман Зыков

Мой рецепт следующий: • Если данных относительно немного и нет таблиц с миллиардами строк, то проще использовать обычную реляционную базу. • Если данных больше миллиарда строк или требуется хорошая скорость для аналитических запросов (агрегация и выборки) — то лучше всего использовать колоночную базу данных. • Если требуется хранить очень большой объем с сотнями миллиардов строк, вы готовы мириться с медленной скоростью или хотите иметь архив исходных данных — то Hadoop.

2 Ұнайды

Комментарий жазу

Даша В.дәйексөз келтірді2 жыл бұрын

Оценивая последствия своего решения (особенно неудачного), в приступе самокопания мы не должны забывать, что принимали решение в условиях неопределенности.

1 Ұнайды

Комментарий жазу

Дарья Елагинадәйексөз келтірді2 жыл бұрын

Но хотя количественные оценки — это плохо, никто пока не придумал ничего лучше.

1 Ұнайды

Комментарий жазу

Павелдәйексөз келтірді2 жыл бұрын

проект на старте лучше сильно урезать по «хотелкам», чтобы получить на выходе работающую версию как можно быстрее. На то есть несколько причин. Во-первых, после того как вы, заказчик, вживую поработаете с ней, вам гораздо легче будет сформулировать, что вы действительно хотите. Это тяжело делать абстрактно на бумаге, конструируя сферического коня в вакууме. Вторая причина — драйв, лично для меня это очень важно. Когда время течет медленно, у команды, да и у заказчиков, постепенно угасает интерес. И на выходе мы уже получаем вымученный проект, которым уже не так сильно хочется заниматься

1 Ұнайды

Комментарий жазу

Павелдәйексөз келтірді2 жыл бұрын

Дашборд отвечает на вопрос, где есть проблема, а не почему она возникла

1 Ұнайды

Комментарий жазу

Анна Погадаевадәйексөз келтірді2 жыл бұрын

«Маленькая грязная тайна продолжающегося бума data science в том, что то, что обычно подразумевается под этим на самом деле, не нужно бизнесу. Бизнесу нужна точная и полезная информация для принятия решений: как тратить время и ресурсы компании. Очень небольшое подмножество задач в бизнесе может быть лучшим образом решено машинным обучением; большинство же из них нуждается в хороших данных и понимании их смысла, что может быть достигнуто простыми методами»

1 Ұнайды

Комментарий жазу

Анна Погадаевадәйексөз келтірді2 жыл бұрын

• Цель аналитики заключается [https://topdatalab.ru/ref?link=10] в помощи формулирования гипотезы. • Цель статистики [https://topdatalab.ru/ref?link=10] в том, чтобы эту гипотезу проверить и подтвердить.

1 Ұнайды

Комментарий жазу

Любовь Кособрюховадәйексөз келтірді2 апта бұрын

Аналитик данных как исследователь несет личную ответственность за результат своих цифр.

Комментарий жазу

Любовь Кособрюховадәйексөз келтірді2 апта бұрын

объективность важнее моих априорных решений до проведения эксперимента.

Комментарий жазу

Любовь Кособрюховадәйексөз келтірді2 апта бұрын

Безос предупреждает, что есть два типа решений и они не должны проходить один и тот же процесс утверждения. Первый тип — решения, у которых нет или почти нет обратной дороги. Это как дверь, в которую можно войти, но нельзя выйти. Здесь нужно действовать очень внимательно и осторожно. Второй тип — решения, у которых есть обратный ход. Дверь, в которую можно войти и выйти. Здесь он предлагает утверждать идею достаточно быстро, не мучая ее долго бюрократическими процедурами.

Комментарий жазу

Басты
⭐️IT-технологии
Роман Зыков
Роман с Data Science. Как монетизировать большие данные
📖Дәйексөздер

автордың кітабынан сөз тіркестері Роман с Data Science. Как монетизировать большие данныеРоман Зыков

автордың кітабынан сөз тіркестері Роман с Data Science. Как монетизировать большие данные
Роман Зыков