Машинное обучение без иллюзий. Понимание возможностей и границ ML
Қосымшада ыңғайлырақҚосымшаны жүктеуге арналған QRRuStore · Samsung Galaxy Store
Huawei AppGallery · Xiaomi GetApps

автордың кітабынан сөз тіркестері  Машинное обучение без иллюзий. Понимание возможностей и границ ML

Пользователь #.
Пользователь #.дәйексөз келтірді1 ай бұрын
сигнал к продаже, что привело к каскадному обрушению рынка. Модели пытались экстраполировать за пределы известной им области, где закономерности уже не работали. Ключевое ограничение
1 Ұнайды
Комментарий жазу
nadcablook
nadcablookдәйексөз келтірді5 күн бұрын
Теперь мы решаем: какие данные собирать, какую архитектуру модели выбрать, какую метрику оптимизировать, где поставить пороговое значение. Каждое из этих решений влияет на судьбы тысяч людей, но принимается на уровне метарешений, часто без полного понимания последствий.
Комментарий жазу
Света Т.
Света Т.дәйексөз келтірді1 апта бұрын
градиентный бустинг (ансамблевый метод, объединяющий множество слабых моделей для повышения точности), может повысить точность прогнозов (долю правильных предсказаний), но создаёт новые проблемы. Модель (система машинного обучения) становится непрозрачной — сложно объяснить клиенту причину отказа.
Комментарий жазу
Света Т.
Света Т.дәйексөз келтірді1 апта бұрын
Дерево решений (алгоритм последовательного разбиения данных по условиям) предполагает иерархичность: сначала самый важный фактор, потом следующий в зависимости от первого.
Комментарий жазу
Света Т.
Света Т.дәйексөз келтірді1 апта бұрын
Линейная регрессия (метод поиска линейной зависимости между переменными) предполагает, что эффекты факторов складываются: влияние возраста плюс влияние дохода равно общему эффекту.
Комментарий жазу
Света Т.
Света Т.дәйексөз келтірді1 апта бұрын
Здесь важно понимать разницу между интерполяцией (предсказание внутри области, покрытой обучающими данными) и экстраполяцией (предсказание за её пределами).
Комментарий жазу
Света Т.
Света Т.дәйексөз келтірді1 апта бұрын
Запущенная в 2008 году, система показывала впечатляющие результаты, предсказывая вспышки гриппа на две недели раньше официальной статистики CDC (Центров по контролю заболеваний США). Модель выявила корреляцию между определёнными поисковыми запросами («симптомы гриппа», «температура и кашель») и реальными вспышками заболевания. Но в 2013 году система дала сбой, переоценив масштабы эпидемии гриппа в два раза (согласно публикации в Nature). Анализ показал: модель уловила корреляцию, но не причинность. Медийное освещение гриппа заставляло здоровых людей искать информацию о симптомах. Модель интерпретировала рост запросов как признак эпидемии, хотя причиной была паника в СМИ, а не реальный рост заболеваемости.
Комментарий жазу
Света Т.
Света Т.дәйексөз келтірді1 апта бұрын
Машинное обучение основано на трёх взаимосвязанных процессах: выявлении статистических закономерностей, интерполяции и экстраполяции в пространстве признаков, и применении выявленных закономерностей к новым данным.
Комментарий жазу
Света Т.
Света Т.дәйексөз келтірді1 апта бұрын
С математической точки зрения модель аппроксимирует функцию, которая отображает входное пространство признаков в выходное пространство предсказаний.
Комментарий жазу
Света Т.
Света Т.дәйексөз келтірді1 апта бұрын
И часто невозможно заранее определить, где проходит граница между надёжной интерполяцией и рискованной экстраполяцией.
Комментарий жазу