• Проблема многорукого бандита отвечает на вопрос о лучшем распределении ресурсов: использовать ли полученные сведения или искать лучшую альтернативу.
• При одном подходе мы сначала изучаем доступные варианты, после чего тратим все оставшиеся ресурсы на тот, который сочли лучшим. Эта стратегия называется A/B-тестированием.
• При другом подходе мы постепенно увеличиваем долю ресурсов, выделяемых для варианта, который показывает лучший результат. Это называется стратегией снижения эпсилона.
• Хотя стратегия снижения эпсилона и работает лучше, чем A/B-тестирование, оптимальную долю ресурсов для перераспределения определить нелегко.
Теоретический минимум по Big Data. Все что нужно знать о больших данных
·
Анналин Ын