Эпсилон-жадный алгоритм — это алгоритм МРБ, который легко реализовать. Его сожаление имеет оптимальную асимптотическую оценку, но требует настройки метапараметра, который зависит от системы.
Тюнинг систем: экспериментирование для инженеров от A/B-тестирования до байесовской оптимизации
·
Дэвид Свит