Алгоритмы многорукого бандита снижают издержки экспериментальной оптимизации за счет компромисса между оценкой версий системы (этап «исследование», или «разведка», exploration) и увеличением бизнес-метрики (этап «использование», или «эксплуатация», exploitation).
Тюнинг систем: экспериментирование для инженеров от A/B-тестирования до байесовской оптимизации
·
Дэвид Свит