Мультижазылымды ресімдеу
Плюсті тексеріңіз
Кіру
Павел Н.
card.quoted
3 күн бұрын
Еще один простой подход, который часто используют для описания архитектуры алгоритмов обучения с подкреплением, — обобщенная итерация политик (generalized policy iteration, GPI).
Мигель Моралес
Грокаем глубокое обучение с подкреплением
4.2K
505
24
Комментарий жазу үшін
кіру немесе тіркелу