Артём
дәйексөз келтірді
2 жыл бұрын
Функция полезности Qπ в уравнении (1.11) оценивает, насколько хороша или плоха пара «состояние — действие».
Глубокое обучение с подкреплением: теория и практика на языке Python
·
Ван Лун Кенг
Глубокое обучение с подкреплением: теория и практика на языке Python
Ван Лун Кенг
Лаура Грессер
және т.б.
1.4K
1 Ұнайды
Ұнайды
Комментарий жазу
Бөлісу
Кіру не тіркелу
пікір қалдыру үшін
Басты
Аудио
Комикстер
Балаларға арналған
Мультижазылымды ресімдеу
Плюсті тексеріңіз
Кіру