Оформить подписку
Войти
Валерий К.
цитирует
4 месяца назад
REINFORCE известен как алгоритмградиента стратегии
Грессер Л.
,
Кенг В.
Глубокое обучение с подкреплением: теория и практика на языке Python
403
13
5
Войти или зарегистрироваться
, чтобы комментировать