Цитаты из книги авторов Грессер Л., Кенг В. Глубокое обучение с подкреплением: теория и практика на языке Python

Достижение цели, как правило, подразумевает выполнение ряда действий, каждое из которых изменяет окружающий мир.

Обучение с подкреплением (reinforcement learning, RL) занимается задачами последовательного принятия решений.

Обучение с подкреплением, обучение с учителем и обучение без учителя — три основные методики машинного обучения, каждая из которых отличается формулировкой задач и обучением алгоритмов по данным.

Натальяцитирует2 месяца назад

Однако значительная часть последних изысканий вкупе с ростом мощности графических процессоров способствовали развитию возможностей современных алгоритмов

Алексей К.цитирует1 год назад

О научном редакторе русскоязычного издания

Антон Самойленкоцитирует1 год назад

SLM Lab написана на Python с помощью фреймворка PyTorch, но читателям достаточно знать только Python.

Антон Самойленкоцитирует1 год назад

крытым исходным кодом SLM Lab, призванную по

Антон Самойленкоцитирует1 год назад

Артур Джулиани, ведущий инженер по машинному обучению, Unity Technologies

Артёмцитирует1 год назад

методы, основанные на стратегии, методы, основанные на полезности, и методы, основанные на модели среды

Артёмцитирует1 год назад

Функция полезности Qπ в уравнении (1.11) оценивает, насколько хороша или плоха пара «состояние — действие».