Глубокое обучение с подкреплением: теория и практика на языке Python
Қосымшада ыңғайлырақҚосымшаны жүктеуге арналған QRRuStore · Samsung Galaxy Store
Huawei AppGallery · Xiaomi GetApps

автордың кітабынан сөз тіркестері  Глубокое обучение с подкреплением: теория и практика на языке Python

Достан Кабаков
Достан Кабаковдәйексөз келтірді10 ай бұрын
— это векторы, кодирующие свойства, такие как позиции и скорости. В Atari Breakout состояние — это изображение экрана игры. В CartPole и Atari Breakout действия являются одиночными
1 Ұнайды
Комментарий жазу
Наталья
Натальядәйексөз келтірді1 жыл бұрын
Достижение цели, как правило, подразумевает выполнение ряда действий, каждое из которых изменяет окружающий мир.
1 Ұнайды
Комментарий жазу
Наталья
Натальядәйексөз келтірді1 жыл бұрын
Обучение с подкреплением (reinforcement learning, RL) занимается задачами последовательного принятия решений.
1 Ұнайды
Комментарий жазу
Наталья
Натальядәйексөз келтірді1 жыл бұрын
Однако значительная часть последних изысканий вкупе с ростом мощности графических процессоров способствовали развитию возможностей современных алгоритмов
1 Ұнайды
Комментарий жазу
крытым исходным кодом SLM Lab, призванную по
1 Ұнайды
Комментарий жазу
Артём
Артёмдәйексөз келтірді2 жыл бұрын
методы, основанные на стратегии, методы, основанные на полезности, и методы, основанные на модели среды
1 Ұнайды
Комментарий жазу
Артём
Артёмдәйексөз келтірді2 жыл бұрын
Функция полезности Qπ в уравнении (1.11) оценивает, насколько хороша или плоха пара «состояние — действие».
1 Ұнайды
Комментарий жазу
Наталья
Натальядәйексөз келтірді1 жыл бұрын
Обучение с подкреплением, обучение с учителем и обучение без учителя — три основные методики машинного обучения, каждая из которых отличается формулировкой задач и обучением алгоритмов по данным.
Комментарий жазу
Алексей К.
Алексей К.дәйексөз келтірді1 жыл бұрын
О научном редакторе русскоязычного издания
Комментарий жазу
SLM Lab написана на Python с помощью фреймворка PyTorch, но читателям достаточно знать только Python.
Комментарий жазу