Глубокое обучение с подкреплением: теория и практика на языке Python
Қосымшада ыңғайлырақҚосымшаны жүктеуге арналған QRRuStore · Samsung Galaxy Store
Huawei AppGallery · Xiaomi GetApps

 Глубокое обучение с подкреплением: теория и практика на языке Python

Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.
Оқыдыңыз ба? Не айтасыз?
Достан Кабаков
Достан Кабаковдәйексөз келтірді6 ай бұрын
— это векторы, кодирующие свойства, такие как позиции и скорости. В Atari Breakout состояние — это изображение экрана игры. В CartPole и Atari Breakout действия являются одиночными
Комментарий жазу
Наталья
Натальядәйексөз келтірді10 ай бұрын
Достижение цели, как правило, подразумевает выполнение ряда действий, каждое из которых изменяет окружающий мир.
Комментарий жазу
Наталья
Натальядәйексөз келтірді10 ай бұрын
Обучение с подкреплением (reinforcement learning, RL) занимается задачами последовательного принятия решений.
Комментарий жазу
Питер
Издательский дом «Питер»
Издательский дом «Питер»
1 829 кітап
808
Айтишная полка
undlake
undlake
277 кітап
760
Машинное обучение, DS
Андрей Белов
Андрей Белов
42 кітап
62
Программирование
Алексей Ермаков
Алексей Ермаков
100 кітап
39
Information technology
Timofei
Timofei
102 кітап
12