Грокаем глубокое обучение с подкреплением
Мигель Моралес

Кітап туралы Дәйексөздер505 Қазір оқып жатыр4.2K Сөрелерде

Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах.
Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.

IT-технологии

Жас шектеулері: 16+

Құқық иегері: Питер

Баспа: Питер

Аудармашы: Сергей Черников

Қағаз беттер: 740

Ұқсас кітаптар

Эрик ЧоуPython для сетевых инженеров. Автоматизация сети, программирование и DevOps

Кеннеди БерманОсновы Python для Data Science

Джон Арундел, Джастин ДомингусKubernetes для DevOps: развертывание, запуск и масштабирование в облаке

Пол ОрландМатематические алгоритмы для программистов. 3D-графика, машинное обучение и моделирование на Python

Франсуа ШоллеГлубокое обучение на Python. 2-е межд. издание

Уолтер ШилдсSQL: быстрое погружение

Роберт С. СикордЭффективный C. Профессиональное программирование

Маттиас НобакОбъекты. Стильное ООП

Стивен Лотт, Дасти ФиллипсОбъектно-ориентированный Python

Леонид НикифоровМатематика для DATA SCIENTIST. Анализ данных и математическое моделирование (путеводитель)

18+

Дэниел Джей БарреттLinux. Командная строка. Лучшие практики

Владстон Феррейра Фило, Мото ПиктетТеоретический минимум по Computer Science. Сети, криптография и data science

Даниэль ЗингароАлгоритмы на практике

Радмила ШарифьяноваАнглийский для айтишников. Tech English: Язык программистов и IT-специалистов

Ян ЛекунКак учится машина. Революция в области нейронных сетей и глубокого обучения

Роберт МартинИдеальная работа. Программирование без прикрас

Алекс Сюй, Али АминианSystem Design. Машинное обучение. Подготовка к сложному интервью

Джордж ХайнеманАлгоритмы. С примерами на Python

Кэрол Николс, Стив КлабникПрограммирование на Rust

Луис СерраноГрокаем машинное обучение

Оқыдыңыз ба? Не айтасыз?

👍👎

Дәйексөздер505

Петр Носовдәйексөз келтірді1 жыл бұрын

представляю время, когда мы будем для роботов тем же, чем сейчас собаки являются для людей, и болею за машины.

1 Ұнайды

Комментарий жазу

Анжелика К._laptopдәйексөз келтірді1 жыл бұрын

Она лежит в основе так называемой временной задачи присваивания коэффициентов доверия — в определении того, какое состояние и/или действие привело к получению вознаграждения. Когда у задачи есть временная составляющая, а у действия — отложенные последствия, наградам сложно присвоить коэффициенты доверия.

1 Ұнайды

Комментарий жазу

Павел Н.дәйексөз келтірді1 күн бұрын

В главе 2 вы научились представлять последовательные задачи принятия решений с помощью марковского процесса принятия решений (Markov decision process, MDP). В главе 3 вы узнали, как эти задачи можно выполнять с помощью алгоритмов, которые извлекают политики из MDP.

Комментарий жазу