Грокаем глубокое обучение с подкреплением
Қосымшада ыңғайлырақҚосымшаны жүктеуге арналған QRRuStore · Samsung Galaxy Store
Huawei AppGallery · Xiaomi GetApps

 Грокаем глубокое обучение с подкреплением

Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах.
Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.
Оқыдыңыз ба? Не айтасыз?
Петр Носов
Петр Носовдәйексөз келтірді1 жыл бұрын
представляю время, когда мы будем для роботов тем же, чем сейчас собаки являются для людей, и болею за машины.
1 Ұнайды
Комментарий жазу
Анжелика К._laptop
Анжелика К._laptopдәйексөз келтірді1 жыл бұрын
Она лежит в основе так называемой временной задачи присваивания коэффициентов доверия — в определении того, какое состояние и/или действие привело к получению вознаграждения. Когда у задачи есть временная составляющая, а у действия — отложенные последствия, наградам сложно присвоить коэффициенты доверия.
1 Ұнайды
Комментарий жазу
Павел Н.
Павел Н.дәйексөз келтірді1 күн бұрын
В главе 2 вы научились представлять последовательные задачи принятия решений с по­мощью марковского процесса принятия решений (Markov decision process, MDP). В главе 3 вы узнали, как эти задачи можно выполнять с помощью алгоритмов, которые извлекают политики из MDP.
Комментарий жазу
Питер
Издательский дом «Питер»
Издательский дом «Питер»
1 829 кітап
808
Айтишная полка
undlake
undlake
277 кітап
760
Грокаем программирование
Vladislav Grechkoseev
Vladislav Grechkoseev
13 кітап
77
Машинное обучение, DS
Андрей Белов
Андрей Белов
42 кітап
62
Программирование
Алексей Ермаков
Алексей Ермаков
100 кітап
39