Анна Г.card.quoted5 ай бұрын
Обучение с подкреплением (Reinforcement Learning) — это раздел машинного обучения, в котором агент обучается принимать последовательность действий в окружающей среде с целью максимизации некоторой награды или оценочной функции. В отличие от обучения с учителем, где модель обучается на размеченных данных, и обучения без учителя, где модель изучает структуру данных, обучение с подкреплением основано на принципе проб и ошибок
  • Комментарий жазу үшін кіру немесе тіркелу