Задачи и методы офлайн-обучения. Как правило, офлайн-обучение — это либо постановка задачи, где предусмотрена симуляция сбора данных (в противовес настоящей онлайн-среде), либо методы обучения постфактум — например, между эпизодами. Отмечу, что в офлайн-методах обучение и взаимодействие тоже могут чередоваться, но производительность улучшается только после получения выборки. Это похоже на растущие пакетные методы, описанные выше, с той лишь разницей, что старые выборки обычно отбрасываются: то есть данные не накапливаются.