Общее уравнение, которое лежит в основе большинства методов обучения, выглядит так: прогноз = прогноз + шаг × погрешность. Погрешность — это просто разность между полученной целью и ее текущей ценностью (цель – ценность). Два основных противоположных способа вычисления этих целей: метод Монте-Карло и временное разностное обучение.