Случайный лес
Алгоритм случайного леса основывается на концепции деревьев решений с использованием ансамблевого метода классификации. Вместо одного дерева случайный лес использует много разных деревьев, чтобы сделать один и тот же прогноз, принимая среднее значение результатов отдельных деревьев.
Способность ансамблевых методов к интуитивному мышлению
Вот мой любимый пример ансамблевого метода, который должен сделать концепцию более интуитивно понятной. Вы когда-нибудь участвовали в конкурсе, в котором нужно определить количество конфет внутри стеклянной банки? Тот, чья догадка окажется ближе всего к правильному ответу, выигрывает приз[44].
В то время как некоторые из деревьев могут быть недостаточно эффективны (в зависимости от поставленной бизнес-задачи), мы можем применить силу толпы; когда деревья решений используются в совокупности, они могут давать гораздо более обоснованные прогнозы. Подумайте об этом как о процессе голосования — каждое решающее дерево проголосует (сделает прогноз), а затем алгоритм случайного леса возьмет вариант с наибольшим количеством голосов в качестве результата. Демократия среди деревьев!
Это делает оригинальный алгоритм намного более мощным. Вместо одного дерева решений для всего массива данных случайный лес создает несколько деревьев решений. Чтобы сделать такие деревья уникальными, их создают из различных подмножеств массива данных.