Однако если между значениями категориального признака нет порядка, то целочисленное кодирование — не лучший вариант. Проблему решает унитарное кодирование.
Унитарное (one-hot) кодирование. Для каждого уникального значения создается новый бинарный признак.
System Design. Машинное обучение. Подготовка к сложному интервью
·
Алекс Сюй