Другой способ кодирования категориальных признаков основан на обучении с эмбеддингами. Эмбеддинг (вложение) — это отображение категориального признака на N-мерный вектор. При обучении с эмбеддингами подбирается N-мерный вектор для каждого уникального значения, которое может принимать категориальный признак. Такой подход полезен, когда уникальных значений признака очень много. В этом случае унитарное кодирование недостаточно эффективно, потому что векторы получаются чересчур длинными
System Design. Машинное обучение. Подготовка к сложному интервью
·
Алекс Сюй