Если признак категориальный, то можно создать новую категорию, которая будет означать «отсутствие признака». Модель автоматически узнает, что это означает по отношению к целям.
• Если признак числовой, желательно избегать использования произвольного значения (например, 0) — это может создать разрыв в скрытом пространстве, образованном признаками, из-за чего обучаемой модели будет труднее найти обобщающее решение. Вместо этого можно попробовать заменить отсутствующие значения средним или медианным значением для конкретного признака в наборе данных. Также можно обучить модель предсказывать отсутствующие значения одних признаков по значениям других.
Глубокое обучение на Python. 2-е межд. издание
·
Франсуа Шолле