Хотя полнота на k измеряет, сколько релевантных элементов модели не удалось включить в выходной список, эта метрика не всегда хороша. Разберемся, с чем это связано. В некоторых системах (например, поисковых) может быть очень много релевантных элементов. Это отрицательно отражается на полноте, потому что знаменатель будет очень большим. Например, в нашем примере, где на исходном изображении представлена собака, в базе данных могут быть миллионы разных картинок с собаками. Цель заключается не в том, чтобы найти все изображения собак, а в том, чтобы получить небольшую подборку самых похожих изображений собак
Схема состоит из семи основных шагов.
1. Прояснение требований
2. Формулировка проблемы как задачи МО
3. Подготовка данных
4. Разработка модели
5. Оценка
6. Развертывание и эксплуатация
7. Мониторинг и инфраструктура
Многие технические специалисты полагают, что системы МО исчерпываются такими алгоритмами МО, как логистическая регрессия или нейронные сети. Тем не менее реальные системы МО далеко не ограничиваются разработкой моделей. Эти системы обычно весьма сложны; они состоят из множества компонентов, включая стеки данных, служебную инфраструктуру (благодаря которой система становится доступной миллионам пользователей), пайплайн для оценки ее эффективности, а также средства мониторинга, которые следят за тем, чтобы качество модели не ухудшалось со временем.
В принципе, цель собеседования состоит в том, чтобы оценить, насколько хорошо соискатель применяет теоретические знания МО, чтобы проектировать и реализовывать эффективные системы.