автордың кітабынан сөз тіркестері Как учится машина. Революция в области нейронных сетей и глубокого обучения
Все происходящее напомнило мне старый анекдот: «Конечно, это хорошо работает на практике. Но работает ли это в теории?»
3 Ұнайды
Моя интуиция подпитывается чтением книг. Я просто пожираю книги. Я исследую работы тех, кто был до меня. Вы никогда ничего не создадите в одиночку
2 Ұнайды
глубокое обучение — это неотъемлемая часть будущего искусственного интеллекта. Однако на сегодняшний день эти системы не способны к логическим рассуждениям. В то же время подходы к ИИ, основанные на логике, в нынешнем их состоянии несовместимы с обучением. Наша важнейшая задача на ближайшие годы — сделать эти два подхода совместимыми друг с другом.
2 Ұнайды
Идея состояла в том, чтобы предварительно обучить слои сверточной сети извлекать общие шаблоны без их привязки к конкретной задаче. В результате этого слой сети создает представление, из которого можно восстановить входные данные слоя. Эта технология называется «автоэнкодер», особенность ее заключается в минимизации количества включенных нейронов.
1 Ұнайды
В чем состоит деятельность исследователя? Откуда берутся его идеи? Что касается меня, то я уделяю много внимания интуитивным догадкам. Дальше наступает очередь математики. Я знаю, что другие ученые действуют диаметрально противоположным образом. Я проецирую в свою голову пограничные случаи, которые Эйнштейн называл «мысленными экспериментами», благодаря которым вы сначала представляете ситуацию, а затем пытаетесь рассмотреть ее следствия для лучшего понимания проблемы.
Моя интуиция подпитывается чтением книг. Я просто пожираю книги. Я исследую работы тех, кто был до меня. Вы никогда ничего не создадите в одиночку. Идеи живут, дремлют, и они возникают в чьей-то голове, потому что пришло время. Так рождаются исследования. Они продвигаются неравномерно, то прыжками, то шажками, а порой — даже пятясь. Но деятельность эта всегда коллективна. Образ одинокого исследователя, делающего в своей лаборатории мировое открытия, — не более, чем романтическая фантастика.
1 Ұнайды
содержит ли данная статья в Википедии ответ на конкретный вопрос? Рассказывают ли две статьи об одном и том же?
Для таких сравнений мы используем технологии, называемые «эмбеддингом» и «метрическим обучением». Эмбеддинг состоит в описании изображения, видео или текста вектором, который рассчитывается нейронной сетью. Сеть должна быть обучена таким образом, чтобы два вектора, описывающие одинаковый контент, находились близко друг к другу, а два вектора, представляющие разный контент, находились далеко друг от друга.
сообщество компьютерных специалистов добилось выдающихся успехов в обнаружении и локализации объектов. Самыми современными из них являются системы FAIR Mask R-CNN и RetinaNet, причем их код доступен для всех [71] (см. рис. 6.15 и 6.16).
Основываясь на идее скользящего окна, я использовал сверточные сети для обнаружения объектов на изображениях. Вот его принцип. Предположим, мы хотим обнаружить на фотографии лицо. Мы собираем много фотографий, на которых есть лица, и другие фотографии, на которых их нет. Затем вручную рисуем квадрат вокруг каждого лица. Компьютер регистрирует положение квадратов, извлекает миниатюры лиц, обозначенные квадратами, и стандартизирует их размер, скажем, до 32 × 32 пикселей. Он также собирает большое количество квадратов в произвольных положениях и размерах на изображениях, где нет лиц. Теперь у нас есть коллекция миниатюр с лицами и без. С помощью таких миниатюр мы обучаем сверточную сеть для получения +1 для миниатюр с лицами и 0 для остальных.
Вначале определяется архитектура соединений нейронной сети, то есть организация слоев нейронов и связей между нейронами. Но весов, то есть параметров взвешенных сумм, в ней нет. Они будут установлены путем обучения.
В сверточной сети обратное распространение градиента регулирует веса таким образом, чтобы нейроны в разных слоях определяли, что важно для распознавания входного изображения. Когда мы обучаем сверточную сеть распознавать объекты на естественных изображениях, некоторые нейроны в первом слое учатся обнаруживать контуры, ориентированные определенным образом, что очень похоже на то, что наши коллеги по нейробиологии наблюдают в зрительной коре головного мозга.
Обнаружение, локализация, сегментация и распознавание объектов
