Ученые разработали визуальный тест Тьюринга, в котором компьютеры будут отвечать на все более сложные вопросы, анализируя изображение.
Компьютеры с каждым годом все лучше и лучше справляются с задачами из области искусственного интеллекта, особенно это касается компьютерного зрения — идентификации лица или изображения, содержащее определенный объект.
На самом деле, прогресс был настолько значительным, что некоторые ученые теперь считают, что стандартные тесты, используемые для оценки программ искусственного интеллекта, слишком легко пройти, и нужно разработать более сложные.
Речь идет об «общедоступных наборах данных», обычно используемыми исследователями компьютерного зрения в качестве эталона для оценки результатов, такие как LabelMe из MIT или Labeled Faces in the Wild из Массачусетского Университета.
Ранее предлагались фотографии, которые были помечены с помощью краудсорсинга, так что на фото улицы были отмечены машина, дерево и пешеход. Программы компьютерного зрения успешно справлялись с этой задачей и находили объекты, используя методы машинного обучения такие как сверточные нейронные сети, называемые Deep Learning.
Ученые, занимающиеся данной проблемой, говорят, что называть предметы на фотографии стало слишком просто, и в этом нет особой необходимости, то, что компьютеру действительно нужно — это понять , что происходит на картинке.
Так, при поддержке Стюарта Джимена из DARPA, профессора прикладной математики из университета Брауна, был разработан метод для стандартного теста, который мог бы оценить точность программ компьютерного зрения нового поколения.
Исследование было опубликовано на этой неделе в Proceedings of the National Academy of Sciences, соавторами Джимена были ученые из Университета Джона Хопкинса, штат Мэриленд, а также его брат Дональд Джимен, наряду с Нилом Халлонкистом и Лоран Юнес.
Предложенный ими способ требует разработать некий перечень отдельных атрибутов, которые могут быть изображены на картинке, например, если мы говорим об улице, могут ли там находиться люди, могут ли они что-то нести или общаться друг с другом. Сначала фотографии обрабатываются людьми, а затем компьютерными программами, чтобы определить, нашла ли она те атрибуты, которые заметили люди.
Изначально, вопросы были элементарными, например, спрашивалось, есть ли изображение человека на картинке в определенном месте. Но вопросы будут все более сложными по мере того, как программы станут более умными. Например, вопрос может затрагивать характер взаимоотношений между разными людьми на фото.
Пример изображения и вопросов, предложенных группой ученых, для визуального теста Тьюринга
Номер | Вопрос | Ответ |
1 | Есть ли человек в голубой рамке? | Да |
2 | Человек в голубой рамке один? (Отметим, что это человек 1) | Да |
3 | Человек 1 что-то несет? | Да |
4 | Человек 1 - это женщина? | Да |
5 | Человек 1 идет по тротуару? | Да |
6 | Человек 1 взаимодействует с каким-нибудь другим объектом? | Нет |
... | ... | ... |
9 | Транспортное средство одно в желтой рамке? (Отметим, что это транспортное средство 1) | Да |
10 | Транспортное средство 1 светлого цвета? | Да |
11 | Транспортное средство 1 движется? | Нет |
12 | Транспортное средство 1 припарковано и это машина? | Да |
... | ||
14 | У транспортного средства 1 видна одна покрышка? | Нет |
15 | Транспортное средство 1 взаимодействует с каким-нибудь другим объектом? | Нет |
17 | Человек один в красной рамке? | Нет |
18 | Человек в красной рамке — это женщина? | Нет |
19 | Есть ли в красной рамке человек, который стоит? | Да |
20 | Один человек стоит в красной рамке? (Отметим, что это человек 2) | Да |
... | ... | ... |
23 | Человек 2 взаимодействует с каким-нибудь другим объектом? | Да |
24 | Человек 1 выше человека 2? | Неопр. |
25 | Человек 1 ближе (к камере) человека 2? | Нет |
26 | Есть человек в красной рамке? | Да |
27 | Человек один в красной рамке? (Отметим, что это человек 3) | Да |
... | ... | ... |
36 | Есть ли взаимодействие между человеком 2 и человеком 3? | Да |
37 | Человек 2 и человек 3 разговаривают? | Да |
В конце концов, разработчики теста могли бы оценить уровень здравого смысла и понимание процессов компьютерными программами, задав, например вопрос: «Что произойдет с человеком на переднем плане картинки, на которого вот-вот упадет рояль»?
Джимен говорит, что одним из преимуществ предлагаемого подхода является то, что иерархия информации, разработанная для картинки станет все более сложной. Она могла бы послужить основой для простых автоматических тестов.
Из-за ограничения наборов данных, исследователи компьютерного зрения создавали системы, которые могли определить, есть ли на фотографии кошка или нет. «Пришло время поднять планку», — говорит он.
Джимен признал, что в настоящее время ни одна из программ не смогла бы пройти предложенного испытания и ответить даже на рудиментарные вопросы. Но являются ли методы DeepLearning достаточно эффективными, чтобы в один прекрасный день компьютерные программы смогли научиться обрабатывать более сложные контексты? Судит пока рано.
На недавно прошедшей конференции в Остине, штат Техас, ученые пытались придумать замену для хорошо известного теста Тьюринга. Они планируют продолжить это обсуждение в июле в Буэнос Айресе на Международной конференции по искусственному интеллекту.
Гарри Маркус, ученый из Университета Нью-Йорка, говорит, что пока ни один тест на может определить уровень интеллекта, подход Джимена является «шагом в правильном направлении» в области, где нужны новые решения, которые приведут к более сложным системам.
Источник:IEEE Spectrum
[add_ratings]
Это конечно интересно...Но приживется ли все оно? Да и много ли камер в том числе и уличных которые могут хорошо разглядеть детали...
В робототехнике с увеличением мощностей и усовершенствования алгоритмов оно конечно рано или поздно будет... Но вот будет ли способна уличная камера распознать ограбление, удар ножом или выстрел...ну или другие преступления...
Пока ученые предлагают тест для оценки «умности» программ. Сами программы еще нужно будет написать.
Все начинается с задания критериев. Пока не будет четкого определения что же такое «Искусственный интеллект», то и задача по его созданию не будет решена. На сегодняшний день задача четко не определена... Возможно ли вообще создание искусственного интеллекта — вопрос пока риторический. Роботов-то, по-большому счету, тоже пока нет. Есть, условно говоря, «хорошо автоматизированные стиральные машинки и пылесосы». Вот робот-пылесос — это робот или пылесос? То, что вкладывается в понятие «робот» изменяется с развитием технологий. Современная стиральная машинка-автомат перенесенная в середину 20 века и уж, тем более, в начало 19 века будет супер умным роботом, а то и шайтан-машиной. В моем представлении робот-пылесос — это современный пылесос. А приставка робот — это маркетинговый ход. Я уже не говорю про то, что называется «боевыми роботами» — это вообще машины и механизмы с телеуправлением. До полной автономности, самостоятельного принятия решений в условиях неопределенности и уже тем более до самоосознания еще очень и очень далеко.
Мы находимся пока в начале пути неизвестно куда. Создание тестов, подобных тесту Тьюринга является попыткой формализации задачи создания «Искусственного интеллекта».