Сотрудники Массачусетского технологического института, в котором работает лаборатория по созданию и развитию искусственных интеллектов, разработали алгоритм, на основании которого ИИ сможет применять шаблоны человеческих взаимоотношений. Благодаря этому программа может прогнозировать дальнейшее развитие событий в той или иной ситуации.
В процессе разработок учёные загружали в приложение различные видео с примерами, показывающими, как люди взаимодействуют между собой в повседневной жизни. При этом ИИ постоянно проходил тестирование, по результатам которого учёные могли видеть, насколько хорошо он обучился, чтобы прогнозировать поведение людей.
За всё время программа изучила около 600 часов видеороликов со всемирно известного видеохостинга YouTube, ТВ фильмов и сериалов. Видео подбирали с учётом доступности материала и реализма. Специалисты заявляют, что основной целью при выборе материала были случайные видеоролики. Использование телесериалов и кинофильмов объясняется тем, что данные источники позволяют быстро и легко собрать материалы с отличной реалистичностью. К тому же на таких видео обычно хорошо описывают ситуации, возникающие в настоящей жизни у всех людей.
В основном исследователи загружали в программу моменты перед выполнением какого-либо действия: поцелуй, объятия, приветствие, пожатие руки и др. по результатам проведённых тестов, точность прогнозирования таких действий реальными людьми составляет 71%, а программой с искусственным интеллектом – около 43%.
Сотрудники Массачусетского института утверждают, что как только ИИ сможет точно понимать наиболее распространённые визуальные действия людей в повседневной жизни, это позволит им начать создание своего рода домашних помощников, работа которых будет очень эффективной. Также это даст возможность использовать программу с искусственным интеллектом в современных системах безопасности и видеонаблюдения, которые смогут моментально вызывать представителей скорой помощи, полиции или МЧС в критических ситуациях.
Отметим, что данная попытка создания ИИ, который сможет прогнозировать поведение людей, при помощи видео далеко не первая. Но сейчас полученные результаты оказались намного точнее. Главной причиной успеха является алгоритм, который акцентирует внимание программы на высокоточном пиксельном представлении.