Искусственный интеллект научился распознавать речь человека в толпе

Искусственный интеллект научился распознавать речь человека в толпе

Компания Google представила уникальную разработку, позволяющую на расстоянии идентифицировать говорящего человека и распознавать его речь. Программа успешно прошла тестирование и показала высокую эффективность вычленения отдельных человеческих реплик при наличии в помещении посторонних шумов и звуков. Система способна дистанционно снимать данные с указанной персоны в ситуациях, когда в разговоре участвует сразу несколько собеседников.

В программе используется идентификация голоса по лицу и мимике говорящего на основе нейронной сети. Искусственный интеллект анализирует звуковую информацию и сопоставляет ее с изображением, которое захватывает видеокамера. При нахождении соответствий алгоритм связывает речь человека с конкретным образом и создает для персоны отдельный акустический профиль. После этого включается режим взаимного дополнения аудио- и видеоинформации. Такой подход позволяет распознавать реплики, если рот человека на какое-то время будет прикрыт рукой или посторонним предметом. Если же все лицо находится в поле зрения камеры, успешно распознаваться могут и реплики, произнесенные шепотом.

Для достижения эффективной работы системы изобретателям пришлось обучить искусственный интеллект отличать мимику, характерную для обычного разговора, от движений лица поющих или смеющихся людей. А вычленение уникальных акустических профилей позволило добиться результата при распознавании реплик конкретного человека, говорящего или поющего в унисон с другими.

Инженеры из компании Google уверены, что их разработка найдет применение в разных сферах. Умение определять говорящего в толпе может использоваться для создания или модернизации современных систем безопасности в местах большого скопления людей. Очищенный от посторонних шумов голос собеседника может передаваться на слуховой аппарат слабослышащих людей, что облегчит для них процесс коммуникации. Широкое применение технология найдет и в совершенствовании собственных сервисов Google. Программа будет активно использоваться для улучшения систем голосового управления, защиты персональных данных и для расширения возможностей видеочатов, включая групповые конференции.


Гость, оставишь комментарий?
Имя:*
E-Mail:


 
Свежее новое
  • В Москве пройдет один из крупнейших хакатонов в мире в сфере искусственного интеллекта
  • PicsArt, ведущая творческая платформа для создания контента и визуализации историй в социальных сетях с более чем 100 миллионами активных
  • Сильный Искусственный Интеллект «Smart-MES» меняет взгляды на Технологическую Сингулярность
  • Учёные полагают, что Технологическая Сингулярность наступит тогда, когда Сильный Искусственный Интеллект будет способен самостоятельно создавать себе
  • Навыки голосовых помощников от Amazon, Google, Microsoft и Яндекс
  • После лекции директора по маркетингу умного помощника Алисы, Даниилы Колесникова, меня посетило вдохновение и любопытство. Так как мы сами сейчас
  • Конкурс идей от лаборатории Касперского - Kaspersky Start Russia
  • Если ты инициативный лидер, у тебя есть знания в области IT и тебе хотелось бы возглавить собственный проект в лаборатории Касперского, то подай
  • Смарт-города, умный транспорт и инновации для ЖКХ: что обсуждали на конференции «Интернет вещей»
  • Интернет вещей для промышленности, транспорта, ЖКХ и торговли: в Москве обсудили развитие и внедрение технологии. Конференция «Интернет вещей»,
Последние комментарии
5 лучших приложений искусственного интеллекта для вашего телефона Android
какой это искусственный разум мне смешно не пудрите людям мозги ,голосовой поисковик- это интелект ха ха ну вы тут и загибаете фантастику
5 лучших приложений искусственного интеллекта для вашего телефона Android
Всё вышеперечисленное назвать интеллектом можно с большущей натяжкой. Так, программки-автоматы с почти хорошим распознаванием несложной речи.
Сильный Искусственный Интеллект «Smart-MES» как основа Технологической Сингулярности России
У нас очень странный народ, если что не понимает, то обязательно надо сунуть в морду. Зачем? А не лучше ли поинтересоваться, почему именно так? У
Сильный Искусственный Интеллект «Smart-MES» как основа Технологической Сингулярности России
Господин Чернов. Поясню. Любой инструмент, даже прозаическая кофемолка, проходят процедуру стендовых испытаний. Сертификат соответствия
Сильный Искусственный Интеллект «Smart-MES» как основа Технологической Сингулярности России
     " И странная картина получается в коридорах власти ". Странная картина  получается, если полагать, что власть эта поставлена для решения задач
Мы в социальных сетях
Статистика
0  
Всего статей 1533
1  
Всего комментариев 65
0  
Пользователей 56