Искусственный интеллект определяет национальность человека по почерку

Группа азиатских ученых разработала компьютерную программу, способную определять национальность человека по его почерку. Исследователи создали систему, которая распознает рукописный текст на английском языке и по характерным особенностям начертания букв с высокой долей вероятности выявляет среди авторов письма жителей Бангладеш, Индии, Ирана, Китая и Малайзии.

Принцип работы интеллектуальной платформы Cloud of Line Distribution (COLD) основан на технологии компьютерного зрения, автоматического распознавания текста и его анализа при помощи системы глубокого машинного обучения. Программа разбивает рукописные строки на отдельные литеры, после чего оценивает начертание каждой буквы и находит закономерности в написании отдельных слов. Для обучения искусственного интеллекта в систему загрузили 100 рукописных текстов на английском языке, написанных жителями Бангладеш, Индии, Ирана, Китая и Малайзии. На основе этих данных программа сумела выявить особенности почерка, характерные для представителей разных стран.

Оказалось, что китайцы используют на письме больше прямых линий и редко соединяют буквы между собой, а почерк у людей этой национальности практически не имеет наклона. Жители Индии и Бангладеш в силу особенностей родного алфавита применяют больше изогнутых линий, а иранцы оставляют между буквами и словами минимальные промежутки. Систематизация этих данных искусственным интеллектом позволила создать своеобразные шаблоны, которые используются в качестве эталонного примера при анализе новых рукописных текстов.

Разработчики программы COLD указывают на возможность практического применения алгоритма в криминалистике. Сейчас при расследовании преступлений специалисты нередко прибегают к помощи графологов, которые способны определить по почерку человека его пол, возраст, социальное положение и психологическое состояние. Долгое время ученые из разных стран пытаются автоматизировать данный процесс.

Разработки в области машинного распознавания рукописных текстов ведутся не одно десятилетие. В мае 2018 года итальянские ученые представили программу In Codice Ratio («Код системы»), созданную специально для расшифровки рукописных документов из архивов Ватикана. Искусственный интеллект анализирует начертание символов и подбирает наиболее вероятные соответствия для букв и слогов, после чего сохраняет тексты в электронном виде. В тестовых испытаниях разработчикам программы удалось добиться верной расшифровки 96% загруженных текстов.