Способы нормализации переменных

Необходимость нормализации выборок данных обусловлена самой природой используемых переменных нейросетевых моделей. Будучи разными по физическому смыслу, они зачастую могут сильно различаться между собой по абсолютным величинам. Так, например, выборка может содержать и концентрацию, измеряемую в десятых или сотых долях процентов, и давление в сотнях тысяч паскаль. Нормализация данных позволяет привести все используемые числовые значения переменных к одинаковой области их изменения, благодаря чему появляется возможность свести их вместе в одной нейросетевой модели.

Чтобы выполнить нормализацию данных, нужно точно знать пределы изменения значений соответствующих переменных (минимальное и максимальное теоретически возможные значения). Тогда им и будут соответствовать границы интервала нормализации. Когда точно установить пределы изменения переменных невозможно, они задаются с учетом минимальных и максимальных значений в имеющейся выборке данных.

Наиболее распространенный способ нормализации входных и выходных переменных – линейная нормализация.

Линейная нормализация

Примем следующие обозначения:

– xikyjk – i-е входное и j-е выходное значения k-го примера исходной выборки в традиционных единицах измерения, принятых в решаемой задаче;

– Способы нормализации переменных – соответствующие им нормализованные входное и выходное значения;

– N – количество примеров обучающей выборки.

Тогда переход от традиционных единиц измерения к нормализованным и обратно с использованием метода линейной нормализации осуществляется с использованием следующих расчетных соотношений:

– при нормализации и денормализации в пределах [0, 1]:

Способы нормализации переменных;                                                  (1)

Способы нормализации переменных;                                 (2)

 

– при нормализации и денормализации в пределах [–1, 1]:

Способы нормализации переменных;

Способы нормализации переменных,

 

где

Способы нормализации переменных;

Способы нормализации переменных.

Если обучающая выборка не содержит примеров с потенциально возможными меньшими или большими выходными значениями, можно задаться шириной коридора экстраполяции Способы нормализации переменных для левой, правой или обеих границ в долях от длины всего первоначального интервала изменения переменной, обычно не более 10 % от нее. В этом случае происходит переход от фактических границ из обучающей выборки к гипотетическим:

 


Способы нормализации переменных.

 

Нелинейная нормализация

Один из способов нелинейной нормализации – с использованием сигмоидной логистической функции или гиперболического тангенса. Переход от традиционных единиц измерения к нормализованным и обратно в данном случае осуществляется следующим образом:

– при нормализации и денормализации в пределах [0, 1]:

Способы нормализации переменных;

Способы нормализации переменных,

где xc i, yc j – центры нормализуемых интервалов изменения входной и выходной переменных:

Способы нормализации переменных;

– при нормализации и денормализации в пределах [–1, 1]:

Способы нормализации переменных;

Способы нормализации переменных.

Параметр aвлияет на степень нелинейности изменения переменной в нормализуемом интервале. Кроме того, при использовании значений a < 0,5 нет необходимости дополнительно задаваться шириной коридора экстраполяции.

Рассмотрим в сравнении методы линейной и нелинейной нормализации. На рис. 1 приведены графики нормализации входной переменной для пределов [–1; 1]. Для нелинейной нормализации с использованием функции гиперболического тангенса принято значение параметра a = 1,0. Следует отметить, что совпадение нормализованного значения в обоих случаях имеет место лишь в точке, соответствующей центру нормализуемого интервала.

Способы нормализации переменных

Рис. 1. Сравнение линейной и нелинейной функций нормализации

Способы нормализации переменных

Рис. 2. Влияние параметра на график функции нелинейной нормализации

 

На рис. 2 показаны случаи нелинейной нормализации в пределах [0; 1] с использованием функции гиперболического тангенса с параметрами a, равными, соответственно, 0,3, 0,5, 1,0. Очевидно, что чем меньше значение параметра a, тем более полого выглядит нормализованная зависимость и больше ширина коридора экстраполяции.

 

Похожие материалы по теме


искусственные нейронные сети
Гость, оставишь комментарий?
Имя:*
E-Mail:


 
Свежее новое
  • Искусственный интеллект смог визуализировать 2D изображения.
  • Ученые из Вашингтона разработали модель, которая способна воссоздавать движения человека на фотографиях и картинах. Она создает для него 3D модель и
  • Искусственный интеллект, робот Вера, получил 226 млн рублей
  • ФРИИ и Кировский завод вкладывают 226 миллионов рублей в представителя «Сколкова» — компанию «Стафори», создавшую робота-рекрутера. Искусственный
  • В Москве состоялся финал PicsArt AI Hackathon, с самым крупным призовым фондом в истории
  • 30 ноября-2 декабря, в Москве прошел крупнейший хакатон в сфере искусственного интеллекта и компьютерного зрения - PicsArt AI Days. На хакатон было
  • В следующем году в Москве, заработает видеоконтроль, способный обнаружить преступников
  • Как рассказал в своем сообщении Сергей Собянин, новая система будет способна анализировать записи с видеокамер. Быстрая обработка данных позволит
  • В Москве пройдет один из крупнейших хакатонов в мире в сфере искусственного интеллекта
  • PicsArt, ведущая творческая платформа для создания контента и визуализации историй в социальных сетях с более чем 100 миллионами активных
Последние комментарии
Каким был первый робот в мире? Происхождение слова "Робот"
Восхищения нет предела делу ваших рук и идей. Хочется склонить голову перед вашим трудом, хотя твердо придерживаюсь Библии (не поклоняться идолам)
Как работает Любовь? Квантовая связь нейронной активности Людей
Я думаю, когда начнется квантовое взаимодействие мржду человеком и ИИ это и будет началом конца.
Как работает Любовь? Квантовая связь нейронной активности Людей
Как вы считаете, возможно ли образование квантовых взаимодействий между человеком и ИИ? 
Сильный Искусственный Интеллект «Smart-MES» как основа Технологической Сингулярности России
А почему бы сразу СИИ не запустить в другую галактику, может там нет коррупции, воровства, плебейства и прочей муры, которая не только мешает
Искусственный Интеллект. Концепция развития и внедрения Искусственного Интеллекта (Искусственной Аналитики)
Согласен. проблема ИИ не в наборе задач. Главная проблема - познание процесса мышления как феномена физиологии головного мозга человека.
Мы в социальных сетях
Статистика
0  
Всего статей 1538
0  
Всего комментариев 74
0  
Пользователей 64