Способы нормализации переменных

Необходимость нормализации выборок данных обусловлена самой природой используемых переменных нейросетевых моделей. Будучи разными по физическому смыслу, они зачастую могут сильно различаться между собой по абсолютным величинам. Так, например, выборка может содержать и концентрацию, измеряемую в десятых или сотых долях процентов, и давление в сотнях тысяч паскаль. Нормализация данных позволяет привести все используемые числовые значения переменных к одинаковой области их изменения, благодаря чему появляется возможность свести их вместе в одной нейросетевой модели.

Чтобы выполнить нормализацию данных, нужно точно знать пределы изменения значений соответствующих переменных (минимальное и максимальное теоретически возможные значения). Тогда им и будут соответствовать границы интервала нормализации. Когда точно установить пределы изменения переменных невозможно, они задаются с учетом минимальных и максимальных значений в имеющейся выборке данных.

Наиболее распространенный способ нормализации входных и выходных переменных – линейная нормализация.

Линейная нормализация

Примем следующие обозначения:

– xik, yjki-е входное и j-е выходное значения k-го примера исходной выборки в традиционных единицах измерения, принятых в решаемой задаче;

– Способы нормализации переменных – соответствующие им нормализованные входное и выходное значения;

– N – количество примеров обучающей выборки.

Тогда переход от традиционных единиц измерения к нормализованным и обратно с использованием метода линейной нормализации осуществляется с использованием следующих расчетных соотношений:

– при нормализации и денормализации в пределах [0, 1]:

Способы нормализации переменных;                                                  (1)

Способы нормализации переменных;                                 (2)

 

– при нормализации и денормализации в пределах [–1, 1]:

Способы нормализации переменных;

Способы нормализации переменных,

 

где

Способы нормализации переменных;

Способы нормализации переменных.

Если обучающая выборка не содержит примеров с потенциально возможными меньшими или большими выходными значениями, можно задаться шириной коридора экстраполяции Способы нормализации переменных для левой, правой или обеих границ в долях от длины всего первоначального интервала изменения переменной, обычно не более 10 % от нее. В этом случае происходит переход от фактических границ из обучающей выборки к гипотетическим:

 

Способы нормализации переменных.

 

Нелинейная нормализация

Один из способов нелинейной нормализации – с использованием сигмоидной логистической функции или гиперболического тангенса. Переход от традиционных единиц измерения к нормализованным и обратно в данном случае осуществляется следующим образом:

– при нормализации и денормализации в пределах [0, 1]:

Способы нормализации переменных;

Способы нормализации переменных,

где xc i, yc j – центры нормализуемых интервалов изменения входной и выходной переменных:

Способы нормализации переменных;

– при нормализации и денормализации в пределах [–1, 1]:

Способы нормализации переменных;

Способы нормализации переменных.

Параметр aвлияет на степень нелинейности изменения переменной в нормализуемом интервале. Кроме того, при использовании значений a < 0,5 нет необходимости дополнительно задаваться шириной коридора экстраполяции.

Рассмотрим в сравнении методы линейной и нелинейной нормализации. На рис. 1 приведены графики нормализации входной переменной для пределов [–1; 1]. Для нелинейной нормализации с использованием функции гиперболического тангенса принято значение параметра a = 1,0. Следует отметить, что совпадение нормализованного значения в обоих случаях имеет место лишь в точке, соответствующей центру нормализуемого интервала.

Способы нормализации переменных

Рис. 1. Сравнение линейной и нелинейной функций нормализации

Способы нормализации переменных

Рис. 2. Влияние параметра на график функции нелинейной нормализации

 

На рис. 2 показаны случаи нелинейной нормализации в пределах [0; 1] с использованием функции гиперболического тангенса с параметрами a, равными, соответственно, 0,3, 0,5, 1,0. Очевидно, что чем меньше значение параметра a, тем более полого выглядит нормализованная зависимость и больше ширина коридора экстраполяции.

 


искусственные нейронные сети
Гость, оставишь комментарий?
Имя:*
E-Mail:


 
Свежее новое
  • Робот поможет в ремонте вашего автомобиля
  • Когда Джейми Людольф столкнулся с непростым автомобильным ремонтом, он обратился к сервисный центр, но сегодня в автосалоне в Атланте, он может
  • Компания HUAWEI стремится захватить трон компаний из Силиконовой долины в сфере производства чипов для нужд AI
  • Китайский технологический гигант Huawei успешно реализует свою стратегию по захвату рынка производства чипов, который принадлежит представителям
  • Ежегодный форум по системам искусственного интеллекта RAIF 2018 состоится 23 октября 2018 в конгресс-парке «Рэдиссон Ройал Москва»
  • 23 октября в конгресс-парке «Рэдиссон Ройал Москва» состоится второй ежегодный форум по системам искусственного интеллекта — RAIF 2018 (The Russian
  • Сильный Искусственный Интеллект «Smart-MES» как основа Технологической Сингулярности России
  • Технологическая Сингулярность (ТС), т.е. взрывное развитие технического прогресса, а значит и взрывное развитие экономики России, предполагает в
  • На лососевых фермах внедряют систему распознаванию рыб, по аналогии с лицами людей
  • Норвежские рыбные фермы, которые разводят лосося, приступили к использованию технологий искусственного интеллекта для сканирования рыбы. Основной
Последние комментарии
Сильный Искусственный Интеллект «Smart-MES» как основа Технологической Сингулярности России
У нас очень странный народ, если что не понимает, то обязательно надо сунуть в морду. Зачем? А не лучше ли поинтересоваться, почему именно так? У
Сильный Искусственный Интеллект «Smart-MES» как основа Технологической Сингулярности России
Господин Чернов. Поясню. Любой инструмент, даже прозаическая кофемолка, проходят процедуру стендовых испытаний. Сертификат соответствия
Сильный Искусственный Интеллект «Smart-MES» как основа Технологической Сингулярности России
     " И странная картина получается в коридорах власти ". Странная картина  получается, если полагать, что власть эта поставлена для решения задач
Как работает Любовь? Квантовая связь нейронной активности Людей
Спасибо за статью, но удивило, что ни в статье, ни в перечне литературы не упоминаются исследования и четкие выводы о структуре воды как
Искусственный интеллект против команды профессиональных геймеров в DOTA 2. Кто победит?
Офигенно, крутая инаф.
Мы в социальных сетях
Статистика
0  
Всего статей 1525
3  
Всего комментариев 62
0  
Пользователей 51