Способы нормализации переменных

Необходимость нормализации выборок данных обусловлена самой природой используемых переменных нейросетевых моделей. Будучи разными по физическому смыслу, они зачастую могут сильно различаться между собой по абсолютным величинам. Так, например, выборка может содержать и концентрацию, измеряемую в десятых или сотых долях процентов, и давление в сотнях тысяч паскаль. Нормализация данных позволяет привести все используемые числовые значения переменных к одинаковой области их изменения, благодаря чему появляется возможность свести их вместе в одной нейросетевой модели.

Чтобы выполнить нормализацию данных, нужно точно знать пределы изменения значений соответствующих переменных (минимальное и максимальное теоретически возможные значения). Тогда им и будут соответствовать границы интервала нормализации. Когда точно установить пределы изменения переменных невозможно, они задаются с учетом минимальных и максимальных значений в имеющейся выборке данных.

Наиболее распространенный способ нормализации входных и выходных переменных – линейная нормализация.

Линейная нормализация

Примем следующие обозначения:

– xikyjk – i-е входное и j-е выходное значения k-го примера исходной выборки в традиционных единицах измерения, принятых в решаемой задаче;

– Способы нормализации переменных – соответствующие им нормализованные входное и выходное значения;

– N – количество примеров обучающей выборки.

Тогда переход от традиционных единиц измерения к нормализованным и обратно с использованием метода линейной нормализации осуществляется с использованием следующих расчетных соотношений:

– при нормализации и денормализации в пределах [0, 1]:

Способы нормализации переменных;                                                  (1)

Способы нормализации переменных;                                 (2)

 

– при нормализации и денормализации в пределах [–1, 1]:

Способы нормализации переменных;

Способы нормализации переменных,

 

где

Способы нормализации переменных;

Способы нормализации переменных.

Если обучающая выборка не содержит примеров с потенциально возможными меньшими или большими выходными значениями, можно задаться шириной коридора экстраполяции Способы нормализации переменных для левой, правой или обеих границ в долях от длины всего первоначального интервала изменения переменной, обычно не более 10 % от нее. В этом случае происходит переход от фактических границ из обучающей выборки к гипотетическим:

 


Способы нормализации переменных.

 

Нелинейная нормализация

Один из способов нелинейной нормализации – с использованием сигмоидной логистической функции или гиперболического тангенса. Переход от традиционных единиц измерения к нормализованным и обратно в данном случае осуществляется следующим образом:

– при нормализации и денормализации в пределах [0, 1]:

Способы нормализации переменных;

Способы нормализации переменных,

где xc i, yc j – центры нормализуемых интервалов изменения входной и выходной переменных:

Способы нормализации переменных;

– при нормализации и денормализации в пределах [–1, 1]:

Способы нормализации переменных;

Способы нормализации переменных.

Параметр aвлияет на степень нелинейности изменения переменной в нормализуемом интервале. Кроме того, при использовании значений a < 0,5 нет необходимости дополнительно задаваться шириной коридора экстраполяции.

Рассмотрим в сравнении методы линейной и нелинейной нормализации. На рис. 1 приведены графики нормализации входной переменной для пределов [–1; 1]. Для нелинейной нормализации с использованием функции гиперболического тангенса принято значение параметра a = 1,0. Следует отметить, что совпадение нормализованного значения в обоих случаях имеет место лишь в точке, соответствующей центру нормализуемого интервала.

Способы нормализации переменных

Рис. 1. Сравнение линейной и нелинейной функций нормализации

Способы нормализации переменных

Рис. 2. Влияние параметра на график функции нелинейной нормализации

 

На рис. 2 показаны случаи нелинейной нормализации в пределах [0; 1] с использованием функции гиперболического тангенса с параметрами a, равными, соответственно, 0,3, 0,5, 1,0. Очевидно, что чем меньше значение параметра a, тем более полого выглядит нормализованная зависимость и больше ширина коридора экстраполяции.

 


искусственные нейронные сети
Если у вас есть статья, заметка или обзор, которыми вы хотите поделиться с аудиторией нашего сайта, присылайте информацию на: neuronus.com@yandex.ru.
Гость, оставишь комментарий?
Имя:*
E-Mail:


Свежее новое
  • Почему в городских жилищах больше грибков, чем в деревенских домах
  • Сегодня в городах по всему миру живет уже больше людей, чем в сельской местности. Казалось бы, в этих условиях чистоту поддерживать проще. Но
  • Ученые доказали, что комнатные растения никак не влияют на воздух в комнате
  • Давно существует убеждение, что комнатные растения являются хорошими очистителями воздуха. В светлое время дня они и впрямь занимаются фотосинтезом:
  • Японцы спустили на воду субмарину c литий-ионными аккумуляторами
  • Японские Силы самообороны в следующем году получат подлодки, оснащенные литий-ионными аккумуляторными батареями. Вторая субмарина класса Soryu уже
  • Эксперименты подтвердили: у «черных курильщиков» может быть жизнь
  • Жизнь на планете порой выбирает самые причудливые и сложные территории. Вот и «черные курильщики» со своей экстремальной средой, как решили ученые,
  • 11 тысяч ученых подтвердили обоснованность тревог по поводу изменения климата
  • Разговоры о грядущей климатической катастрофе не беспочвенны. Эти опасения подтвердили 11 тысяч ученых, подписавших солидную научную статью,
Последние комментарии
Новые приключения «Вояджера»: покинул ли он все-таки Солнечную систему?
Нeдaвнo нaткнулcя на блoг чувака кoторый нaкaчал тeлo домa с помощью поясa миоcтимулятoрa, в нaчалe нe пoвeрили, но рeшили с жeной попробовать. Чeрeз
Новые российские корабли проекта 22800 спустили на воду в Крыму
Нeдaвнo нaткнулcя на блoг чувака кoторый нaкaчал тeлo домa с помощью поясa миоcтимулятoрa, в нaчалe нe пoвeрили, но рeшили с жeной попробовать. Чeрeз
Будет ли человек в старости в здравом уме, можно понять в 8-летнем возрасте
Нeдaвнo нaткнулcя на блoг чувака кoторый нaкaчал тeлo домa с помощью поясa миоcтимулятoрa, в нaчалe нe пoвeрили, но рeшили с жeной попробовать. Чeрeз
Ученые обнаружили факторы, которые могут предсказать успех человека
Нeдaвнo нaткнулcя на блoг чувака кoторый нaкaчал тeлo домa с помощью поясa миоcтимулятoрa, в нaчалe нe пoвeрили, но рeшили с жeной попробовать. Чeрeз
О новой российской уникальной субмарине «с крыльями» рассказали в формате инфографики
Народ я нарыл способ как без физ. нагрузок и диет сжигать калории и подкачаться дома. Пока опробовал только живот, за две недели убрал пивное пузо и
Мы в социальных сетях
Статистика
1  
Всего статей 2241
1  
Всего комментариев 557
1  
Пользователей 156