Π’ΠΈΠ΄Ρ‹ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ. ЛинСйная функция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ

Ѐункция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ

Π‘ΠΈΠ³Π½Π°Π», ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ ΠΎΡ‚ сумматора, пСрСдаСтся Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ ΠΏΡ€ΠΈ вычислСнии этой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, являСтся Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹ΠΌ сигналом Π½Π΅ΠΉΡ€ΠΎΠ½Π° Y.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ссли ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡ΠΈΡ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ ΠΊΠ°ΠΊ F, Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал Y Π½Π΅ΠΉΡ€ΠΎΠ½Π° зависит ΠΎΡ‚ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΈ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° вСсовых коэффициСнтов ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

Y = F(X1*W1 + X2*W2 + … + Xn*Wn)

На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Ρ€Π°Π·Π½Ρ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰ΠΈΠ΅ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π°, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, линСйная, пороговая, сигмоидная ΠΈ Π΄Ρ€. Рассмотрим ΠΊΡ€Π°Ρ‚ΠΊΠΎ для ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠ· этих Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ. Π‘ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ»Π½ΠΎΠ΅ описаниС Π’Ρ‹ Π½Π°ΠΉΠ΄Π΅Ρ‚Π΅, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π²

ЛинСйная функция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ

Π“Ρ€Π°Ρ„ΠΈΠΊ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ ΠΏΠΎΠΊΠ°Π·Π°Π½ Π½Π° рис. 4-3. Как Π²ΠΈΠ΄ΠΈΡ‚Π΅, этот Π³Ρ€Π°Ρ„ΠΈΠΊ прСдставляСт собой ΠΏΡ€ΡΠΌΡƒΡŽ линию, ΡƒΠ³ΠΎΠ» Π½Π°ΠΊΠ»ΠΎΠ½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ зависит ΠΎΡ‚ константы k, Π° Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π° сдвига ΠΏΠΎ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ оси ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ - ΠΎΡ‚ константы t.

4.

5.

6. Для Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ нСйронная сСти Π±Ρ‹Π»Π° способна Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ ΠΏΠΎΡΡ‚Π°Π²Π»Π΅Π½Π½ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ, Π΅Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ (см. рис. 1). Π Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ обучСния с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ ΠΈ Π±Π΅Π· учитСля.
ΠŸΡ€ΠΎΡ†Π΅ΡΡ обучСния с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ прСдставляСт собой ΠΏΡ€Π΅Π΄ΡŠΡΠ²Π»Π΅Π½ΠΈΠ΅ сСти Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ². ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±Ρ€Π°Π·Π΅Ρ† подаСтся Π½Π° Π²Ρ…ΠΎΠ΄Ρ‹ сСти, Π·Π°Ρ‚Π΅ΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ Π²Π½ΡƒΡ‚Ρ€ΠΈ структуры НБ, вычисляСтся Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал сСти, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ сравниваСтся с ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ Π²Π΅ΠΊΡ‚ΠΎΡ€Π°, ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‰Π΅Π³ΠΎ собой Ρ‚Ρ€Π΅Π±ΡƒΠ΅ΠΌΡ‹ΠΉ Π²Ρ‹Ρ…ΠΎΠ΄ сСти. Π—Π°Ρ‚Π΅ΠΌ ΠΏΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌΡƒ ΠΏΡ€Π°Π²ΠΈΠ»Ρƒ вычисляСтся ошибка, ΠΈ происходит ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ вСсовых коэффициСнтов связСй Π²Π½ΡƒΡ‚Ρ€ΠΈ сСти Π² зависимости ΠΎΡ‚ Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°. Π’Π΅ΠΊΡ‚ΠΎΡ€Ρ‹ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ мноТСства ΠΏΡ€Π΅Π΄ΡŠΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡŽΡ‚ΡΡ ошибки ΠΈ вСса ΠΏΠΎΠ΄ΡΡ‚Ρ€Π°ΠΈΠ²Π°ΡŽΡ‚ΡΡ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° ошибка ΠΏΠΎ всСму ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΌΡƒ массиву Π½Π΅ достигнСт ΠΏΡ€ΠΈΠ΅ΠΌΠ»Π΅ΠΌΠΎ Π½ΠΈΠ·ΠΊΠΎΠ³ΠΎ уровня.

ΠŸΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ Π±Π΅Π· учитСля ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π΅ мноТСство состоит лишь ΠΈΠ· Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ². ΠžΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ подстраиваСт вСса сСти Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π»ΠΈΡΡŒ согласованныС Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π²Π΅ΠΊΡ‚ΠΎΡ€Ρ‹, Ρ‚.Π΅. Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€Π΅Π΄ΡŠΡΠ²Π»Π΅Π½ΠΈΠ΅ достаточно Π±Π»ΠΈΠ·ΠΊΠΈΡ… Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² Π΄Π°Π²Π°Π»ΠΎ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Π΅ Π²Ρ‹Ρ…ΠΎΠ΄Ρ‹. ΠŸΡ€ΠΎΡ†Π΅ΡΡ обучСния, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, выдСляСт статистичСскиС свойства ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ мноТСства ΠΈ Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΡƒΠ΅Ρ‚ сходныС Π²Π΅ΠΊΡ‚ΠΎΡ€Ρ‹ Π² классы. ΠŸΡ€Π΅Π΄ΡŠΡΠ²Π»Π΅Π½ΠΈΠ΅ Π½Π° Π²Ρ…ΠΎΠ΄ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° ΠΈΠ· Π΄Π°Π½Π½ΠΎΠ³ΠΎ класса даст ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΉ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ Π²Π΅ΠΊΡ‚ΠΎΡ€, Π½ΠΎ Π΄ΠΎ обучСния Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, ΠΊΠ°ΠΊΠΎΠΉ Π²Ρ‹Ρ…ΠΎΠ΄ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ Π΄Π°Π½Π½Ρ‹ΠΌ классом Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ². Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π²Ρ‹Ρ…ΠΎΠ΄Ρ‹ ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎΠΉ сСти Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Ρ‚Ρ€Π°Π½ΡΡ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΏΠΎΠ½ΡΡ‚Π½ΡƒΡŽ Ρ„ΠΎΡ€ΠΌΡƒ, ΠΎΠ±ΡƒΡΠ»ΠΎΠ²Π»Π΅Π½Π½ΡƒΡŽ процСссом обучСния. Π­Ρ‚ΠΎ Π½Π΅ являСтся ΡΠ΅Ρ€ΡŒΠ΅Π·Π½ΠΎΠΉ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ Π½Π΅ слоТно ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ связь ΠΌΠ΅ΠΆΠ΄Ρƒ Π²Ρ…ΠΎΠ΄ΠΎΠΌ ΠΈ Π²Ρ‹Ρ…ΠΎΠ΄ΠΎΠΌ, ΡƒΡΡ‚Π°Π½ΠΎΠ²Π»Π΅Π½Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒΡŽ.
Для обучСния Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй Π±Π΅Π· учитСля ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ ΡΠΈΠ³Π½Π°Π»ΡŒΠ½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ обучСния Π₯Π΅Π±Π±Π° ΠΈ Ойа.



ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΈ процСсс обучСния ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠΏΠΈΡΠ°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ. Π’ процСссС функционирования нСйронная ΡΠ΅Ρ‚ΡŒ Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΠ΅Ρ‚ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал Y, рСализуя Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Y = G(X). Если Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° сСти Π·Π°Π΄Π°Π½Π°, Ρ‚ΠΎ Π²ΠΈΠ΄ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ G опрСдСляСтся значСниями синаптичСских вСсов ΠΈ смСщСнной сСти.

ΠŸΡƒΡΡ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π·Π°Π΄Π°Ρ‡ΠΈ являСтся функция Y = F(X), заданная ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ…-Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… (X 1 , Y 1), (X 2 , Y 2), …, (X N , Y N), для ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Y k = F(X k) (k = 1, 2, …, N).

ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ состоит Π² поискС (синтСзС) Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ G, Π±Π»ΠΈΠ·ΠΊΠΎΠΉ ΠΊ F Π² смыслС Π½Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ошибки E. (см. рис. 1.8).

Если Π²Ρ‹Π±Ρ€Π°Π½ΠΎ мноТСство ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² – ΠΏΠ°Ρ€ (X N , Y N) (Π³Π΄Π΅ k = 1, 2, …, N) ΠΈ способ вычислСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ошибки E, Ρ‚ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти прСвращаСтся Π² Π·Π°Π΄Π°Ρ‡Ρƒ ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΉ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, ΠΈΠΌΠ΅ΡŽΡ‰ΡƒΡŽ ΠΎΡ‡Π΅Π½ΡŒ Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ, ΠΏΡ€ΠΈ этом, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ функция E ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½Ρ‹ΠΉ Π²ΠΈΠ΄ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π² ΠΎΠ±Ρ‰Π΅ΠΌ случаС – ΠΌΠ½ΠΎΠ³ΠΎΡΠΊΡΡ‚Ρ€Π΅ΠΌΠ°Π»ΡŒΠ½Π°Ρ нСвыпуклая Π·Π°Π΄Π°Ρ‡Π° ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ.

Для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ этой Π·Π°Π΄Π°Ρ‡ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ (ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅) Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹:

1. Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ локальной ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ с вычислСниСм частных ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ порядка:

Β· Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ (ΠΌΠ΅Ρ‚ΠΎΠ΄ Π½Π°ΠΈΡΠΊΠΎΡ€Π΅ΠΉΡˆΠ΅Π³ΠΎ спуска),

Β· ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ с ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΉ ΠΈ Π΄Π²ΡƒΠΌΠ΅Ρ€Π½ΠΎΠΉ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π² Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ Π°Π½Ρ‚ΠΈΠ³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°,

Β· ΠΌΠ΅Ρ‚ΠΎΠ΄ сопряТСнных Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ²,

Β· ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π°Π½Ρ‚ΠΈΠ³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π° Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΡˆΠ°Π³Π°Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°;

2. Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ локальной ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ с вычислСниСм частных ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ ΠΈ Π²Ρ‚ΠΎΡ€ΠΎΠ³ΠΎ порядка:

Β· ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΡŒΡŽΡ‚ΠΎΠ½Π°,

Β· ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ с Ρ€Π°Π·Ρ€Π΅ΠΆΠ΅Π½Π½Ρ‹ΠΌΠΈ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π°ΠΌΠΈ ГСссС,

Β· ΠΊΠ²Π°Π·ΠΈΠ½ΡŒΡŽΡ‚ΠΎΠ½ΠΎΠ²ΡΠΊΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹,

Β· ΠΌΠ΅Ρ‚ΠΎΠ΄ Гаусса-ΠΡŒΡŽΡ‚ΠΎΠ½Π°,

Β· ΠΌΠ΅Ρ‚ΠΎΠ΄ Π›Π΅Π²Π΅Π½Π±Π΅Ρ€Π³Π°-ΠœΠ°Ρ€ΠΊΠ²Π°Ρ€Π΄Ρ‚Π° ΠΈ Π΄Ρ€.;

3. стохастичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ:

Β· поиск Π² случайном Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ,

Β· имитация ΠΎΡ‚ΠΆΠΈΠ³Π°,

Β· ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠœΠΎΠ½Ρ‚Π΅-ΠšΠ°Ρ€Π»ΠΎ (числСнный ΠΌΠ΅Ρ‚ΠΎΠ΄ статистичСских испытаний);

4. Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ глобальной ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ (Π·Π°Π΄Π°Ρ‡ΠΈ глобальной ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ€Π΅ΡˆΠ°ΡŽΡ‚ΡΡ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΠ΅Ρ€Π΅Π±ΠΎΡ€Π° Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, ΠΎΡ‚ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… зависит цСлСвая функция).

7. НСйронная ΡΠ΅Ρ‚ΡŒ ΠΈΠ»ΠΈ нСрвная систСма Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° – это слоТная ΡΠ΅Ρ‚ΡŒ структур Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°, ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΠ²Π°ΡŽΡ‰Π°Ρ взаимосвязанноС ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ всСх систСм ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΌΠ°.

БиологичСский Π½Π΅ΠΉΡ€ΠΎΠ½ – это ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ ΠΊΠ»Π΅Ρ‚ΠΊΠ°, которая структурно состоит ΠΈΠ· ядра, Ρ‚Π΅Π»Π° ΠΊΠ»Π΅Ρ‚ΠΊΠΈ ΠΈ отростков. Одной ΠΈΠ· ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ Π½Π΅ΠΉΡ€ΠΎΠ½Π° являСтся ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‡Π° элСктрохимичСского ΠΈΠΌΠΏΡƒΠ»ΡŒΡΠ° ΠΏΠΎ всСй Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‡Π΅Ρ€Π΅Π· доступныС связи с Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π°ΠΌΠΈ. ΠŸΡ€ΠΈΡ‚ΠΎΠΌ, каТдая связь характСризуСтся Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½ΠΎΠΉ, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΠΎΠΉ силой синаптичСской связи. Π­Ρ‚Π° Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π° опрСдСляСт, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΎΠΈΠ·ΠΎΠΉΠ΄Π΅Ρ‚ с элСктрохимичСским ΠΈΠΌΠΏΡƒΠ»ΡŒΡΠΎΠΌ ΠΏΡ€ΠΈ ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‡Π΅ Π΅Π³ΠΎ Π΄Ρ€ΡƒΠ³ΠΎΠΌΡƒ Π½Π΅ΠΉΡ€ΠΎΠ½Ρƒ: Π»ΠΈΠ±ΠΎ ΠΎΠ½ усилится, Π»ΠΈΠ±ΠΎ ΠΎΠ½ ослабится, Π»ΠΈΠ±ΠΎ останСтся Π½Π΅ΠΈΠ·ΠΌΠ΅Π½Π½Ρ‹ΠΌ.

БиологичСская нСйронная ΡΠ΅Ρ‚ΡŒ ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ высокой ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒΡŽ связности: Π½Π° ΠΎΠ΄ΠΈΠ½ Π½Π΅ΠΉΡ€ΠΎΠ½ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ нСсколько тысяч связСй с Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π°ΠΌΠΈ. Но, это ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΈ Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΌ случаС ΠΎΠ½ΠΎ Ρ€Π°Π·Π½ΠΎΠ΅. ΠŸΠ΅Ρ€Π΅Π΄Π°Ρ‡Π° ΠΈΠΌΠΏΡƒΠ»ΡŒΡΠΎΠ² ΠΎΡ‚ ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Π° ΠΊ Π΄Ρ€ΡƒΠ³ΠΎΠΌΡƒ ΠΏΠΎΡ€ΠΎΠΆΠ΄Π°Π΅Ρ‚ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ΅ Π²ΠΎΠ·Π±ΡƒΠΆΠ΄Π΅Π½ΠΈΠ΅ всСй Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти. Π’Π΅Π»ΠΈΡ‡ΠΈΠ½Π° этого возбуТдСния опрСдСляСт Ρ€Π΅Π°ΠΊΡ†ΠΈΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Π½Π° ΠΊΠ°ΠΊΠΈΠ΅-Ρ‚ΠΎ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ сигналы. НапримСр, встрСча Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° со старым Π·Π½Π°ΠΊΠΎΠΌΡ‹ΠΌ ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ ΡΠΈΠ»ΡŒΠ½ΠΎΠΌΡƒ Π²ΠΎΠ·Π±ΡƒΠΆΠ΄Π΅Π½ΠΈΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти, Ссли с этим Π·Π½Π°ΠΊΠΎΠΌΡ‹ΠΌ связаны ΠΊΠ°ΠΊΠΈΠ΅-Ρ‚ΠΎ яркиС ΠΈ приятныС ΠΆΠΈΠ·Π½Π΅Π½Π½Ρ‹Π΅ воспоминания. Π’ свою ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ сильноС Π²ΠΎΠ·Π±ΡƒΠΆΠ΄Π΅Π½ΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ ΡƒΡ‡Π°Ρ‰Π΅Π½ΠΈΡŽ сСрдцСбиСния, Π±ΠΎΠ»Π΅Π΅ частому ΠΌΠΎΡ€Π³Π°Π½ΠΈΡŽ Π³Π»Π°Π· ΠΈ ΠΊ Π΄Ρ€ΡƒΠ³ΠΈΠΌ рСакциям. ВстрСча ΠΆΠ΅ с Π½Π΅Π·Π½Π°ΠΊΠΎΠΌΡ‹ΠΌ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠΎΠΌ для Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти ΠΏΡ€ΠΎΠΉΠ΄Π΅Ρ‚ практичСски Π½Π΅Π·Π°ΠΌΠ΅Ρ‚Π½ΠΎΠΉ, Π° Π·Π½Π°Ρ‡ΠΈΡ‚ ΠΈ Π½Π΅ Π²Ρ‹Π·ΠΎΠ²Π΅Ρ‚ ΠΊΠ°ΠΊΠΈΡ…-Π»ΠΈΠ±ΠΎ ΡΠΈΠ»ΡŒΠ½Ρ‹Ρ… Ρ€Π΅Π°ΠΊΡ†ΠΈΠΉ.

МоТно привСсти ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΡƒΡŽ сильно ΡƒΠΏΡ€ΠΎΡ‰Π΅Π½Π½ΡƒΡŽ модСль биологичСской Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти:

ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ состоит ΠΈΠ· Ρ‚Π΅Π»Π° ΠΊΠ»Π΅Ρ‚ΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ содСрТит ядро. ΠžΡ‚ Ρ‚Π΅Π»Π° ΠΊΠ»Π΅Ρ‚ΠΊΠΈ отвСтвляСтся мноТСство ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΡ… Π²ΠΎΠ»ΠΎΠΊΠΎΠ½, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… Π΄Π΅Π½Π΄Ρ€ΠΈΡ‚Π°ΠΌΠΈ. Π”Π»ΠΈΠ½Π½Ρ‹Π΅ Π΄Π΅Π½Π΄Ρ€ΠΈΡ‚Ρ‹ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ аксонами. Аксоны Ρ€Π°ΡΡ‚ΡΠ³ΠΈΠ²Π°ΡŽΡ‚ΡΡ Π½Π° большиС расстояния, Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°ΡŽΡ‰Π΅Π΅ Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π² ΠΌΠ°ΡΡˆΡ‚Π°Π±Π΅ этого рисунка. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ аксоны ΠΈΠΌΠ΅ΡŽΡ‚ Π΄Π»ΠΈΠ½Ρƒ 1 см (Ρ‡Ρ‚ΠΎ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ Π² 100 Ρ€Π°Π· Π΄ΠΈΠ°ΠΌΠ΅Ρ‚Ρ€ Ρ‚Π΅Π»Π° ΠΊΠ»Π΅Ρ‚ΠΊΠΈ), Π½ΠΎ ΠΌΠΎΠ³ΡƒΡ‚ Π΄ΠΎΡΡ‚ΠΈΠ³Π°Ρ‚ΡŒ ΠΈ 1 ΠΌΠ΅Ρ‚Ρ€Π°.

Π’ 60-80 Π³ΠΎΠ΄Π°Ρ… XX Π²Π΅ΠΊΠ° ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚Π½Ρ‹ΠΌ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ исслСдований Π² области искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π° Π±Ρ‹Π»ΠΈ экспСртныС систСмы . ЭкспСртныС систСмы Ρ…ΠΎΡ€ΠΎΡˆΠΎ сСбя Π·Π°Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΠΎΠ²Π°Π»ΠΈ, Π½ΠΎ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² узкоспСциализированных областях. Для создания Π±ΠΎΠ»Π΅Π΅ ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… систСм трСбовался Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄. НавСрноС, это ΠΏΡ€ΠΈΠ²Π΅Π»ΠΎ ΠΊ Ρ‚ΠΎΠΌΡƒ, Ρ‡Ρ‚ΠΎ исслСдоватСли искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π° ΠΎΠ±Ρ€Π°Ρ‚ΠΈΠ»ΠΈ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° биологичСскиС Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π»Π΅ΠΆΠ°Ρ‚ Π² основС чСловСчСского ΠΌΠΎΠ·Π³Π°.

НСйронныС сСти Π² искусствСнном ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π΅ – это ΡƒΠΏΡ€ΠΎΡ‰Π΅Π½Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ биологичСских Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй.

На этом сходство заканчиваСтся. Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π° чСловСчСского ΠΌΠΎΠ·Π³Π° Π³ΠΎΡ€Π°Π·Π΄ΠΎ Π±ΠΎΠ»Π΅Π΅ слоТная, Ρ‡Π΅ΠΌ описанная Π²Ρ‹ΡˆΠ΅, ΠΈ поэтому воспроизвСсти Π΅Π΅ хотя Π±Ρ‹ Π±ΠΎΠ»Π΅Π΅ ΠΌΠ΅Π½Π΅Π΅ Ρ‚ΠΎΡ‡Π½ΠΎ Π½Π΅ прСдставляСтся Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ΠΌ.

Π£ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй ΠΌΠ½ΠΎΠ³ΠΎ Π²Π°ΠΆΠ½Ρ‹Ρ… свойств, Π½ΠΎ ΠΊΠ»ΡŽΡ‡Π΅Π²ΠΎΠ΅ ΠΈΠ· Π½ΠΈΡ… – это ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΊ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ. ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Π² ΠΏΠ΅Ρ€Π²ΡƒΡŽ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΈ «силы» синаптичСских связСй ΠΌΠ΅ΠΆΠ΄Ρƒ Π½Π΅ΠΉΡ€ΠΎΠ½Π°ΠΌΠΈ. Π‘Π»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ наглядно это дСмонстрируСт. Π’ классичСском ΠΎΠΏΡ‹Ρ‚Π΅ Павлова, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ Ρ€Π°Π· нСпосрСдствСнно ΠΏΠ΅Ρ€Π΅Π΄ ΠΊΠΎΡ€ΠΌΠ»Π΅Π½ΠΈΠ΅ΠΌ собаки Π·Π²ΠΎΠ½ΠΈΠ» ΠΊΠΎΠ»ΠΎΠΊΠΎΠ»ΡŒΡ‡ΠΈΠΊ. Π‘ΠΎΠ±Π°ΠΊΠ° достаточно быстро Π½Π°ΡƒΡ‡ΠΈΠ»Π°ΡΡŒ Π°ΡΡΠΎΡ†ΠΈΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π·Π²ΠΎΠ½ΠΎΠΊ ΠΊΠΎΠ»ΠΎΠΊΠΎΠ»ΡŒΡ‡ΠΈΠΊΠ° с ΠΏΡ€ΠΈΠ΅ΠΌΠΎΠΌ ΠΏΠΈΡ‰ΠΈ. Π­Ρ‚ΠΎ явилось слСдствиСм Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ синаптичСскиС связи ΠΌΠ΅ΠΆΠ΄Ρƒ участками Π³ΠΎΠ»ΠΎΠ²Π½ΠΎΠ³ΠΎ ΠΌΠΎΠ·Π³Π°, отвСтствСнными Π·Π° слух ΠΈ ΡΠ»ΡŽΠ½Π½Ρ‹Π΅ ΠΆΠ΅Π»Π΅Π·Ρ‹, ΡƒΡΠΈΠ»ΠΈΠ»ΠΈΡΡŒ. И Π² ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ Π²ΠΎΠ·Π±ΡƒΠΆΠ΄Π΅Π½ΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Π·Π²ΡƒΠΊΠΎΠΌ ΠΊΠΎΠ»ΠΎΠΊΠΎΠ»ΡŒΡ‡ΠΈΠΊΠ°, стало ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΊ Π±ΠΎΠ»Π΅Π΅ ΡΠΈΠ»ΡŒΠ½ΠΎΠΌΡƒ ΡΠ»ΡŽΠ½ΠΎΠΎΡ‚Π΄Π΅Π»Π΅Π½ΠΈΡŽ Ρƒ собаки.

На сСгодняшний дСнь Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚Π½Ρ‹Ρ… Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΉ исслСдований Π² области искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π°.

8. ΠœΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½Ρ‹ΠΌΠΈ пСрсСптронами Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти прямого распространСния. Π’Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал Π² Ρ‚Π°ΠΊΠΈΡ… сСтях распространяСтся Π² прямом Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ, ΠΎΡ‚ слоя ΠΊ слою. ΠœΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½Ρ‹ΠΉ пСрсСптрон Π² ΠΎΠ±Ρ‰Π΅ΠΌ прСдставлСнии состоит ΠΈΠ· ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… элСмСнтов:

Β· мноТСства Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΡƒΠ·Π»ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‚ Π²Ρ…ΠΎΠ΄Π½ΠΎΠΉ слой;

Β· ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… скрытых слоСв Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ²;

Β· ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ слоя Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ².

ΠœΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½Ρ‹ΠΉ пСрсСптрон прСдставляСт собой ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½ΠΈΠ΅ однослойного пСрсСптрона Π ΠΎΠ·Π΅Π½Π±Π»Π°Ρ‚Ρ‚Π°. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ многослойного пСрсСптрона являСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π°Ρ модСль Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти:

ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΈ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… элСмСнтов Π² многослойном пСрсСптронС опрСдСляСтся условиями Π·Π°Π΄Π°Ρ‡ΠΈ. БомнСния ΠΌΠΎΠ³ΡƒΡ‚ Π²ΠΎΠ·Π½ΠΈΠΊΠ½ΡƒΡ‚ΡŒ Π² ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊΠΈΠ΅ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ значСния ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ, Π° ΠΊΠ°ΠΊΠΈΠ΅ Π½Π΅Ρ‚. Вопрос ΠΎ Ρ‚ΠΎΠΌ, сколько ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½Ρ‹Ρ… слоСв ΠΈ элСмСнтов Π² Π½ΠΈΡ…, ΠΏΠΎΠΊΠ° ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ нСясСн. Π’ качСствС Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ приблиТСния ΠΌΠΎΠΆΠ½ΠΎ Π²Π·ΡΡ‚ΡŒ ΠΎΠ΄ΠΈΠ½ ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½Ρ‹ΠΉ слой, Π° число элСмСнтов Π² Π½Π΅ΠΌ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚ΡŒ Ρ€Π°Π²Π½Ρ‹ΠΌ полусуммС числа Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΈ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… элСмСнтов.

ΠœΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠΉΠ½Ρ‹Π΅ пСрсСптроны ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·Π½Ρ‹Ρ… слоТных Π·Π°Π΄Π°Ρ‡ ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… Ρ‚Ρ€ΠΈ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°.

OUT = K (NET),

Π³Π΄Π΅ К - постоянная, ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ

OUT = 1, Ссли NET > T, OUT = 0 Π² ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Ρ… случаях,

Π³Π΄Π΅ Π’ - нСкоторая постоянная пороговая Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π°, ΠΈΠ»ΠΈ ΠΆΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ, Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΉ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‚ΠΎΡ‡Π½ΡƒΡŽ характСристику биологичСского Π½Π΅ΠΉΡ€ΠΎΠ½Π° ΠΈ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‰Π΅ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти большиС возмоТности.

Рис. 3.

На рис. 3 Π±Π»ΠΎΠΊ, ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π΅Π½Π½Ρ‹ΠΉ F, ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ сигнал NET ΠΈ Π²Ρ‹Π΄Π°Π΅Ρ‚ сигнал OUT. Если Π±Π»ΠΎΠΊ F суТаСт Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ измСнСния Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ NET Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ Π»ΡŽΠ±Ρ‹Ρ… значСниях NET значСния OUT ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌΡƒ ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠΌΡƒ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Ρƒ, Ρ‚ΠΎ F называСтся Β«ΡΠΆΠΈΠΌΠ°ΡŽΡ‰Π΅ΠΉΒ» Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ. Π’ качСствС Β«ΡΠΆΠΈΠΌΠ°ΡŽΡ‰Π΅ΠΉΒ» Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ логистичСская ΠΈΠ»ΠΈ «сигмоидальная» (S-образная) функция, показанная Π½Π° рис.4Π°. Π­Ρ‚Π° функция матСматичСски выраТаСтся ΠΊΠ°ΠΊ

F(x) = 1/(1 + Π΅ -x).

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ,

По Π°Π½Π°Π»ΠΎΠ³ΠΈΠΈ с элСктронными систСмами Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΡƒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΌΠΎΠΆΠ½ΠΎ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ ΡƒΡΠΈΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ характСристикой искусствСнного Π½Π΅ΠΉΡ€ΠΎΠ½Π°. ΠšΠΎΡΡ„Ρ„ΠΈΡ†ΠΈΠ΅Π½Ρ‚ усилСния вычисляСтся ΠΊΠ°ΠΊ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ приращСния Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ OUT ΠΊ Π²Ρ‹Π·Π²Π°Π²ΡˆΠ΅ΠΌΡƒ Π΅Π³ΠΎ Π½Π΅Π±ΠΎΠ»ΡŒΡˆΠΎΠΌΡƒ ΠΏΡ€ΠΈΡ€Π°Ρ‰Π΅Π½ΠΈΡŽ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ NET. Он выраТаСтся Π½Π°ΠΊΠ»ΠΎΠ½ΠΎΠΌ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΏΡ€ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ возбуТдСния ΠΈ измСняСтся ΠΎΡ‚ ΠΌΠ°Π»Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΏΡ€ΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… возбуТдСниях (кривая ΠΏΠΎΡ‡Ρ‚ΠΈ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Π°) Π΄ΠΎ максимального значСния ΠΏΡ€ΠΈ Π½ΡƒΠ»Π΅Π²ΠΎΠΌ Π²ΠΎΠ·Π±ΡƒΠΆΠ΄Π΅Π½ΠΈΠΈ ΠΈ снова ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ, ΠΊΠΎΠ³Π΄Π° Π²ΠΎΠ·Π±ΡƒΠΆΠ΄Π΅Π½ΠΈΠ΅ становится большим ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ. ГроссбСрг (1973) ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ», Ρ‡Ρ‚ΠΎ подобная нСлинСйная характСристика Ρ€Π΅ΡˆΠ°Π΅Ρ‚ ΠΏΠΎΡΡ‚Π°Π²Π»Π΅Π½Π½ΡƒΡŽ ΠΈΠΌ Π΄ΠΈΠ»Π΅ΠΌΠΌΡƒ ΡˆΡƒΠΌΠΎΠ²ΠΎΠ³ΠΎ насыщСния. Каким ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΎΠ΄Π½Π° ΠΈ Ρ‚Π° ΠΆΠ΅ ΡΠ΅Ρ‚ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ слабыС, Ρ‚Π°ΠΊ ΠΈ ΡΠΈΠ»ΡŒΠ½Ρ‹Π΅ сигналы? Π‘Π»Π°Π±Ρ‹Π΅ сигналы Π½ΡƒΠΆΠ΄Π°ΡŽΡ‚ΡΡ Π² большом сСтСвом усилСнии, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠ³ΠΎΠ΄Π½Ρ‹ΠΉ ΠΊ использованию Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал. Однако ΡƒΡΠΈΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ каскады с большими коэффициСнтами усилСния ΠΌΠΎΠ³ΡƒΡ‚ привСсти ΠΊ Π½Π°ΡΡ‹Ρ‰Π΅Π½ΠΈΡŽ Π²Ρ‹Ρ…ΠΎΠ΄Π° ΡˆΡƒΠΌΠ°ΠΌΠΈ усилитСлСй (случайными флуктуациями), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚ Π² любой физичСски Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π½ΠΎΠΉ сСти. Π‘ΠΈΠ»ΡŒΠ½Ρ‹Π΅ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ сигналы Π² свою ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ Ρ‚Π°ΠΊΠΆΠ΅ Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΊ Π½Π°ΡΡ‹Ρ‰Π΅Π½ΠΈΡŽ ΡƒΡΠΈΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… каскадов, ΠΈΡΠΊΠ»ΡŽΡ‡Π°Ρ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠ³ΠΎ использования Π²Ρ‹Ρ…ΠΎΠ΄Π°. Π¦Π΅Π½Ρ‚Ρ€Π°Π»ΡŒΠ½Π°Ρ ΠΎΠ±Π»Π°ΡΡ‚ΡŒ логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, ΠΈΠΌΠ΅ΡŽΡ‰Π°Ρ большой коэффициСнт усилСния, Ρ€Π΅ΡˆΠ°Π΅Ρ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ слабых сигналов, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ области с ΠΏΠ°Π΄Π°ΡŽΡ‰ΠΈΠΌ усилСниСм Π½Π° ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ ΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΌ ΠΊΠΎΠ½Ρ†Π°Ρ… подходят для Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π²ΠΎΠ·Π±ΡƒΠΆΠ΄Π΅Π½ΠΈΠΉ. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π½Π΅ΠΉΡ€ΠΎΠ½ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½ΠΈΡ€ΡƒΠ΅Ρ‚ с большим усилСниСм Π² ΡˆΠΈΡ€ΠΎΠΊΠΎΠΌ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π΅ уровня Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ сигнала.


Рис.

Π”Ρ€ΡƒΠ³ΠΎΠΉ ΡˆΠΈΡ€ΠΎΠΊΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ являСтся гипСрболичСский тангСнс. По Ρ„ΠΎΡ€ΠΌΠ΅ ΠΎΠ½Π° сходна с логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ ΠΈ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π±ΠΈΠΎΠ»ΠΎΠ³Π°ΠΌΠΈ Π² качСствС матСматичСской ΠΌΠΎΠ΄Π΅Π»ΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Π½Π΅Ρ€Π²Π½ΠΎΠΉ ΠΊΠ»Π΅Ρ‚ΠΊΠΈ. Π’ качСствС Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ искусствСнной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти ΠΎΠ½Π° записываСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:


Рис.

Подобно логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ гипСрболичСский тангСнс являСтся S-ΠΎΠ±Ρ€Π°Π·Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ, Π½ΠΎ ΠΎΠ½ симмСтричСн ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π°Ρ‡Π°Π»Π° ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚, ΠΈ Π² Ρ‚ΠΎΡ‡ΠΊΠ΅ NET = 0 Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ сигнала OUT Ρ€Π°Π²Π½ΠΎ Π½ΡƒΠ»ΡŽ (см. рис. 4Π±). Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ гипСрболичСский тангСнс ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ значСния Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎ оказываСтся Π²Ρ‹Π³ΠΎΠ΄Π½Ρ‹ΠΌ для ряда сСтСй.

РассмотрСнная простая модСль искусствСнного Π½Π΅ΠΉΡ€ΠΎΠ½Π° ΠΈΠ³Π½ΠΎΡ€ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ свойства своСго биологичСского Π΄Π²ΠΎΠΉΠ½ΠΈΠΊΠ°.

НапримСр, ΠΎΠ½Π° Π½Π΅ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π²ΠΎ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΈ Π²ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²ΠΎΠ·Π΄Π΅ΠΉΡΡ‚Π²ΡƒΡŽΡ‚ Π½Π° Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΡƒ систСмы. Π’Ρ…ΠΎΠ΄Π½Ρ‹Π΅ сигналы сразу ΠΆΠ΅ ΠΏΠΎΡ€ΠΎΠΆΠ΄Π°ΡŽΡ‚ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал. И, Ρ‡Ρ‚ΠΎ Π±ΠΎΠ»Π΅Π΅ Π²Π°ΠΆΠ½ΠΎ, ΠΎΠ½Π° Π½Π΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ воздСйствий Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ частотной модуляции ΠΈΠ»ΠΈ ΡΠΈΠ½Ρ…Ρ€ΠΎΠ½ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ биологичСского Π½Π΅ΠΉΡ€ΠΎΠ½Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ряд исслСдоватСлСй ΡΡ‡ΠΈΡ‚Π°ΡŽΡ‚ Ρ€Π΅ΡˆΠ°ΡŽΡ‰ΠΈΠΌΠΈ.

НСсмотря Π½Π° эти ограничСния, сСти, построСнныС ΠΈΠ· этих Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ², ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°ΡŽΡ‚ свойства, сильно Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°ΡŽΡ‰ΠΈΠ΅ Π±ΠΈΠΎΠ»ΠΎΠ³ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ систСму. Волько врСмя ΠΈ исслСдования смогут ΠΎΡ‚Π²Π΅Ρ‚ΠΈΡ‚ΡŒ Π½Π° вопрос, ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π»ΠΈ ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Π΅ совпадСния случайными ΠΈΠ»ΠΈ слСдствиСм Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ Π²Π΅Ρ€Π½ΠΎ схвачСны ваТнСйшиС Ρ‡Π΅Ρ€Ρ‚Ρ‹ биологичСского Π½Π΅ΠΉΡ€ΠΎΠ½Π°.

Π’ΠΎ Π²Ρ‚ΠΎΡ€ΠΎΠΉ части ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΌΡ‹ ΠΏΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠ°Π΅ΠΌ обсуТдСниС тонкостСй Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ обучСния.

5. Π’Ρ‹Π±ΠΎΡ€ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ

Одним ΠΈΠ· Π²Π°ΠΆΠ½Π΅ΠΉΡˆΠΈΡ… аспСктов Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти являСтся функция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ (activation function), которая привносит Π² ΡΠ΅Ρ‚ΡŒ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΡΡ‚ΡŒ . Π”Π°Π»Π΅Π΅ ΠΌΡ‹ рассмотрим распространСнныС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ ΠΈ Π΄Π°Π΄ΠΈΠΌ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ ΠΏΠΎ ΠΈΡ… Π²Ρ‹Π±ΠΎΡ€Ρƒ.

Π‘ΠΈΠ³ΠΌΠΎΠΈΠ΄Π°

Π‘ΠΈΠ³ΠΌΠΎΠΈΠ΄Π° (sigmoid) выраТаСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ Ρ„ΠΎΡ€ΠΌΡƒΠ»ΠΎΠΉ: Οƒ(x) = 1 / (1 + e -x) . Π­Ρ‚Π° функция ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π½Π° Π²Ρ…ΠΎΠ΄Π΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½ΠΎΠ΅ вСщСствСнноС число, Π° Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ Π΄Π°Π΅Ρ‚ вСщСствСнноС число Π² ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ ΠΎΡ‚ 0 Π΄ΠΎ 1. Π’ частности, большиС (ΠΏΠΎ ΠΌΠΎΠ΄ΡƒΠ»ΡŽ) ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ числа ΠΏΡ€Π΅Π²Ρ€Π°Ρ‰Π°ΡŽΡ‚ΡΡ Π² ноль, Π° большиС ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ – Π² Π΅Π΄ΠΈΠ½ΠΈΡ†Ρƒ. Π˜ΡΡ‚ΠΎΡ€ΠΈΡ‡Π΅ΡΠΊΠΈ сигмоида Π½Π°Ρ…ΠΎΠ΄ΠΈΠ»Π° ΡˆΠΈΡ€ΠΎΠΊΠΎΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π΅Π΅ Π²Ρ‹Ρ…ΠΎΠ΄ Ρ…ΠΎΡ€ΠΎΡˆΠΎ интСрпрСтируСтся, ΠΊΠ°ΠΊ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π°: ΠΎΡ‚ отсутствия Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ (0) Π΄ΠΎ ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ насыщСнной Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ (1).

На Ρ‚Π΅ΠΊΡƒΡ‰ΠΈΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚ сигмоида ΡƒΡ‚Ρ€Π°Ρ‚ΠΈΠ»Π° свою Π±Ρ‹Π»ΡƒΡŽ ΠΏΠΎΠΏΡƒΠ»ΡΡ€Π½ΠΎΡΡ‚ΡŒ ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΎΡ‡Π΅Π½ΡŒ Ρ€Π΅Π΄ΠΊΠΎ. Данная функция ΠΈΠΌΠ΅Π΅Ρ‚ Π΄Π²Π° ΡΠ΅Ρ€ΡŒΠ΅Π·Π½Ρ‹Ρ… нСдостатка:

  1. НасыщСниС сигмоиды ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Π·Π°Ρ‚ΡƒΡ…Π°Π½ΠΈΡŽ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ². ΠšΡ€Π°ΠΉΠ½Π΅ Π½Π΅ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ свойство сигмоиды Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ насыщСнии Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ с Ρ‚ΠΎΠΉ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠΉ стороны (0 ΠΈΠ»ΠΈ 1), Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ Π½Π° этих участках становится Π±Π»ΠΈΠ·ΠΎΠΊ ΠΊ Π½ΡƒΠ»ΡŽ. Напомним, Ρ‡Ρ‚ΠΎ Π² процСссС ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠ³ΠΎ распространСния ошибки Π΄Π°Π½Π½Ρ‹ΠΉ (Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ) Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ умноТаСтся Π½Π° ΠΎΠ±Ρ‰ΠΈΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚. Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Ссли Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ ΠΌΠ°Π», ΠΎΠ½ фактичСски обнуляСт ΠΎΠ±Ρ‰ΠΈΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅, сигнал ΠΏΠΎΡ‡Ρ‚ΠΈ Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ΡŒ Ρ‡Π΅Ρ€Π΅Π· Π½Π΅ΠΉΡ€ΠΎΠ½ ΠΊ Π΅Π³ΠΎ вСсам ΠΈ рСкурсивно ΠΊ Π΅Π³ΠΎ Π΄Π°Π½Π½Ρ‹ΠΌ. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, слСдуСт Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ остороТным ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ вСсов сигмоидных Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€Π΅Π΄ΠΎΡ‚Π²Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ насыщСниС. НапримСр, Ссли исходныС вСса ΠΈΠΌΠ΅ΡŽΡ‚ слишком большиС значСния, Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΏΠ΅Ρ€Π΅ΠΉΠ΄Π΅Ρ‚ Π² состояниС насыщСния, Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ‡Π΅Π³ΠΎ ΡΠ΅Ρ‚ΡŒ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠ»ΠΎΡ…ΠΎ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ.
  2. Π’Ρ‹Ρ…ΠΎΠ΄ сигмоиды Π½Π΅ Ρ†Π΅Π½Ρ‚Ρ€ΠΈΡ€ΠΎΠ²Π°Π½ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ нуля. Π­Ρ‚ΠΎ свойство являСтся Π½Π΅ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Π² ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… слоях Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ значСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ Ρ†Π΅Π½Ρ‚Ρ€ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ нуля, Ρ‡Ρ‚ΠΎ ΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ влияниС Π½Π° Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΡƒ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска (gradient descent). Если значСния, ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‰ΠΈΠ΅ Π² Π½Π΅ΠΉΡ€ΠΎΠ½, всСгда ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, x > 0 поэлСмСнтно Π² f = Ο‰ T x + b ), Ρ‚ΠΎΠ³Π΄Π° Π² процСссС ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠ³ΠΎ распространСния ошибки всС Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρ‹ вСсов Ο‰ Π±ΡƒΠ΄ΡƒΡ‚ Π»ΠΈΠ±ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹, Π»ΠΈΠ±ΠΎ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ (Π² зависимости ΠΎΡ‚ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π° всСго выраТСния f ). Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ Π½Π΅ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π·ΠΈΠ³Π·Π°Π³ΠΎΠΎΠ±Ρ€Π°Π·Π½ΠΎΠΉ Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠ΅ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΉ вСсов. Однако слСдуСт ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΊΠΎΠ³Π΄Π° эти Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρ‹ ΡΡƒΠΌΠΌΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΏΠΎ ΠΏΠ°ΠΊΠ΅Ρ‚Ρƒ, ΠΈΡ‚ΠΎΠ³ΠΎΠ²ΠΎΠ΅ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ вСсов ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Π·Π½Π°ΠΊΠΈ, Ρ‡Ρ‚ΠΎ отчасти Π½ΠΈΠ²Π΅Π»ΠΈΡ€ΡƒΠ΅Ρ‚ описанный нСдостаток. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, отсутствиС цСнтрирования являСтся нСудобством, Π½ΠΎ ΠΈΠΌΠ΅Π΅Ρ‚ ΠΌΠ΅Π½Π΅Π΅ ΡΠ΅Ρ€ΡŒΠ΅Π·Π½Ρ‹Π΅ послСдствия, ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ насыщСния.

ГипСрболичСский тангСнс

ГипСрболичСский тангСнс (hyperbolic tangent, tanh) ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π½Π° Π²Ρ…ΠΎΠ΄Π΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½ΠΎΠ΅ вСщСствСнноС число, Π° Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ Π΄Π°Π΅Ρ‚ вСщСствСнноС число Π² ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ ΠΎΡ‚ –1 Π΄ΠΎ 1. Подобно сигмоидС, гипСрболичСский тангСнс ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π°ΡΡ‹Ρ‰Π°Ρ‚ΡŒΡΡ. Однако, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ сигмоиды, Π²Ρ‹Ρ…ΠΎΠ΄ Π΄Π°Π½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Ρ†Π΅Π½Ρ‚Ρ€ΠΈΡ€ΠΎΠ²Π°Π½ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ нуля. Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ всСгда ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½Π΅Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ гипСрболичСский тангСнс, Π° Π½Π΅ сигмоиду.

ReLU

Π’ послСдниС Π³ΠΎΠ΄Ρ‹ Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ ΠΏΠΎΠΏΡƒΠ»ΡΡ€Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΈΠΎΠ±Ρ€Π΅Π»Π° функция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ Β«Π²Ρ‹ΠΏΡ€ΡΠΌΠΈΡ‚Π΅Π»ΡŒΒ» (rectifier, ΠΏΠΎ Π°Π½Π°Π»ΠΎΠ³ΠΈΠΈ с ΠΎΠ΄Π½ΠΎΠΏΠΎΠ»ΡƒΠΏΠ΅Ρ€ΠΈΠΎΠ΄Π½Ρ‹ΠΌ выпрямитСлСм Π² элСктротСхникС). НСйроны с Π΄Π°Π½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ ReLU (rectified linear unit). ReLU ΠΈΠΌΠ΅Π΅Ρ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΡƒΡŽ Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρƒ f(x) = max(0, x) ΠΈ Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΠ΅Ρ‚ простой ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹ΠΉ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ Π² Π½ΡƒΠ»Π΅.

Рассмотрим ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ стороны ReLU.

ΠŸΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ стороны:

  1. ВычислСниС сигмоиды ΠΈ гипСрболичСского тангСнса Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ выполнСния рСсурсоСмких ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Π²ΠΎΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒ, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ReLU ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ простого ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ прСобразования ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΉ Π² Π½ΡƒΠ»Π΅. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ReLU Π½Π΅ ΠΏΠΎΠ΄Π²Π΅Ρ€ΠΆΠ΅Π½ Π½Π°ΡΡ‹Ρ‰Π΅Π½ΠΈΡŽ.
  2. ΠŸΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ReLU сущСствСнно ΠΏΠΎΠ²Ρ‹ΡˆΠ°Π΅Ρ‚ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ сходимости стохастичСского Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска (Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… случаях Π΄ΠΎ 6 Ρ€Π°Π· ) ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с сигмоидой ΠΈ гипСрболичСским тангСнсом. БчитаСтся, Ρ‡Ρ‚ΠΎ это обусловлСно Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΌ Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΎΠΌ ΠΈ отсутствиСм насыщСния Π΄Π°Π½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ.

ΠžΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ стороны:

  1. К соТалСнию, ReLU Π½Π΅ всСгда достаточно Π½Π°Π΄Π΅ΠΆΠ½Ρ‹ ΠΈ Π² процСссС обучСния ΠΌΠΎΠ³ΡƒΡ‚ Π²Ρ‹Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΈΠ· строя (Β«ΡƒΠΌΠΈΡ€Π°Ρ‚ΡŒΒ»). НапримСр, большой Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚, проходящий Ρ‡Π΅Ρ€Π΅Π· ReLU, ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ Ρ‚Π°ΠΊΠΎΠΌΡƒ обновлСнию вСсов, Ρ‡Ρ‚ΠΎ Π΄Π°Π½Π½Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ Π½ΠΈΠΊΠΎΠ³Π΄Π° большС Π½Π΅ активируСтся. Если это ΠΏΡ€ΠΎΠΈΠ·ΠΎΠΉΠ΄Π΅Ρ‚, Ρ‚ΠΎ, начиная с Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΌΠΎΠΌΠ΅Π½Ρ‚Π°, Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚, проходящий Ρ‡Π΅Ρ€Π΅Π· этот Π½Π΅ΠΉΡ€ΠΎΠ½, всСгда Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π²Π΅Π½ Π½ΡƒΠ»ΡŽ. БоотвСтствСнно, Π΄Π°Π½Π½Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ Π±ΡƒΠ΄Π΅Ρ‚ Π½Π΅ΠΎΠ±Ρ€Π°Ρ‚ΠΈΠΌΠΎ Π²Ρ‹Π²Π΅Π΄Π΅Π½ ΠΈΠ· строя. НапримСр, ΠΏΡ€ΠΈ слишком большой скорости обучСния (learning rate), ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΠΊΠ°Π·Π°Ρ‚ΡŒΡΡ, Ρ‡Ρ‚ΠΎ Π΄ΠΎ 40% ReLU Β«ΠΌΠ΅Ρ€Ρ‚Π²Ρ‹Β» (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ, Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΡƒΡŽΡ‚ΡΡ). Π­Ρ‚Π° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Ρ€Π΅ΡˆΠ°Π΅Ρ‚ΡΡ посрСдством Π²Ρ‹Π±ΠΎΡ€Π° Π½Π°Π΄Π»Π΅ΠΆΠ°Ρ‰Π΅ΠΉ скорости обучСния.

Π’ настоящСС врСмя сущСствуСт Ρ†Π΅Π»ΠΎΠ΅ сСмСйство Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΉ ReLU. Π”Π°Π»Π΅Π΅ ΠΌΡ‹ рассмотрим ΠΈΡ… особСнности.

Для LReLU Ξ±i ΠΈΠΌΠ΅Π΅Ρ‚ фиксированноС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅, для PReLU Ξ±i опрСдСляСтся Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ…, для RReLU Ξ±ji гСнСрируСтся случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΈΠ· Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° Π²ΠΎ врСмя обучСния ΠΈ остаСтся постоянным Π²ΠΎ врСмя тСстирования.

Leaky ReLU

ReLU с Β«ΡƒΡ‚Π΅Ρ‡ΠΊΠΎΠΉΒ» (leaky ReLU, LReLU) прСдставляСт собой ΠΎΠ΄Π½Ρƒ ΠΈΠ· ΠΏΠΎΠΏΡ‹Ρ‚ΠΎΠΊ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ ΠΎΠΏΠΈΡΠ°Π½Π½ΡƒΡŽ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ Π²Ρ‹Ρ…ΠΎΠ΄Π° ΠΈΠ· строя ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… ReLU. ΠžΠ±Ρ‹Ρ‡Π½Ρ‹ΠΉ ReLU Π½Π° ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ x < 0 Π΄Π°Π΅Ρ‚ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ ноль, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ LReLU ΠΈΠΌΠ΅Π΅Ρ‚ Π½Π° этом ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ нСбольшоС ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ (ΡƒΠ³Π»ΠΎΠ²ΠΎΠΉ коэффициСнт ΠΎΠΊΠΎΠ»ΠΎ 0,01). Π’ΠΎ Π΅ΡΡ‚ΡŒ функция для LReLU ΠΈΠΌΠ΅Π΅Ρ‚ Π²ΠΈΠ΄ f(x) = Ξ±x ΠΏΡ€ΠΈ x < 0 ΠΈ f(x) = x ΠΏΡ€ΠΈ x β‰₯ 0 , Π³Π΄Π΅ Ξ± – малая константа. НСкоторыС исслСдоватСли ΡΠΎΠΎΠ±Ρ‰Π°ΡŽΡ‚ ΠΎΠ± ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎΠΌ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ Π΄Π°Π½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, Π½ΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π½Π΅ всСгда ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½Ρ‹.

Parametric ReLU

Для парамСтричСского ReLU (parametric ReLU, PReLU) ΡƒΠ³Π»ΠΎΠ²ΠΎΠΉ коэффициСнт Π½Π° ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΌ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ Π½Π΅ задаСтся ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, Π° опрСдСляСтся Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ…. Авторы ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ являСтся ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹ΠΌ Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠΌ, позволившим ΠΏΡ€Π΅Π²Π·ΠΎΠΉΡ‚ΠΈ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° Π² Π·Π°Π΄Π°Ρ‡Π΅ распознавания ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ImageNet. ΠŸΡ€ΠΎΡ†Π΅ΡΡ ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠ³ΠΎ распространСния ошибки ΠΈ обновлСния для PReLU (стр. 43 слайдов) достаточно прост ΠΈ ΠΏΠΎΠ΄ΠΎΠ±Π΅Π½ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅ΠΌΡƒ процСссу для Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹Ρ… ReLU.

Randomized ReLU

Для Ρ€Π°Π½Π΄ΠΎΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ReLU (randomized ReLU, RReLU) ΡƒΠ³Π»ΠΎΠ²ΠΎΠΉ коэффициСнт Π½Π° ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΌ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ Π²ΠΎ врСмя обучСния гСнСрируСтся случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΈΠ· Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π°, Π° Π²ΠΎ врСмя тСстирования остаСтся постоянным. Π’ Ρ€Π°ΠΌΠΊΠ°Ρ… Kaggle-сорСвнования National Data Science Bowl (NDSB) RReLU ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΈ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ благодаря свойствСнному ΠΈΠΌ элСмСнту случайности . Как сообщаСт ΠΏΠΎΠ±Π΅Π΄ΠΈΡ‚Π΅Π»ΡŒ Π΄Π°Π½Π½ΠΎΠ³ΠΎ сорСвнования, Π²ΠΎ врСмя обучСния Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ξ± i Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Π»ΠΎΡΡŒ случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΈΠ· распрСдСлСния 1 / U(3, 8) , Π° Π²ΠΎ врСмя тСстирования Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π±Ρ‹Π»ΠΎ постоянно ΠΈ Ρ€Π°Π²Π½ΡΠ»ΠΎΡΡŒ матСматичСскому оТиданию: 2 / (l + u) = 2 / 11 .

L1-рСгуляризация ΠΈΠΌΠ΅Π΅Ρ‚ интСрСсноС свойство, Π·Π°ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‰Π΅Π΅ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π² Π΅Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Π²Π΅ΠΊΡ‚ΠΎΡ€Ρ‹ вСсов становятся Ρ€Π°Π·Ρ€Π΅ΠΆΠ΅Π½Π½Ρ‹ΠΌΠΈ (Ρ‚.Π΅. ΠΎΡ‡Π΅Π½ΡŒ Π±Π»ΠΈΠ·ΠΊΠΈΠΌΠΈ ΠΊ Π½ΡƒΠ»ΡŽ). Π”Ρ€ΡƒΠ³ΠΈΠΌΠΈ словами, Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ с L1-рСгуляризациСй Π² ΠΈΡ‚ΠΎΠ³Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ нСбольшоС подмноТСство Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π²Π°ΠΆΠ½Ρ‹Ρ… Π²Ρ…ΠΎΠ΄ΠΎΠ² ΠΈ, соотвСтствСнно, ΠΏΠΎΡ‡Ρ‚ΠΈ Π½Π΅ ΠΏΠΎΠ΄Π²Π΅Ρ€ΠΆΠ΅Π½Ρ‹ влиянию Β«ΡˆΡƒΠΌΠ½Ρ‹Ρ…Β» Π²Ρ…ΠΎΠ΄ΠΎΠ².

На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅, Ссли Π½Π΅Ρ‚ нСобходимости Π² нСпосрСдствСнном ΠΎΡ‚Π±ΠΎΡ€Π΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², L2-рСгуляризация обСспСчит Π»ΡƒΡ‡ΡˆΠΈΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с L1-рСгуляризациСй.

ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ Π½ΠΎΡ€ΠΌΡ‹ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° вСсов

Π•Ρ‰Π΅ ΠΎΠ΄Π½ΠΈΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ рСгуляризации являСтся ΠΌΠ΅Ρ‚ΠΎΠ΄ ограничСния Π½ΠΎΡ€ΠΌΡ‹ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° вСсов (max norm constraint). Π’ Ρ€Π°ΠΌΠΊΠ°Ρ… Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° ΠΌΡ‹ Π·Π°Π΄Π°Π΅ΠΌ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½Ρ‹ΠΉ Π²Π΅Ρ€Ρ…Π½ΠΈΠΉ ΠΏΡ€Π΅Π΄Π΅Π» для Π½ΠΎΡ€ΠΌΡ‹ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° вСсов ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Π°. БоблюдСниС ограничСния обСспСчиваСтся с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΡ€ΠΎΠ΅Ρ†ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска (projected gradient descent). На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ это рСализуСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ: ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ вСсов выполняСтся ΠΊΠ°ΠΊ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ, Π° Π·Π°Ρ‚Π΅ΠΌ Π²Π΅ΠΊΡ‚ΠΎΡ€ вСсов Ο‰ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Π° ограничиваСтся Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΠ»ΠΎΡΡŒ условиС ||Ο‰|| 2 < c . ΠžΠ±Ρ‹Ρ‡Π½ΠΎ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ c составляСт порядка 3 ΠΈΠ»ΠΈ 4. НСкоторыС исслСдоватСли ΡΠΎΠΎΠ±Ρ‰Π°ΡŽΡ‚ ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ эффСктС ΠΏΡ€ΠΈ использовании Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° рСгуляризации. Одно ΠΈΠ· ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… свойств этого ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ позволяСт ΠΏΡ€Π΅Π΄ΠΎΡ‚Π²Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Β«Π²Π·Ρ€Ρ‹Π²Π½ΠΎΠΉΒ» рост вСсов Π΄Π°ΠΆΠ΅ ΠΏΡ€ΠΈ слишком большой скорости обучСния, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ обновлСния вСсов всСгда ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Ρ‹.

Π”Ρ€ΠΎΠΏΠ°ΡƒΡ‚

Π”Ρ€ΠΎΠΏΠ°ΡƒΡ‚ (dropout) – простой ΠΈ ΠΎΡ‡Π΅Π½ΡŒ эффСктивный ΠΌΠ΅Ρ‚ΠΎΠ΄ рСгуляризации, Π΄ΠΎΠΏΠΎΠ»Π½ΡΡŽΡ‰ΠΈΠΉ Π²Ρ‹ΡˆΠ΅Π½Π°Π·Π²Π°Π½Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹. Он Π±Ρ‹Π» Π½Π΅Π΄Π°Π²Π½ΠΎ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ Π² Ρ€Π°Π±ΠΎΡ‚Π΅ . Π‘ΡƒΡ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π² процСссС обучСния ΠΈΠ· ΠΎΠ±Ρ‰Π΅ΠΉ сСти случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΌΠ½ΠΎΠ³ΠΎΠΊΡ€Π°Ρ‚Π½ΠΎ выдСляСтся ΠΏΠΎΠ΄ΡΠ΅Ρ‚ΡŒ, ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ вСсов выполняСтся Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² Ρ€Π°ΠΌΠΊΠ°Ρ… этой подсСти. НСйроны ΠΏΠΎΠΏΠ°Π΄Π°ΡŽΡ‚ Π² ΠΏΠΎΠ΄ΡΠ΅Ρ‚ΡŒ с Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ p , которая называСтся коэффициСнтом Π΄Ρ€ΠΎΠΏΠ°ΡƒΡ‚Π°. Π’ΠΎ врСмя тСстирования Π΄Ρ€ΠΎΠΏΠ°ΡƒΡ‚ Π½Π΅ примСняСтся, вмСсто этого вСса ΡƒΠΌΠ½ΠΎΠΆΠ°ΡŽΡ‚ΡΡ Π½Π° коэффициСнт Π΄Ρ€ΠΎΠΏΠ°ΡƒΡ‚Π°, Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ‡Π΅Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΡƒΡΡ€Π΅Π΄Π½Π΅Π½Π½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ для ансамбля всСх подсСтСй. На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ коэффициСнт Π΄Ρ€ΠΎΠΏΠ°ΡƒΡ‚Π° p ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ Ρ€Π°Π²Π½Ρ‹ΠΌ 0,5, Π½ΠΎ Π΅Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ….

Π”Ρ€ΠΎΠΏΠ°ΡƒΡ‚ – ΠΎΠ΄Π½ΠΈ ΠΈΠ· самых популярных ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² рСгуляризации. Π’ 2014 Π³ΠΎΠ΄Ρƒ компания Google ΠΏΠΎΠ΄Π°Π»Π° ΠΏΠ°Ρ‚Π΅Π½Ρ‚Π½ΡƒΡŽ заявку Π½Π° этот ΠΌΠ΅Ρ‚ΠΎΠ΄.

7. Визуализация

Π’ процСссС обучСния ΠΏΠΎΠ»Π΅Π·Π½ΠΎ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ обучСния.

Как извСстно, ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния являСтся ΠΎΡ‡Π΅Π½ΡŒ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠΌ. На рисункС 1 Π½ΠΈΠΆΠ΅ ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ большой (very high) скорости обучСния кривая ошибки Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π½Π΅ΠΏΡ€ΠΈΠ΅ΠΌΠ»Π΅ΠΌΡƒΡŽ Ρ„ΠΎΡ€ΠΌΡƒ. ΠŸΡ€ΠΈ ΠΌΠ°Π»ΠΎΠΉ (low) скорости обучСния ошибка Π±ΡƒΠ΄Π΅Ρ‚ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Ρ‚ΡŒΡΡ ΠΎΡ‡Π΅Π½ΡŒ ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎ Π΄Π°ΠΆΠ΅ послС большого количСства эпох. ΠŸΡ€ΠΈ большой (high) скорости обучСния ошибка быстро ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ Π²Π½Π°Ρ‡Π°Π»Π΅, Π½ΠΎ ΠΏΠΎΡ‚ΠΎΠΌ ΠΏΠΎΠΏΠ°Π΄Π°Π΅Ρ‚ Π² Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌ, Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ‡Π΅Π³ΠΎ ΡΠ΅Ρ‚ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π΅ Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ². Π’ Ρ‚ΠΎΠΌ случаС, ΠΊΠΎΠ³Π΄Π° ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Π½Π° ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ (good) (красная линия), ошибка ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ ΠΏΠ»Π°Π²Π½ΠΎ ΠΈ Π² ΠΈΡ‚ΠΎΠ³Π΅ достигаСт минимального значСния.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π΄Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим ΠΊΡ€ΠΈΠ²ΡƒΡŽ ошибки Π² Π±ΠΎΠ»Π΅Π΅ ΠΊΡ€ΡƒΠΏΠ½ΠΎΠΌ ΠΌΠ°ΡΡˆΡ‚Π°Π±Π΅. Π­ΠΏΠΎΡ…Π° (epoch) соотвСтствуСт ΠΎΠ΄Π½ΠΎΠΊΡ€Π°Ρ‚Π½ΠΎΠΌΡƒ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Ρƒ ΠΏΠΎ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΌΡƒ Π½Π°Π±ΠΎΡ€Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…, соотвСтствСнно, Π² ΠΊΠ°ΠΆΠ΄ΡƒΡŽ эпоху Π²Ρ…ΠΎΠ΄ΠΈΡ‚ мноТСство ΠΌΠΈΠ½ΠΈ-ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ² (mini-batch). Если ΠΌΡ‹ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌ ΠΎΡˆΠΈΠ±ΠΊΡƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΌΠΈΠ½ΠΈ-ΠΏΠ°ΠΊΠ΅Ρ‚Π°, кривая ошибки Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π²ΠΈΠ΄, ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½Π½Ρ‹ΠΉ Π½Π° рисункС 2. Как ΡƒΠΆΠ΅ Π±Ρ‹Π»ΠΎ сказано Π² ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ рисунка 1, Ссли кривая ошибки ΠΈΠΌΠ΅Π΅Ρ‚ Ρ„ΠΎΡ€ΠΌΡƒ, Π±Π»ΠΈΠ·ΠΊΡƒΡŽ ΠΊ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ, это ΡΠ²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΡƒΠ΅Ρ‚ ΠΎ ΠΌΠ°Π»ΠΎΠΉ скорости обучСния. Если ошибка ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎ, вСроятно, ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния слишком большая. Β«Π¨ΠΈΡ€ΠΈΠ½Π°Β» ΠΊΡ€ΠΈΠ²ΠΎΠΉ соотвСтствуСт Ρ€Π°Π·ΠΌΠ΅Ρ€Ρƒ ΠΌΠΈΠ½ΠΈ-ΠΏΠ°ΠΊΠ΅Ρ‚Π°. Если Β«ΡˆΠΈΡ€ΠΈΠ½Π°Β» слишком большая, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ разброс ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΌΠΈΠ½ΠΈ-ΠΏΠ°ΠΊΠ΅Ρ‚Π°ΠΌΠΈ слишком большой, Π·Π½Π°Ρ‡ΠΈΡ‚ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ ΠΌΠΈΠ½ΠΈ-ΠΏΠ°ΠΊΠ΅Ρ‚Π°.

Π•Ρ‰Π΅ ΠΎΠ΄ΠΈΠ½ Π²Ρ‹Π²ΠΎΠ΄ ΠΌΠΎΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΊΡ€ΠΈΠ²Ρ‹Ρ… точности. На рисункС 3 красная кривая прСдставляСт Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, Π° зСлСная – Π½Π° Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΌ. РасстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΡ€ΠΈΠ²Ρ‹ΠΌΠΈ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, насколько эффСктивна модСль. Π‘ΠΎΠ»ΡŒΡˆΠΎΠ΅ расстояниС Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΡΠ΅Ρ‚ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ классифицируСт ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ ΠΏΠ»ΠΎΡ…ΠΎ классифицируСт Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅. Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π² Π΄Π°Π½Π½ΠΎΠΌ случаС ΠΈΠΌΠ΅Π΅Ρ‚ мСсто ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π§Ρ‚ΠΎΠ±Ρ‹ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ эту ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΡƒΡΠΈΠ»ΠΈΡ‚ΡŒ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ. Если ΠΆΠ΅ расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΡ€ΠΈΠ²Ρ‹ΠΌΠΈ отсутствуСт, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ ΠΎΠ±Π΅ ΠΊΡ€ΠΈΠ²Ρ‹Π΅ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‚ Π½ΠΈΠ·ΠΊΠΎΠΌΡƒ ΡƒΡ€ΠΎΠ²Π½ΡŽ точности, Π·Π½Π°Ρ‡ΠΈΡ‚, наша модСль ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ нСдостаточной ΠΎΠ±ΡƒΡ‡Π°Π΅ΠΌΠΎΡΡ‚ΡŒΡŽ. Π’ этом случаС для ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΡ‚ΡŒ Π΅ΠΌΠΊΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

8. Ансамбли Π³Π»ΡƒΠ±ΠΎΠΊΠΈΡ… сСтСй

Π Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ стадии обучСния ΠΎΠ΄Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ

Π’ Ρ‚ΠΎΠΌ случаС, ΠΊΠΎΠ³Π΄Π° процСсс обучСния являСтся ΠΎΡ‡Π΅Π½ΡŒ Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΊ рСсурсам, ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ Π² ансамбль Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ стадии обучСния ΠΎΠ΄Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ (checkpoint), Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, послС ΠΊΠ°ΠΆΠ΄ΠΎΠΉ эпохи. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Π½Π΅ обСспСчиваСт большого разнообразия, Π½ΠΎ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Ρ‚ΡŒ достаточно Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€:

Π’ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡Π°Ρ… Π΄Π°Π½Π½Ρ‹Π΅ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎ распрСдСлСны ΠΏΠΎ классам, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ классы ΠΈΠΌΠ΅ΡŽΡ‚ большоС количСство ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ – Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ мСньшСС количСство. Как сообщаСтся Π² Π½Π΅Π΄Π°Π²Π½Π΅ΠΌ Π΄ΠΎΠΊΠ»Π°Π΄Π΅ , нСсбалансированныС ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ ΡΠ΅Ρ€ΡŒΠ΅Π·Π½ΠΎΠ΅ Π½Π΅Π³Π°Ρ‚ΠΈΠ²Π½ΠΎΠ΅ влияниС Π½Π° ΠΎΠ±Ρ‰ΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π³Π»ΡƒΠ±ΠΎΠΊΠΈΡ… свСрточных сСтСй. ΠŸΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠΈΠΌ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ этой ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ являСтся Π΄ΡƒΠ±Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ Π² классах с ΠΌΠ°Π»Ρ‹ΠΌ количСством ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, ΠΈΠ»ΠΈ ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΈΠ· классов с большим количСством ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ. Π”Ρ€ΡƒΠ³ΠΈΠΌ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π΄Π°Π½Π½ΠΎΠΉ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΌΡ‹ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠ»ΠΈ Π² контСкстС описанного Π²Ρ‹ΡˆΠ΅ сорСвнования, являСтся ΠΊΠ°Π΄Ρ€ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ исходныС изобраТСния ΠΊΡƒΠ»ΡŒΡ‚ΡƒΡ€Π½Ρ‹Ρ… событий Π±Ρ‹Π»ΠΈ Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎ распрСдСлСны ΠΏΠΎ классам, ΠΌΡ‹ ΠΈΠ·Π²Π»Π΅ΠΊΠ»ΠΈ Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚Ρ‹ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ для классов с ΠΌΠ°Π»Ρ‹ΠΌ количСством ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… экзСмпляров. Π‘ ΠΎΠ΄Π½ΠΎΠΉ стороны, этот ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ обСспСчил Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, Π° с Π΄Ρ€ΡƒΠ³ΠΎΠΉ – ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ» Ρ€Π΅ΡˆΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ дисбаланса.

Для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ описанной ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΡΡ‚Ρ€Π°Ρ‚Π΅Π³ΠΈΡŽ Ρ‚ΠΎΠ½ΠΊΠΎΠΉ настройки (fine-tuning) ΠΏΡ€Π΅Π΄ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π’ частности, исходный ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° Π΄Π²Π΅ части Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ΄Π½Π° Ρ‡Π°ΡΡ‚ΡŒ Π±ΡƒΠ΄Π΅Ρ‚ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ классы, прСдставлСнныС большим количСством ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π° другая – классы, прСдставлСнныС ΠΌΠ°Π»Ρ‹ΠΌ количСством ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ. КаТдая Ρ‡Π°ΡΡ‚ΡŒ Π±ΡƒΠ΄Π΅Ρ‚ ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ сбалансированной. ПослС этого сначала Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ модСль Π½Π° классах с большим количСством ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π° Π·Π°Ρ‚Π΅ΠΌ – Π½Π° классах с ΠΌΠ°Π»Ρ‹ΠΌ количСством ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ.

ΠŸΠ΅Ρ€Π΅Π²ΠΎΠ΄ Бтанислава ΠŸΠ΅Ρ‚Ρ€Π΅Π½ΠΊΠΎ

Π§Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ искусствСнный Π½Π΅ΠΉΡ€ΠΎΠ½? ΠŸΡ€ΠΎΡΡ‚Ρ‹ΠΌΠΈ словами, ΠΎΠ½ считаСт Π²Π·Π²Π΅ΡˆΠ΅Π½Π½ΡƒΡŽ сумму Π½Π° своих Π²Ρ…ΠΎΠ΄Π°Ρ…, добавляСт смСщСниС (bias) ΠΈ Ρ€Π΅ΡˆΠ°Π΅Ρ‚, слСдуСт это Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΈΡΠΊΠ»ΡŽΡ‡Π°Ρ‚ΡŒ ΠΈΠ»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ дальшС (Π΄Π°, функция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Ρ‚Π°ΠΊ ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚, Π½ΠΎ Π΄Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΠΎΠΉΠ΄Π΅ΠΌ ΠΏΠΎ порядку).

Ѐункция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ опрСдСляСт Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π° Π² зависимости ΠΎΡ‚ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° взвСшСнной суммы Π²Ρ…ΠΎΠ΄ΠΎΠ² ΠΈ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ значСния.

Рассмотрим Π½Π΅ΠΉΡ€ΠΎΠ½:

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Y ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π»ΡŽΠ±Ρ‹ΠΌ Π² Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π΅ ΠΎΡ‚ -бСсконСчности Π΄ΠΎ +бСсконСчности. Π’ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½ Π½Π΅ Π·Π½Π°Π΅Ρ‚ Π³Ρ€Π°Π½ΠΈΡ†Ρƒ, послС ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ слСдуСт активация. ΠžΡ‚Π²Π΅Ρ‚ΠΈΠΌ Π½Π° вопрос, ΠΊΠ°ΠΊ ΠΌΡ‹ Ρ€Π΅ΡˆΠ°Π΅ΠΌ, Π΄ΠΎΠ»ΠΆΠ΅Π½ Π»ΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½ Π±Ρ‹Ρ‚ΡŒ Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½ (ΠΌΡ‹ рассматриваСм ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ΅ΠΌ провСсти аналогию с Π±ΠΈΠΎΠ»ΠΎΠ³ΠΈΠ΅ΠΉ. ИмСнно Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΌΠΎΠ·Π³, Π° ΠΌΠΎΠ·Π³ β€” Ρ…ΠΎΡ€ΠΎΡˆΠ΅Π΅ ΡΠ²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΠΎ Ρ€Π°Π±ΠΎΡ‚Ρ‹ слоТной ΠΈ Ρ€Π°Π·ΡƒΠΌΠ½ΠΎΠΉ систСмС).

Для этой Ρ†Π΅Π»ΠΈ Ρ€Π΅ΡˆΠΈΠ»ΠΈ Π΄ΠΎΠ±Π°Π²Π»ΡΡ‚ΡŒ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΡƒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ. Она провСряСт ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½Π½ΠΎΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Y Π½Π° ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚ Ρ‚ΠΎΠ³ΠΎ, Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π»ΠΈ внСшниС связи Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ этот Π½Π΅ΠΉΡ€ΠΎΠ½ ΠΊΠ°ΠΊ Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ, ΠΈΠ»ΠΈ Π΅Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ³Π½ΠΎΡ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.

БтупСнчатая функция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ

ΠŸΠ΅Ρ€Π²ΠΎΠ΅, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ Π² Π³ΠΎΠ»ΠΎΠ²Ρƒ, это вопрос ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π³Ρ€Π°Π½ΠΈΡ†Π΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ для Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ. Если Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Y большС Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ значСния, считаСм Π½Π΅ΠΉΡ€ΠΎΠ½ Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌ. Π’ ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½ΠΎΠΌ случаС Π³ΠΎΠ²ΠΎΡ€ΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½ Π½Π΅Π°ΠΊΡ‚ΠΈΠ²Π΅Π½. Вакая схСма Π΄ΠΎΠ»ΠΆΠ½Π° ΡΡ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ, Π½ΠΎ сначала Π΄Π°Π²Π°ΠΉΡ‚Π΅ Π΅Ρ‘ Ρ„ΠΎΡ€ΠΌΠ°Π»ΠΈΠ·ΡƒΠ΅ΠΌ.

  • Ѐункция А = Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½Π°, Ссли Y > Π³Ρ€Π°Π½ΠΈΡ†Π°, ΠΈΠ½Π°Ρ‡Π΅ Π½Π΅Ρ‚.
  • Π”Ρ€ΡƒΠ³ΠΎΠΉ способ: A = 1, Ссли Y > Π³Ρ€Π°Π½ΠΈΡ†Π°, ΠΈΠ½Π°Ρ‡Π΅ А = 0.

Ѐункция, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΡ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‡Ρ‚ΠΎ создали, называСтся ступСнчатой. Вакая функция прСдставлСна Π½Π° рисункС Π½ΠΈΠΆΠ΅.

Ѐункция ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ 1 (Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½Π°), ΠΊΠΎΠ³Π΄Π° Y > 0 (Π³Ρ€Π°Π½ΠΈΡ†Π°), ΠΈ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ 0 (Π½Π΅ Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½Π°) Π² ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½ΠΎΠΌ случаС.

ΠœΡ‹ создали Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΡƒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ для Π½Π΅ΠΉΡ€ΠΎΠ½Π°. Π­Ρ‚ΠΎ простой способ, ΠΎΠ΄Π½Π°ΠΊΠΎ Π² Π½Ρ‘ΠΌ Π΅ΡΡ‚ΡŒ нСдостатки. Рассмотрим ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΡƒΡŽ ΡΠΈΡ‚ΡƒΠ°Ρ†ΠΈΡŽ.

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ создаСм Π±ΠΈΠ½Π°Ρ€Π½Ρ‹ΠΉ классификатор β€” модСль, которая Π΄ΠΎΠ»ΠΆΠ½Π° Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ΡŒ β€œΠ΄Π°β€ ΠΈΠ»ΠΈ β€œΠ½Π΅Ρ‚β€ (Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½ ΠΈΠ»ΠΈ Π½Π΅Ρ‚). БтупСнчатая функция сдСлаСт это Π·Π° вас β€” ΠΎΠ½Π° Π² точности Π²Ρ‹Π²ΠΎΠ΄ΠΈΡ‚ 1 ΠΈΠ»ΠΈ 0.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ прСдставим случай, ΠΊΠΎΠ³Π΄Π° трСбуСтся большСС количСство Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² для классификации ΠΌΠ½ΠΎΠ³ΠΈΡ… классов : класс1, класс2, класс3 ΠΈ Ρ‚Π°ΠΊ Π΄Π°Π»Π΅Π΅. Π§Ρ‚ΠΎ Π±ΡƒΠ΄Π΅Ρ‚, Ссли Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌΠΈ окаТутся большС Ρ‡Π΅ΠΌ 1 Π½Π΅ΠΉΡ€ΠΎΠ½? ВсС Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ ΠΈΠ· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Π²Ρ‹Π²Π΅Π΄ΡƒΡ‚ 1. Π’ Ρ‚Π°ΠΊΠΎΠΌ случаС ΠΏΠΎΡΠ²Π»ΡΡŽΡ‚ΡΡ вопросы ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊΠΎΠΉ класс Π΄ΠΎΠ»ΠΆΠ΅Π½ Π² ΠΈΡ‚ΠΎΠ³Π΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ для Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°.

ΠœΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ активировался Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄ΠΈΠ½ Π½Π΅ΠΉΡ€ΠΎΠ½, Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ… Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² Π±Ρ‹Π»ΠΈ Ρ€Π°Π²Π½Π° Π½ΡƒΠ»ΡŽ (Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² этом случаС ΠΌΠΎΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ ΡƒΠ²Π΅Ρ€Π΅Π½Π½Ρ‹ΠΌ, Ρ‡Ρ‚ΠΎ ΡΠ΅Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ опрСдСляСт класс). Π’Π°ΠΊΡƒΡŽ ΡΠ΅Ρ‚ΡŒ Ρ‚Ρ€ΡƒΠ΄Π½Π΅Π΅ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΈ Π΄ΠΎΠ±ΠΈΠ²Π°Ρ‚ΡŒΡΡ сходимости. Если активационная функция Π½Π΅ бинарная, Ρ‚ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ значСния β€œΠ°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½ Π½Π° 50%”, β€œΠ°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½ Π½Π° 20%” ΠΈ Ρ‚Π°ΠΊ Π΄Π°Π»Π΅Π΅. Если Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ нСсколько Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ², ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½ с наибольшим Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ (Π»ΡƒΡ‡ΡˆΠ΅, ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ это Π±Ρ‹Π»Π° softmax функция, Π° Π½Π΅ max . Но ΠΏΠΎΠΊΠ° Π½Π΅ Π±ΡƒΠ΄Π΅ΠΌ Π·Π°Π½ΠΈΠΌΠ°Ρ‚ΡŒΡΡ этими вопросами).

Но Π² Ρ‚Π°ΠΊΠΎΠΌ случаС, ΠΊΠ°ΠΊ ΠΈ Ρ€Π°Π½Π΅Π΅, Ссли Π±ΠΎΠ»Π΅Π΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Π° говорят β€œΠ°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½ Π½Π° 100%”, ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° ΠΏΠΎ ΠΏΡ€Π΅ΠΆΠ½Π΅ΠΌΡƒ остаСтся. Π’Π°ΠΊ ΠΊΠ°ΠΊ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½Ρ‹Π΅ значСния Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π°, процСсс обучСния ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ Π±ΠΎΠ»Π΅Π΅ Π³Π»Π°Π΄ΠΊΠΎ ΠΈ быстро, Π° Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ появлСния Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² Π²ΠΎ врСмя Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΠΈ сниТаСтся ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ со ступСнчатой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ (хотя это зависит ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Π²Ρ‹ ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚Π΅ ΠΈ Π½Π° ΠΊΠ°ΠΊΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…).

ΠœΡ‹ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ»ΠΈΡΡŒ, Ρ‡Ρ‚ΠΎ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½Ρ‹Π΅ значСния Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ (аналоговая функция), Π° Π½Π΅ просто Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ΡŒ β€œΠ°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½β€ ΠΈΠ»ΠΈ Π½Π΅Ρ‚ (бинарная функция).

ΠŸΠ΅Ρ€Π²ΠΎΠ΅, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ Π² Π³ΠΎΠ»ΠΎΠ²Ρƒ β€” линСйная функция.

ЛинСйная функция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ

A = cx

ЛинСйная функция прСдставляСт собой ΠΏΡ€ΡΠΌΡƒΡŽ линию ΠΈ ΠΏΡ€ΠΎΠΏΠΎΡ€Ρ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Π° Π²Ρ…ΠΎΠ΄Ρƒ (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ взвСшСнной суммС Π½Π° этом Π½Π΅ΠΉΡ€ΠΎΠ½Π΅).

Π’Π°ΠΊΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ позволяСт ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ спСктр Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, Π° Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π±ΠΈΠ½Π°Ρ€Π½Ρ‹ΠΉ ΠΎΡ‚Π²Π΅Ρ‚. МоТно ΡΠΎΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ нСсколько Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² вмСстС ΠΈ, Ссли Π±ΠΎΠ»Π΅Π΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Π° Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΠΎΠ²Π°Π½ΠΎ, Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ принимаСтся Π½Π° основС примСнСния ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ max (ΠΈΠ»ΠΈ softmax). Но ΠΈ здСсь Π½Π΅ Π±Π΅Π· ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ.

Если Π²Ρ‹ Π·Π½Π°ΠΊΠΎΠΌΡ‹ с ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ для обучСния, Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π·Π°ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ для этой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ производная Ρ€Π°Π²Π½Π° постоянной.

ΠŸΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½Π°Ρ ΠΎΡ‚ A=cx ΠΏΠΎ x Ρ€Π°Π²Π½Π° с . Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ Π½ΠΈΠΊΠ°ΠΊ Π½Π΅ связан с Π₯ . Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ являСтся постоянным Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠΌ, Π° спуск производится ΠΏΠΎ постоянному Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρƒ. Если производится ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎΠ΅ прСдсказаниС, Ρ‚ΠΎ измСнСния, сдСланныС ошибки, Ρ‚ΠΎΠΆΠ΅ постоянны ΠΈ Π½Π΅ зависят ΠΎΡ‚ измСнСния Π½Π° Π²Ρ…ΠΎΠ΄Π΅ delta(x).

Π­Ρ‚ΠΎ Π½Π΅ Π΅ΡΡ‚ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ (Π½Π΅ всСгда, Π½ΠΎ Π² Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв). Но сущСствуСт ΠΈ другая ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°. Рассмотрим связанныС слои. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ слой активируСтся Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ. Π—Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ с этой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΈΠ΄Π΅Ρ‚ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ слой Π² качСствС Π²Ρ…ΠΎΠ΄Π°, Π²Ρ‚ΠΎΡ€ΠΎΠΉ слой считаСт Π²Π·Π²Π΅ΡˆΠ΅Π½Π½ΡƒΡŽ сумму Π½Π° своих Π²Ρ…ΠΎΠ΄Π°Ρ… ΠΈ, Π² свою ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ, Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Π² зависимости ΠΎΡ‚ Π΄Ρ€ΡƒΠ³ΠΎΠΉ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ.

НС ΠΈΠΌΠ΅Π΅Ρ‚ значСния, сколько слоСв ΠΌΡ‹ ΠΈΠΌΠ΅Π΅ΠΌ. Если всС ΠΎΠ½ΠΈ ΠΏΠΎ своСй ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π΅ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅, Ρ‚ΠΎ Ρ„ΠΈΠ½Π°Π»ΡŒΠ½Π°Ρ функция Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Π² послСднСм слоС Π±ΡƒΠ΄Π΅Ρ‚ просто Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ ΠΎΡ‚ Π²Ρ…ΠΎΠ΄ΠΎΠ² Π½Π° ΠΏΠ΅Ρ€Π²ΠΎΠΌ слоС! ΠžΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚Π΅ΡΡŒ Π½Π° ΠΌΠ³Π½ΠΎΠ²Π΅Π½ΠΈΠ΅ ΠΈ ΠΎΠ±Π΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ эту ΠΌΡ‹ΡΠ»ΡŒ.

Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π΄Π²Π° слоя (ΠΈΠ»ΠΈ N слоСв) ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π·Π°ΠΌΠ΅Π½Π΅Π½Ρ‹ ΠΎΠ΄Π½ΠΈΠΌ слоСм. ΠœΡ‹ потСряли Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Π΄Π΅Π»Π°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€Ρ‹ ΠΈΠ· слоСв. НС Π²Π°ΠΆΠ½ΠΎ, ΠΊΠ°ΠΊ ΠΌΡ‹ стэкаСм, вся всС Ρ€Π°Π²Π½ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠΎΠ΄ΠΎΠ±Π½Π° ΠΎΠ΄Π½ΠΎΠΌΡƒ слою с Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ (комбинация Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ β€” другая линСйная функция ).

Π‘ΠΈΠ³ΠΌΠΎΠΈΠ΄Π°

Π‘ΠΈΠ³ΠΌΠΎΠΈΠ΄Π° выглядит Π³Π»Π°Π΄ΠΊΠΎΠΉ ΠΈ ΠΏΠΎΠ΄ΠΎΠ±Π½Π° ступСнчатой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ. Рассмотрим Π΅Ρ‘ прСимущСства.

Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, сигмоида β€” Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Π° ΠΏΠΎ своСй ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π΅, Π° комбинация Ρ‚Π°ΠΊΠΈΡ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚ Ρ‚ΠΎΠΆΠ΅ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ. Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΡ‚ΡΠΊΠ°Ρ‚ΡŒ слои.

Π•Ρ‰Π΅ ΠΎΠ΄Π½ΠΎ достоинство Ρ‚Π°ΠΊΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ β€” ΠΎΠ½Π° Π½Π΅ Π±ΠΈΠ½Π°Ρ€Π½Π°, Ρ‡Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΡŽ Π°Π½Π°Π»ΠΎΠ³ΠΎΠ²ΠΎΠΉ, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ ступСнчатой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ. Для сигмоиды Ρ‚Π°ΠΊΠΆΠ΅ Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π΅Π½ Π³Π»Π°Π΄ΠΊΠΈΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚.

Если Π²Ρ‹ Π·Π°ΠΌΠ΅Ρ‚ΠΈΠ»ΠΈ, Π² Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ X ΠΎΡ‚ -2 Π΄ΠΎ 2 значСния Y мСняСтся ΠΎΡ‡Π΅Π½ΡŒ быстро . Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ любоС ΠΌΠ°Π»ΠΎΠ΅ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ значСния X Π² этой области Π²Π»Π΅Ρ‡Π΅Ρ‚ сущСствСнноС ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ значСния Y . Π’Π°ΠΊΠΎΠ΅ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΡƒΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π½Π° Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Y ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΡŽ ΠΏΡ€ΠΈΠΆΠΈΠΌΠ°Ρ‚ΡŒΡΡ ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· ΠΊΡ€Π°Π΅Π² ΠΊΡ€ΠΈΠ²ΠΎΠΉ.

Π‘ΠΈΠ³ΠΌΠΎΠΈΠ΄Π° Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ выглядит подходящСй Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ для Π·Π°Π΄Π°Ρ‡ классификации. Она ΡΡ‚Ρ€Π΅ΠΌΠΈΡ‚ΡŒΡΡ привСсти значСния ΠΊ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· сторон ΠΊΡ€ΠΈΠ²ΠΎΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΊ Π²Π΅Ρ€Ρ…Π½Π΅ΠΌΡƒ ΠΏΡ€ΠΈ Ρ…=2 ΠΈ Π½ΠΈΠΆΠ½Π΅ΠΌΡƒ ΠΏΡ€ΠΈ Ρ…=-2 ). Π’Π°ΠΊΠΎΠ΅ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ позволяСт Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ Ρ‡Π΅Ρ‚ΠΊΠΈΠ΅ Π³Ρ€Π°Π½ΠΈΡ†Ρ‹ ΠΏΡ€ΠΈ прСдсказании.

Π”Ρ€ΡƒΠ³ΠΎΠ΅ прСимущСство сигмоиды Π½Π°Π΄ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ. Π’ ΠΏΠ΅Ρ€Π²ΠΎΠΌ случаС ΠΈΠΌΠ΅Π΅ΠΌ фиксированный Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ β€” , Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ линСйная функция измСняСтся Π² ΠΏΡ€Π΅Π΄Π΅Π»Π°Ρ… (-inf, inf). Π’Π°ΠΊΠΎΠ΅ свойство сигмоиды ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π½Π΅ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ ошибкам Π² случаС Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ.

БСгодня сигмоида являСтся ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· самых частых Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π² нСйросСтях. Но ΠΈ Ρƒ Π½Π΅Ρ‘ Π΅ΡΡ‚ΡŒ нСдостатки, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ стоит ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅.

Π’Ρ‹ ΡƒΠΆΠ΅ ΠΌΠΎΠ³Π»ΠΈ Π·Π°ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΈΠΈ ΠΊ ΠΊΠΎΠ½Ρ†Π°ΠΌ сигмоиды значСния Y ΠΈΠΌΠ΅ΡŽΡ‚ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΡŽ слабо Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½Π° измСнСния Π² X . Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ Π² Ρ‚Π°ΠΊΠΈΡ… областях ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ малСнькиС значСния. А это, Π² свою ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ, ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°ΠΌ с Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠΌ исчСзновСния. Рассмотрим ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ, Ρ‡Ρ‚ΠΎ происходит ΠΏΡ€ΠΈ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΊ ΠΏΠΎΡ‡Ρ‚ΠΈ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ части ΠΊΡ€ΠΈΠ²ΠΎΠΉ Π½Π° ΠΎΠ±Π΅ΠΈΡ… сторонах.

Π’ Ρ‚Π°ΠΊΠΎΠΌ случаС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π° ΠΌΠ°Π»ΠΎ ΠΈΠ»ΠΈ исчСзаСт (Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ сущСствСнного измСнСния ΠΈΠ·-Π·Π° Ρ‡Ρ€Π΅Π·Π²Ρ‹Ρ‡Π°ΠΉΠ½ΠΎ ΠΌΠ°Π»ΠΎΠ³ΠΎ значСния). ΠΠ΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ отказываСтся ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ дальшС ΠΈΠ»ΠΈ Π΄Π΅Π»Π°Π΅Ρ‚ это ΠΊΡ€Π°ΠΉΠ½Π΅ ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎ (Π² зависимости ΠΎΡ‚ способа использования ΠΈΠ»ΠΈ Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚/вычислСниС Π½Π΅ Π½Π°Ρ‡Π½Π΅Ρ‚ ΡΡ‚Ρ€Π°Π΄Π°Ρ‚ΡŒ ΠΎΡ‚ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠΉ Π½Π° Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ с ΠΏΠ»Π°Π²Π°ΡŽΡ‰Π΅ΠΉ Ρ‚ΠΎΡ‡ΠΊΠΎΠΉ). Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π½Π°Π΄ этими ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°ΠΌΠΈ, Π° сигмоида всё Π΅Ρ‰Ρ‘ ΠΎΡ‡Π΅Π½ΡŒ популярна для Π·Π°Π΄Π°Ρ‡ классификации.

Π•Ρ‰Π΅ ΠΎΠ΄Π½Π° часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠ°Ρ активационная функция β€” гипСрболичСский тангСнс.

ГипСрболичСский тангСнс ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆ Π½Π° сигмоиду. И Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, это скоррСктированная сигмоидная функция.

ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ такая функция ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚Π΅ ΠΆΠ΅ характСристики, Ρ‡Ρ‚ΠΎ ΠΈ Ρƒ сигмоиды, рассмотрСнной Ρ€Π°Π½Π΅Π΅. Π•Ρ‘ ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π° Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Π°, ΠΎΠ½Π° Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ слоёв, Π° Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ -(-1, 1). ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π½Π΅Ρ‚ смысла Π±Π΅ΡΠΏΠΎΠΊΠΎΠΈΡ‚ΡŒΡΡ, Ρ‡Ρ‚ΠΎ активационная функция пСрСгрузится ΠΎΡ‚ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ. Однако стоит ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ Ρ‚Π°Π½Π³Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ большС, Ρ‡Π΅ΠΌ Ρƒ сигмоиды (производная ΠΊΡ€ΡƒΡ‡Π΅). РСшСниС ΠΎ Ρ‚ΠΎΠΌ, Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π»ΠΈ сигмоиду ΠΈΠ»ΠΈ тангСнс, зависит ΠΎΡ‚ Π²Π°ΡˆΠΈΡ… Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Π½ΠΈΠΉ ΠΊ Π°ΠΌΠΏΠ»ΠΈΡ‚ΡƒΠ΄Π΅ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°. Π’Π°ΠΊΠΆΠ΅ ΠΊΠ°ΠΊ ΠΈ сигмоидС, гипСрболичСскому тангСнсу свойствСнная ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° исчСзновСния Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°.

ВангСнс Ρ‚Π°ΠΊΠΆΠ΅ являСтся ΠΎΡ‡Π΅Π½ΡŒ популярной ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ.

ReLu

Π‘Π»Π΅Π΄ΡƒΡŽΡ‰Π°Ρ Π² нашСм спискС β€” активационная функция ReLu,

A(x) = max(0,x)

ΠŸΠΎΠ»ΡŒΠ·ΡƒΡΡΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ΠΌ, становится понятно, Ρ‡Ρ‚ΠΎ ReLu Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ρ… , Ссли Ρ… ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΈ 0 Π² ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½ΠΎΠΌ случаС. Π‘Ρ…Π΅ΠΌΠ° Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π° Π½ΠΈΠΆΠ΅.

На ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ взгляд каТСтся, Ρ‡Ρ‚ΠΎ ReLu ΠΈΠΌΠ΅Π΅Ρ‚ всС Ρ‚Π΅ ΠΆΠ΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹, Ρ‡Ρ‚ΠΎ ΠΈ линСйная функция, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ReLu Π»ΠΈΠ½Π΅ΠΉΠ½Π° Π² ΠΏΠ΅Ρ€Π²ΠΎΠΌ ΠΊΠ²Π°Π΄Ρ€Π°Π½Ρ‚Π΅. Но Π½Π° самом Π΄Π΅Π»Π΅, ReLu Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Π° ΠΏΠΎ своСй ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π΅, Π° комбинация ReLu Ρ‚Π°ΠΊΠΆΠ΅ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Π° ! (На самом Π΄Π΅Π»Π΅, такая функция являСтся Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΌ аппроксиматором , Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ любая функция ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ аппроксимирована ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠ΅ΠΉ ReLu). Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΡ‚ΡΠΊΠ°Ρ‚ΡŒ слои. ΠžΠ±Π»Π°ΡΡ‚ΡŒ допустимых Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ReLu β€” }