. ์ญ์ ํ 1๋จ๊ณ(BackPropagation Step 1)
์์ ํ๊ฐ ์ ๋ ฅ์ธต์์ ์ถ๋ ฅ์ธต์ผ๋ก ํฅํ๋ค๋ฉด ์ญ์ ํ๋ ๋ฐ๋๋ก ์ถ๋ ฅ์ธต์์ ์ ๋ ฅ์ธต ๋ฐฉํฅ์ผ๋ก ๊ณ์ฐํ๋ฉด์ ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธํด๊ฐ๋๋ค. ์ถ๋ ฅ์ธต ๋ฐ๋ก ์ด์ ์ ์๋์ธต์ N์ธต์ด๋ผ๊ณ ํ์์ ๋, ์ถ๋ ฅ์ธต๊ณผ N์ธต ์ฌ์ด์ ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธํ๋ ๋จ๊ณ๋ฅผ ์ญ์ ํ 1๋จ๊ณ, ๊ทธ๋ฆฌ๊ณ N์ธต๊ณผ N์ธต์ ์ด์ ์ธต ์ฌ์ด์ ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธ ํ๋ ๋จ๊ณ๋ฅผ ์ญ์ ํ 2๋จ๊ณ๋ผ๊ณ ํด๋ด ์๋ค.
์ญ์ ํ 1๋จ๊ณ์์ ์ ๋ฐ์ดํธ ํด์ผ ํ ๊ฐ์ค์น๋ w5,w6,w7,w8 ์ด 4๊ฐ์ ๋๋ค. ์๋ฆฌ ์์ฒด๋ ๋์ผํ๋ฏ๋ก ์ฐ์ w5์ ๋ํด์ ๋จผ์ ์ ๋ฐ์ดํธ๋ฅผ ์งํํด๋ณด๊ฒ ์ต๋๋ค. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ์ํํ๋ ค๋ฉด ๊ฐ์ค์น w5๋ฅผ ์ ๋ฐ์ดํธ ํ๊ธฐ ์ํด์ ∂Etotal / ∂w5๋ฅผ ๊ณ์ฐํด์ผ ํฉ๋๋ค.
∂Etotal/∂w5๋ฅผ ๊ณ์ฐํ๊ธฐ ์ํด ๋ฏธ๋ถ์ ์ฐ์ ๋ฒ์น(Chain rule)์ ๋ฐ๋ผ์ ์ด์ ๊ฐ์ด ํ์ด ์ธ ์ ์์ต๋๋ค.
์์ ์์์ ์ฐ๋ณ์ ์ธ ๊ฐ์ ๊ฐ ํญ์ ๋ํด์ ์์๋๋ก ๊ณ์ฐํด๋ด ์๋ค. ์ฐ์ ์ฒซ๋ฒ์งธ ํญ์ ๋ํด์ ๊ณ์ฐํด๋ณด๊ฒ ์ต๋๋ค. ๋ฏธ๋ถ์ ์งํํ๊ธฐ ์ ์ Etotal์ ๊ฐ์ ์๊ธฐํด๋ด ์๋ค. Etotal์ ์์ ์์ ํ๋ฅผ ์งํํ๊ณ ๊ณ์ฐํ๋ ์ ์ฒด ์ค์ฐจ๊ฐ์ ๋๋ค. ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
์ด์ ∂Etotal / ∂o1๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
์ด์ ๋๋ฒ์งธ ํญ์ ์ฃผ๋ชฉํด๋ด ์๋ค. o1์ด๋ผ๋ ๊ฐ์ ์๊ทธ๋ชจ์ด๋ ํจ์์ ์ถ๋ ฅ๊ฐ์ ๋๋ค. ๊ทธ๋ฐ๋ฐ ์๊ทธ๋ชจ์ด๋ ํจ์์ ๋ฏธ๋ถ์ f(x)×(1−f(x))์ ๋๋ค. ์์ผ๋ก์ ๊ณ์ฐ ๊ณผ์ ์์๋ ๊ณ์ํด์ ์๊ทธ๋ชจ์ด๋ ํจ์๋ฅผ ๋ฏธ๋ถํด์ผ ํ๋ ์ํฉ์ด ์๊ธฐ๋ฏ๋ก ๊ธฐ์ตํด๋ก์๋ค. ์ด์ ๋ฐ๋ผ์ ๋๋ฒ์งธ ํญ์ ๋ฏธ๋ถ ๊ฒฐ๊ณผ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
๋ง์ง๋ง์ผ๋ก ์ธ๋ฒ์งธ ํญ์ h1์ ๊ฐ๊ณผ ๋์ผํฉ๋๋ค.
์ฐ๋ณ์ ๋ชจ๋ ํญ์ ๊ณ์ฐํ์์ต๋๋ค. ์ด์ ์ด ๊ฐ์ ๋ชจ๋ ๊ณฑํด์ฃผ๋ฉด ๋ฉ๋๋ค.
์ด์ ์์ ๋ฐฐ์ ๋ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ํตํด ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธ ํ ๋๊ฐ ์์ต๋๋ค! ํ์ดํผํ๋ผ๋ฏธํฐ์ ํด๋น๋๋ ํ์ต๋ฅ (learning rate) α๋ 0.5๋ผ๊ณ ๊ฐ์ ํฉ๋๋ค.
์ด์ ๊ฐ์ ์๋ฆฌ๋ก w6+, w7+, w8+์ ๊ณ์ฐํ ์ ์์ต๋๋ค.