728x90
ํ์ต๋ฅ ( Learning Rate )
- Gradient Descent
:๊ฒฝ์ฌํ๊ฐ๋ฒ ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ์ธ๊ธฐ์ ํ์ต๋ฅ ๋๋ ๋ณดํญ์ ์ค์นผ๋ผ๋ฅผ ๊ณฑํด ๊ฐ์ ๋ค์์ง์ ์ ๊ฒฐ์ ํ๋ค.
:Local Minimum ์ ํจ์จ์ ์ผ๋ก ๋๋ฌ ํ ์ ์๋๋ก, ๋๋ฌด ํฌ์ง๋ ์์ง๋ ์์ ์ ์ ํ ๊ฐ ( lr ) ์ ๊ฒฐ์ ํด์ผ ํจ.
์ฌ์ฉ ๋ ํ์ต๋ฅ ์ด ํจ์จ์ ์ธ์ง, ์ ์ ํ์ง๋ ๋ค์์ ๊ทธ๋ฆผ์ ํตํด์ ์ ์ ์๋ค.
low learning rate : ์์ค ๊ฐ์๊ฐ ์ ํ์ ํํ๋ฅผ ๋ณด์ด๋ฉฐ ์ฒ์ฒํ ํ์ต ๋จ -> ๋๋ฌด ๋๋ ค์ ์์ ์ด ์๋ฃ๋์ง ์์ ๊ฐ๋ฅ์ฑ์ด ์์.
high leaning rate : ์์ค ๊ฐ์๊ฐ ์ง์์ ์ธ ํํ๋ฅผ ๋ณด์ด๋ฉฐ ๋น ๋ฅธ ํ์ต์ด๊ฑฐ๋ ์์ ์ ์ฒด -> ํน์ ๊ฐ์ ์๋ ดํ์ง ์๊ณ ๋ฐ์ฐ ํ ๊ฐ๋ฅ์ฑ์ด ํผ
very high leaning rate : ๋งค์ฐ ๋์ ํ์ต๋ฅ ์ ๊ฒฝ์ฐ์ ๋ฐ๋ผ ์์ค์ ์ฆ๊ฐ์์ผ ๊ฐ์ด ๋ฐ์ฐํ๊ฒ ๋๋ค.
Good learning Rate : ์ ์ ํ ํ์ต ๊ณก์ ์ ํํ๋ก ๊ด์ฐฎ์ ์ฑ๋ฅ์ ๋ธ๋ค.
728x90