728x90

AI 9

AI_Basic) ์—ญ์ „ํŒŒ(Backpropagtaion) : ํ•™์Šต๋ถ€ํ„ฐ ์—ญ์ „ํŒŒ๊ฐ€ ์–ด๋””์— ์‚ฌ์šฉ๋˜๋Š”์ง€๊นŒ์ง€ ์ฝ”๋“œ์œ„์ฃผ

์„ ํ˜•์‹์˜ ๊ฒฝ์šฐ ์ดํ•ด๊ฐ€ ์ง๊ด€์ ์ด๋‚˜ ๊ทธ๊ฒƒ๋งŒ์„ ๊ฐ€์ง€๊ณ  ๊ฐ‘์ž๊ธฐ CNN ๋ชจ๋ธ์— ๋Œ€์ž…ํ•˜๋ฉด ๋จธ๋ฆฌ๊ฐ€ ๋ตํ•ด์ง€๋Š” ๊ฒฝํ—˜์„ ํ•œ์ ์ด ์žˆ์„๊ฒƒ์ด๋‹ค. ๊ทธ๋ž˜์„œ ์˜ค๋Š˜์€ CNN ๊ธฐ๋ฐ˜ ํ•™์Šต ๊ณผ์ •์—์„œ ์—ญ์ „ํŒŒ๊ฐ€ ์–ด๋–ป๊ฒŒ ๋™์ž‘ํ•˜๋Š”์ง€ ์•Œ์•„๋ณด๊ธฐ ์œ„ํ•ด ์ •๋ฆฌํ• ๊ฒธ ๊ธ€์„ ์ž‘์„ฑํ–ˆ๋‹ค.CNN ๊ธฐ๋ฐ˜ ๋จธ์‹ ๋Ÿฌ๋‹ ์‹œ์Šคํ…œ์˜ ํ•™์Šต ๊ณผ์ •๊ณผ ์—ญ์ „ํŒŒ์˜ ์ดํ•ด๋จธ์‹ ๋Ÿฌ๋‹ ์‹œ์Šคํ…œ์˜ ํ•™์Šต ๊ณผ์ •์€ ๋ฐ์ดํ„ฐ ์ค€๋น„, ๋ชจ๋ธ ์ •์˜, ์ˆœ์ „ํŒŒ, ์†์‹ค ๊ณ„์‚ฐ, ์—ญ์ „ํŒŒ, ๊ทธ๋ฆฌ๊ณ  ํŒŒ๋ผ๋ฏธํ„ฐ ์—…๋ฐ์ดํŠธ์˜ ๋‹จ๊ณ„๋กœ ์ด๋ฃจ์–ด์ง„๋‹ค. ์ด๋ฒˆ์—๋Š” CNN(Convolutional Neural Network) ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ณ , Cross Entropy ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์ ์šฉํ•˜์—ฌ ๊ฐ ๋‹จ๊ณ„๋ฅผ ์‚ดํŽด๋ณด๋„๋ก ํ•˜์ž.1. ๋ฐ์ดํ„ฐ ์ค€๋น„CNN ๋ชจ๋ธ์€ ์ฃผ๋กœ ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋ฏ€๋กœ, ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์…‹์„ ์ค€๋น„ํ•ด์•ผ ํ•œ๋‹ค. PyTorch์˜ torchvision ..

AI 2024.12.02

ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ์…‹์€ ์–ด๋–ป๊ฒŒ ๊ตฌ์ถ•ํ• ๊นŒ ?

๋ฐ์ดํ„ฐ๋ฅผ ์Œ“์•„๋‘๊ณ  ์žˆ์œผ๋‚˜ ๋ฐ์ดํ„ฐ ๊ฐ€์น˜๋ฅผ ๋ฐœ๊ตดํ•ด๋‚ด๋ ค๋Š” ๋…ธ๋ ฅ์„ ํ•˜์ง€ ์•Š๋˜ ์ง‘๋‹จ์ด ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ์…‹์„ ๋งŒ๋“ค๊ณ  ์‹ถ์–ดํ•œ๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•ด์•ผํ• ๊นŒ ?์ด๋Ÿฐ ๊ณ ๋ฏผ์„ ํ•˜๊ณ  ์žˆ๋Š” ์‚ฌ๋žŒ์ด๋ผ๋ฉด, ๋‚˜์™€ ๊ฐ™์ด ๊ณ ๋ฏผ์„ ํ–ˆ์œผ๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™์€ ๋งˆ์Œ์— ๊ธ€์„ ์ž‘์„ฑํ•จ. ์ตœ๊ทผ MLOps ๊นŒ์ง€๋Š” ์•„๋‹ˆ์ง€๋งŒ, ์•„๋ฌด๊ฒƒ๋„ ์—†๋Š” ํ™˜๊ฒฝ์—์„œ ์‚ฌ์šฉ์ž ์นœํ™”์  STT ๋ฅผ ๋ฝ‘์•„๋‚ด์•ผํ•˜๋Š” ์ƒํ™ฉ์— ์ง๋ฉดํ–ˆ๋‹ค. ํ• ๊ฑฐ๋ผ๋ฉด ์ œ๋Œ€๋กœ ํ•˜๊ณ  ์‹ถ์€ ๋งˆ์Œ์— ๊ฐ์„ ์žก๊ณ  ๊ณ ๋ฏผ์„ ํ•ด๋ดค๋‹ค. ์ง„์งœ ์‚ฌ๋žŒ๋“ค์ด '์ž˜' ์“ฐ๊ฒŒ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด์„œ๋Š” ๊ฒฐ๊ณผ๋„ ๋น ๋ฅด๊ฒŒ ๋‚˜์™€์•ผํ•˜๊ณ  ๊ฒฐ๊ณผ๋ฌผ์„ ์ˆ˜์ •ํ•ด์„œ ๋‹ค์‹œ ํ•™์Šต์‹œํ‚ค๋Š” ์žฌํ•™์Šต์˜ ๊ธฐ๋Šฅ๋„ ์žˆ์–ด์•ผ ํ–ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋˜ ์ดˆ๊ธฐ ํ•™์Šต์— ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ๋„ ํ•„์š”ํ–ˆ์œผ๋‹ˆ ์•„์ฃผ ๋ฐ‘๋ฐ”๋‹ฅ ๋ถ€ํ„ฐ ๋ญ”๊ฐ€๋ฅผ ์Œ“์•„์˜ฌ๋ฆฌ๋Š” ๊ฑฐ๋Œ€ํ•œ ์ผ์˜ ์‹œ์ž‘์ด ๋˜๊ฒ ๊ตฌ๋‚˜.. ๋ผ๋Š” ์ƒ๊ฐ์ด ๋“ค์—ˆ๋‹ค. ๊ทผ๋ฐ ๊ฒฐ๊ณผ๋ฌผ์„ '์ž˜' ๋ณด์—ฌ์ฃผ๊ณ  ๋ณด์—ฌ์ค€ ๊ฒฐ..

AI/MLOps 2024.11.12

AI_basic ) ์—ญ์ „ํŒŒ(BackPropagation)

. ์—ญ์ „ํŒŒ 1๋‹จ๊ณ„(BackPropagation Step 1)์ˆœ์ „ํŒŒ๊ฐ€ ์ž…๋ ฅ์ธต์—์„œ ์ถœ๋ ฅ์ธต์œผ๋กœ ํ–ฅํ•œ๋‹ค๋ฉด ์—ญ์ „ํŒŒ๋Š” ๋ฐ˜๋Œ€๋กœ ์ถœ๋ ฅ์ธต์—์„œ ์ž…๋ ฅ์ธต ๋ฐฉํ–ฅ์œผ๋กœ ๊ณ„์‚ฐํ•˜๋ฉด์„œ ๊ฐ€์ค‘์น˜๋ฅผ ์—…๋ฐ์ดํŠธํ•ด๊ฐ‘๋‹ˆ๋‹ค. ์ถœ๋ ฅ์ธต ๋ฐ”๋กœ ์ด์ „์˜ ์€๋‹‰์ธต์„ N์ธต์ด๋ผ๊ณ  ํ•˜์˜€์„ ๋•Œ, ์ถœ๋ ฅ์ธต๊ณผ N์ธต ์‚ฌ์ด์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์—…๋ฐ์ดํŠธํ•˜๋Š” ๋‹จ๊ณ„๋ฅผ ์—ญ์ „ํŒŒ 1๋‹จ๊ณ„, ๊ทธ๋ฆฌ๊ณ  N์ธต๊ณผ N์ธต์˜ ์ด์ „์ธต ์‚ฌ์ด์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์—…๋ฐ์ดํŠธ ํ•˜๋Š” ๋‹จ๊ณ„๋ฅผ ์—ญ์ „ํŒŒ 2๋‹จ๊ณ„๋ผ๊ณ  ํ•ด๋ด…์‹œ๋‹ค.์—ญ์ „ํŒŒ 1๋‹จ๊ณ„์—์„œ ์—…๋ฐ์ดํŠธ ํ•ด์•ผ ํ•  ๊ฐ€์ค‘์น˜๋Š” w5,w6,w7,w8 ์ด 4๊ฐœ์ž…๋‹ˆ๋‹ค. ์›๋ฆฌ ์ž์ฒด๋Š” ๋™์ผํ•˜๋ฏ€๋กœ ์šฐ์„  w5์— ๋Œ€ํ•ด์„œ ๋จผ์ € ์—…๋ฐ์ดํŠธ๋ฅผ ์ง„ํ–‰ํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•์„ ์ˆ˜ํ–‰ํ•˜๋ ค๋ฉด ๊ฐ€์ค‘์น˜ w5๋ฅผ ์—…๋ฐ์ดํŠธ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ∂Etotal / ∂w5๋ฅผ ๊ณ„์‚ฐํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ∂Etotal/∂w5๋ฅผ ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด ๋ฏธ๋ถ„์˜ ์—ฐ์‡„ ๋ฒ•์น™(C..

AI 2024.11.06

AI_Basic ) ์„ ํ˜•ํšŒ๊ท€ ( Linear Regression ) ์ด๋ก ๋ถ€ํ„ฐ ๊ตฌํ˜„ ( OLS, ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ• )

https://ko.wikipedia.org/wiki/%EC%84%A0%ED%98%95_%ED%9A%8C%EA%B7%80 ์„ ํ˜• ํšŒ๊ท€ - ์œ„ํ‚ค๋ฐฑ๊ณผ, ์šฐ๋ฆฌ ๋ชจ๋‘์˜ ๋ฐฑ๊ณผ์‚ฌ์ „์œ„ํ‚ค๋ฐฑ๊ณผ, ์šฐ๋ฆฌ ๋ชจ๋‘์˜ ๋ฐฑ๊ณผ์‚ฌ์ „. ๋…๋ฆฝ๋ณ€์ˆ˜ 1๊ฐœ์™€ ์ข…์†๋ณ€์ˆ˜ 1๊ฐœ๋ฅผ ๊ฐ€์ง„ ์„ ํ˜• ํšŒ๊ท€์˜ ์˜ˆ ํ†ต๊ณ„ํ•™์—์„œ ์„ ํ˜• ํšŒ๊ท€(็ทšๅž‹ๅ›žๆญธ, ์˜์–ด: linear regression)๋Š” ์ข…์† ๋ณ€์ˆ˜ y์™€ ํ•œ ๊ฐœ ์ด์ƒ์˜ ๋…๋ฆฝ ๋ณ€์ˆ˜ (๋˜๋Š” ์„ค๋ช…ko.wikipedia.org ์„ ํ˜•ํšŒ๊ธฐ๋Š” ์ˆ˜์น˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ " ์˜ˆ์ƒ๋˜๋Š” ๊ฐ’์ด 00์ด๋‹ค " ๋ผ๋Š” ์งˆ๋ฌธ์— ๋‹ตํ•˜๊ธฐ ์œ„ํ•œ ์˜์—ญ์ด๋‹ค. ์„ ํ˜•ํšŒ๊ธฐ์—์„œ๋Š” ์˜ˆ์ƒ๊ฐ’(์ถ”์ •๋˜๋Š” ๊ฐ’)์ด ์„ ํ˜•์ผ ๊ฒƒ์ด๋ผ๊ณ  ๊ฐ€์ •ํ•œ๋‹ค. ์˜ˆ์ธก๊ฐ€๋Šฅํ•œ ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ค ๋•Œ ์„ ํ˜•์ด๋ผ๋ฉด,์–ด๋–ค ์„ ํ˜•์˜ ์˜ˆ์ธก๊ฐ€๋Šฅํ•œ ํ•จ์ˆ˜๊ฐ€๋ชฉ์ ์— ๊ฑธ๋งž๋Š” ๊ฒฝํ–ฅ์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š”์ง€๋ฅผ ์ฐพ๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋•Œ ๊ฒฝํ–ฅ์„ฑ์„ ์ฐพ๊ธฐ ..

AI 2024.11.06

MLOps : Kubeflow์™€ MLflow ๋น„๊ต: ์˜จํ”„๋ ˆ๋ฏธ์Šค MLOps ํ™˜๊ฒฝ์—์„œ Kubeflow๊ฐ€ ์ ํ•ฉํ•œ ์ด์œ 

MLOps๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ๊ฐœ๋ฐœ๋ถ€ํ„ฐ ๋ฐฐํฌ ๋ฐ ๊ด€๋ฆฌ๊นŒ์ง€์˜ ๊ณผ์ •์„ ์ž๋™ํ™”ํ•˜๊ณ  ์ตœ์ ํ™”ํ•˜๋Š” ๊ธฐ์ˆ ๋กœ, ์ตœ๊ทผ ๋งŽ์€ ๊ธฐ์—…๋“ค์ด ๋„์ž…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์˜จํ”„๋ ˆ๋ฏธ์Šค ํ™˜๊ฒฝ์—์„œ๋Š” ๋ฐ์ดํ„ฐ ๋ณด์•ˆ๊ณผ ์„ฑ๋Šฅ ๋ฌธ์ œ๋กœ ์ธํ•ด ํด๋ผ์šฐ๋“œ ๋Œ€์‹  ์ž์ฒด ์ธํ”„๋ผ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด Kubeflow์™€ MLflow์™€ ๊ฐ™์€ ๋„๊ตฌ๋“ค์ด ํ™œ์šฉ๋˜๋Š”๋ฐ, ๊ฐ๊ฐ์˜ ํŠน์ง•๊ณผ ์žฅ๋‹จ์ ์„ ์ดํ•ดํ•˜์—ฌ ์ ํ•ฉํ•œ ๋„๊ตฌ๋ฅผ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” Kubeflow์™€ MLflow์˜ ์ฃผ์š” ์ฐจ์ด์ ์„ ์ค‘์‹ฌ์œผ๋กœ ์˜จํ”„๋ ˆ๋ฏธ์Šค ํ™˜๊ฒฝ์—์„œ Kubeflow๋ฅผ ์„ ํƒํ•ด์•ผ ํ•˜๋Š” ์ด์œ ๋ฅผ ์„ค๋ช…ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.๋ชฉ์ฐจKubeflow์™€ MLflow ๊ฐœ์š”Kubeflow์™€ MLflow์˜ ์ฃผ์š” ์ฐจ์ด์ ์˜จํ”„๋ ˆ๋ฏธ์Šค ํ™˜๊ฒฝ์—์„œ Kubeflow๊ฐ€ ์ ํ•ฉํ•œ ์ด์œ ๊ฒฐ๋ก 1. Kubeflow์™€ MLflow ๊ฐœ์š”Ku..

AI/MLOps 2024.11.05

Kubeflow๋กœ MLOps ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•ํ•˜๊ธฐ: ๊ฐœ๋…๋ถ€ํ„ฐ ์‹ค์Šต๊นŒ์ง€

Kubeflow๋Š” Kubernetes ์œ„์—์„œ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ๊ฐœ๋ฐœ ๋ฐ ๋ฐฐํฌ ํŒŒ์ดํ”„๋ผ์ธ(MLOps)์„ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•๋Š” ์˜คํ”ˆ์†Œ์Šค ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค. Kubeflow๋Š” ๋ชจ๋ธ ํ•™์Šต, ์‹คํ—˜, ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹, ๋ฐฐํฌ๊นŒ์ง€ ๋จธ์‹ ๋Ÿฌ๋‹ ํŒŒ์ดํ”„๋ผ์ธ์˜ ๋ชจ๋“  ๋‹จ๊ณ„์—์„œ ์ž๋™ํ™”์™€ ๊ด€๋ฆฌ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•˜์—ฌ, ํšจ์œจ์ ์ธ MLOps ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” Kubeflow์˜ ์ฃผ์š” ๊ธฐ๋Šฅ๊ณผ ๊ฐ ๊ธฐ๋Šฅ์„ ํ™œ์šฉํ•˜์—ฌ MLOps ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋‹จ๊ณ„๋ณ„๋กœ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.๋ชฉ์ฐจKubeflow ๊ฐœ์š”Kubeflow ์„ค์น˜Kubeflow์˜ ์ฃผ์š” ๊ตฌ์„ฑ ์š”์†ŒํŒŒ์ดํ”„๋ผ์ธ ์ƒ์„ฑ ๋ฐ ์‹คํ—˜๋ชจ๋ธ ๋ฐฐํฌ ๋ฐ ๊ด€๋ฆฌKubeflow์˜ ์žฅ๋‹จ์ 1. Kubeflow ๊ฐœ์š”Kubeflow๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ์›Œํฌํ”Œ๋กœ์šฐ์˜ ๋ชจ๋“  ๋‹จ๊ณ„๋ฅผ Kubernetes ์œ„์—์„œ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ๊ฒŒ..

AI/MLOps 2024.11.05

MLOps ์ž…๋ฌธ: ๋จธ์‹ ๋Ÿฌ๋‹ ์šด์˜์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„

MLOps ์ž…๋ฌธ: ๋จธ์‹ ๋Ÿฌ๋‹ ์šด์˜์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์•ˆ๋…•ํ•˜์„ธ์š”, ๋ฐ์ดํ„ฐ ๊ณผํ•™๊ณผ ๋จธ์‹ ๋Ÿฌ๋‹์— ๊ด€์‹ฌ ์žˆ๋Š” ์—ฌ๋Ÿฌ๋ถ„! ์˜ค๋Š˜์€ MLOps๋ผ๋Š” ํฅ๋ฏธ๋กœ์šด ์ฃผ์ œ์— ๋Œ€ํ•ด ์‹ฌ๋„ ์žˆ๊ฒŒ ์ด์•ผ๊ธฐํ•ด๋ณด๋ ค ํ•ฉ๋‹ˆ๋‹ค. MLOps๊ฐ€ ๋ฌด์—‡์ธ์ง€, ์™œ ์ค‘์š”ํ•œ์ง€, ๊ทธ๋ฆฌ๊ณ  ์–ด๋–ป๊ฒŒ ์‹œ์ž‘ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์ƒ์„ธํžˆ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.MLOps๋ž€ ๋ฌด์—‡์ธ๊ฐ€?MLOps๋Š” 'Machine Learning Operations'์˜ ์ค„์ž„๋ง๋กœ, ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ๊ฐœ๋ฐœ๋ถ€ํ„ฐ ๋ฐฐํฌ, ์œ ์ง€๋ณด์ˆ˜๊นŒ์ง€์˜ ์ „์ฒด ์ƒ๋ช…์ฃผ๊ธฐ๋ฅผ ๊ด€๋ฆฌํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์ž…๋‹ˆ๋‹ค. ์ด๋Š” DevOps์˜ ์›์น™์„ ๋จธ์‹ ๋Ÿฌ๋‹ ํ”„๋กœ์ ํŠธ์— ์ ์šฉํ•œ ๊ฒƒ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.MLOps๋Š” ๋‹จ์ˆœํžˆ ๋„๊ตฌ๋‚˜ ๊ธฐ์ˆ ์˜ ์ง‘ํ•ฉ์ด ์•„๋‹™๋‹ˆ๋‹ค. ์ด๋Š” ์กฐ์ง์˜ ๋ฌธํ™”, ํ”„๋กœ์„ธ์Šค, ๊ทธ๋ฆฌ๊ณ  ๊ธฐ์ˆ ์  ์‹คํ–‰์„ ํฌ๊ด„ํ•˜๋Š” ์ด์ฒด์ ์ธ ์ ‘๊ทผ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. MLOps์˜ ๋ชฉํ‘œ๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ๊ฐœ..

AI/MLOps 2024.10.25

Seq2Seq

Seq2Seq ํƒœ๊ทธ: Attention Sequence-to-Sequence Structure ์ž…๋ ฅ ๋œ ์‹œํ€€์Šค๋กœ๋ถ€ํ„ฐ ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์˜ ์‹œํ€€์Šค๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ๋ชจ๋ธ. ์ฑ—๋ด‡๊ณผ ๋ฒˆ์—ญ์ด ๋Œ€ํ‘œ์ ์ธ ์˜ˆ์‹œ์ธ๋ฐ, ์ž…๋ ฅ์‹œํ€€์Šค์™€ ์ถœ๋ ฅ ์‹œํ€€์Šค๋ฅผ ๊ฐ๊ฐ ์งˆ๋ฌธ๊ณผ ๋Œ€๋‹ต์œผ๋กœ ๊ตฌ์„ฑํ•˜๋ฉด ์ฑ—๋ด‡์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๊ณ  ๋ฒˆ์—ญ๊ธฐ๋กœ๋„ ์‚ฌ์šฉ ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ค„์—ฌ์„œ Seq2Seq ๋ถ€๋ฅธ๋‹ค. ๋ฒˆ์—ญ๊ธฐ๊ฐ€ Seq2Seq ๋ฅผ ํ†ตํ•ด ๋ฒˆ์—ญ์„ ํ•˜๋Š” ๊ตฌ์กฐ์ธ๋ฐ, ๊ทธ ์ž์„ธํ•œ ๋‚ด๋ถ€ ๊ตฌ์กฐ๊ฐ€ ์–ด๋–ป๊ฒŒ ์ƒ๊ฒผ๋Š”์ง€๋ฅผ ์•Œ์•„์•ผ ํ•œ๋‹ค. Seq2Seq ๋Š” ์ธ์ฝ”๋”์™€ ๋””์ฝ”๋”๋กœ ์ด๋ฃจ์–ด์ง€๋Š”๋ฐ ์ธ์ฝ”๋”๋Š” ์ž…๋ ฅ ๋ฌธ์žฅ์˜ ๋ชจ๋“  ๋‹จ์–ด๋“ค์„ ์ˆœ์ฐจ์ ์œผ๋กœ ์ž…๋ ฅ๋ฐ›์€ ๋’ค์— ํ•˜๋‚˜์˜ ๋ฒกํ„ฐ , ์˜๋ฏธ๋ฒกํ„ฐ ( Context Vector ) ๋กœ ๋งŒ๋“ ๋‹ค. ์ปจํ…์ŠคํŠธ ๋ฒกํ„ฐ๋กœ ์••์ถ•๋˜๋ฉด ๋””์ฝ”๋”๋กœ ๋ณด๋‚ด๋Š”๋ฐ ๋””์ฝ”๋”๋Š” ์ด ์ปจํ…์ŠคํŠธ ๋ฒกํ„ฐ๋ฅผ ๋””์ฝ”๋”์— ํ•™์Šต ๋œ ๋‹ค..

AI/Machine Learning 2024.01.28

Learning Rate ( lr , ํ•™์Šต๋ฅ  )

ํ•™์Šต๋ฅ  ( Learning Rate ) Gradient Descent :๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ• ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๊ธฐ์šธ๊ธฐ์— ํ•™์Šต๋ฅ ๋˜๋Š” ๋ณดํญ์˜ ์Šค์นผ๋ผ๋ฅผ ๊ณฑํ•ด ๊ฐ’์˜ ๋‹ค์Œ์ง€์ ์„ ๊ฒฐ์ •ํ•œ๋‹ค. :Local Minimum ์— ํšจ์œจ์ ์œผ๋กœ ๋„๋‹ฌ ํ•  ์ˆ˜ ์žˆ๋„๋ก, ๋„ˆ๋ฌด ํฌ์ง€๋„ ์ž‘์ง€๋„ ์•Š์€ ์ ์ ˆํ•œ ๊ฐ’ ( lr ) ์„ ๊ฒฐ์ • ํ•ด์•ผ ํ•จ. ์‚ฌ์šฉ ๋œ ํ•™์Šต๋ฅ ์ด ํšจ์œจ์ ์ธ์ง€, ์ ์ ˆํ•œ์ง€๋Š” ๋‹ค์Œ์˜ ๊ทธ๋ฆผ์„ ํ†ตํ•ด์„œ ์•Œ ์ˆ˜ ์žˆ๋‹ค. low learning rate : ์†์‹ค ๊ฐ์†Œ๊ฐ€ ์„ ํ˜•์˜ ํ˜•ํƒœ๋ฅผ ๋ณด์ด๋ฉฐ ์ฒœ์ฒœํžˆ ํ•™์Šต ๋จ -> ๋„ˆ๋ฌด ๋Š๋ ค์„œ ์ž‘์—…์ด ์™„๋ฃŒ๋˜์ง€ ์•Š์„ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Œ. high leaning rate : ์†์‹ค ๊ฐ์†Œ๊ฐ€ ์ง€์ˆ˜์ ์ธ ํ˜•ํƒœ๋ฅผ ๋ณด์ด๋ฉฐ ๋น ๋ฅธ ํ•™์Šต์ด๊ฑฐ๋‚˜ ์™„์ „ ์ •์ฒด -> ํŠน์ • ๊ฐ’์— ์ˆ˜๋ ดํ•˜์ง€ ์•Š๊ณ  ๋ฐœ์‚ฐ ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ํผ very high leaning rate : ๋งค์šฐ ๋†’..

AI 2020.10.29
728x90