1. Machine Learning
๊ท์น์ ์ง์ ์ฐ์ง ์๊ณ , ๋ฐ์ดํฐ๋ก๋ถํฐ ๊ท์น์ ํ์ตํ๋ ๋ฐฉ๋ฒ
- ์ ๋ ฅ โ ์ถ๋ ฅ ๊ด๊ณ๋ฅผ ํจ์๋ก ํ์ต
- ์ฑ๋ฅ์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ผ๋ก ํ๋จ
1.1 Model
๋จธ์ ๋ฌ๋์์ ๋ชจ๋ธ์ด๋ ์
๋ ฅ์ ์ถ๋ ฅ์ผ๋ก ๋งคํํ๋ ํจ์์ด๋ค.
- ์ ๋ ฅ
- ์์ธก ๊ฐ ๋ฅผ ์ถ๋ ฅํ๋ ํจ์
- ๋ ๋ชจ๋ธ์ด ํ์ตํ๋ ํ๋ผ๋ฏธํฐ
์ฆ, ๋ชจ๋ธ์ ๋ฐ์ดํฐ์ ํจํด์ ํํํ๋ ์ํ์ ํจ์์ด๋ค.
1.2 Learning
ํ์ต์ด๋, ํ๋ผ๋ฏธํฐ ๋ฅผ ์กฐ์ ํ์ฌ ๋ ๋์ ์์ธก์ ํ๋๋ก ๋ง๋๋ ๊ณผ์ ์ด๋ค.
- ์ด๊ธฐ ํ๋ผ๋ฏธํฐ์์ ์์ํด
- ์์ธก์ ์ํํ๊ณ
- ์์ธก์ด ์ผ๋ง๋ ํ๋ ธ๋์ง๋ฅผ ๊ณ์ฐํ ๋ค
- ์ด๋ฅผ ๋ฐํ์ผ๋ก ํ๋ผ๋ฏธํฐ๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ์ ๋ฐ์ดํธ ํ๋ค.
์ฆ, ํ์ต์ ์ข์ ํ์ต ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด๋ค.
1.3 Loss function
๋ชจ๋ธ์ ์์ธก์ด ์ ๋ต๊ณผ ์ผ๋ง๋ ๋ค๋ฅธ์ง ์์น๋ก ํํํ ํจ์์ด๋ค.
- ์์ธก์ด ํ๋ฆด์๋ก Loss๋ ์ปค์ง๊ณ
- ์์ธก์ด ๋ง์์๋ก Loss๋ ์์์ง๋ค.
์์ฃผ ์ฌ์ฉ๋๋ Loss ์์
- ํ๊ท ๋ฌธ์ โ MSE, MAE
- ๋ถ๋ฅ ๋ฌธ์ โ Cross-Entropy
- ์ถ์ฒ ๋ฌธ์ โ Binary Cross-Entorpy, Pairwise, Listwise Loss, Contrastive
์ฆ, Loss Function์ ๋ฌธ์ ์ ํ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ฉฐ, ์ถ์ฒ ๋ฌธ์ ์์๋ ์ ๋์ ์ธ ์์ธก๊ฐ๋ณด๋ค ์๋์ ์ธ ์ ํธ๋ฅผ ๋ฐ์ํ๋ Loss๊ฐ ์์ฃผ ์ฌ์ฉ๋๋ค
1.4 Gradient Descent
Loss Function์ ์ต์ํํ๊ธฐ ์ํด ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์
๋ฐ์ดํธํ๋ ๋ฐฉ๋ฒ์ด๋ค.
- Loss Function์ด ์ ์๋๋ฉด, ๋ชจ๋ธ์ ์ด Loss๋ฅผ ์ค์ด๋ ๋ฐฉํฅ์ผ๋ก ์งํํ๋ค.
- ํ์ฌ ํ๋ผ๋ฏธํฐ์์ Loss์ Gradient ๊ณ์ฐ ํ Learning Rate๋งํผ ์ด๋
์ข
๋ฅ
์ข
๋ฅ | ํน์ง | ์ฌ์ฉ |
Batch Gradient Descent | ์์ ์ ์ด์ง๋ง ๊ณ์ฐ ๋น์ฉ์ด ํผ | ์๊ท๋ชจ ๋ฐ์ดํฐ |
Stochastic Gradient Descent (SGD) | ๋น ๋ฅด์ง๋ง ๋
ธ์ด์ฆ๊ฐ ํผ | ์ด๋ก ์ ๋ถ์, ๊ธฐ๋ณธ ๊ฐ๋
|
Mini-batch Gradient Descent | ์๋์ ์์ ์ฑ์ ๊ท ํ | ์ค๋ฌด ํ์ค |
Adam | learning rate ์๋ ์กฐ์ , ์๋ ด ๋น ๋ฆ | ๋ฅ๋ฌ๋ ๊ธฐ๋ณธ optimizer |
- Batch โ ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ์ ํํ gradient๋ฅผ ๊ณ์ฐํ์ง๋ง ๋๋ฆฌ๋ค.
- SGD โ ์ํ ํ๋๋ก ๊ทผ์ฌํด ๋น ๋ฅด์ง๋ง ์ ๋ฐ์ดํธ๊ฐ ๋ถ์์ ํ๋ค.
- Mini-batch โ ์์ ๋ฌถ์ ๋จ์๋ก ๊ณ์ฐํด ๊ฐ์ฅ ์ค๋ฌด์ ์ผ๋ก ์ฌ์ฉ๋๋ค.
- Adam โ Momentum๊ณผ adaptive learning rate๋ฅผ ๊ฒฐํฉํ ๋ฐฉ๋ฒ์ผ๋ก, ๋ฅ๋ฌ๋์์ ๊ธฐ๋ณธ๊ฐ์ฒ๋ผ ์ฐ์ธ๋ค.
1.5 Generalization & Overfitting
๋จธ์ ๋ฌ๋์ ๊ถ๊ทน์ ์ธ ๋ชฉํ๋ ํ๋ จ ๋ฐ์ดํฐ๊ฐ ์๋๋ผ ์๋ก์ด ๋ฐ์ดํฐ์๋ ์ ์๋ํ๋ ๊ฒ์ด๋ค. โ ์ผ๋ฐํ
- Overfitting โ ํ๋ จ ๋ฐ์ดํฐ์๋ ์ ๋ง์ง๋ง, ์๋ก์ด ๋ฐ์ดํฐ์์๋ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ์ํ (๋ ธ์ด์ฆ๋ ํ์ต)
- Underfitting โ ํ๋ จ ๋ฐ์ดํฐ์กฐ์ฐจ ์ ๋๋ก ์ค๋ช ํ์ง ๋ชปํ๋ ์ํ
- Bias โ ๋ชจ๋ธ์ด ๋๋ฌด ๋จ์ํด์ ์๊ธฐ๋ ์ํ
- Variance โ ๋ฐ์ดํฐ์ ๊ณผ๋ํ๊ฒ ๋ฏผ๊ฐํด์ ์๊ธฐ๋ ์ํ
์ฆ, ์ผ๋ฐํ๋ ์๋ก์ด ๋ฐ์ดํฐ์์๋ ์ฑ๋ฅ์ ์ ์งํ๋ ๋ฅ๋ ฅ, overfitting์ ์ด๋ฅผ ๋ฐฉํดํ๋ค.
1.6 Metric
๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ฌ๋์ด ์ดํดํ๊ธฐ ์ฝ๊ฒ ์ธก์ ํ๋ ์งํ์ด๋ค.
- ํ์ต ํ์ ํ๊ฐ์ ์ฌ์ฉ
- ๋ฌธ์ ๋ชฉ์ ์ ๋ง๊ฒ ๋ฐฉ๋ฒ ์ ํ
Metric | ์๋ฏธ | ์ธ์ ์ค์ํ๊ฐ | ์ฃผ์ํ ์ |
Accuracy | ์ ์ฒด ์์ธก ์ค ๋ง์ถ ๋น์จ | ํด๋์ค๊ฐ ๊ท ํ์ ์ผ ๋ | ๋ฐ์ดํฐ ๋ถ๊ท ํ์ ๋งค์ฐ ์ทจ์ฝ |
Precision | ์์ฑ์ด๋ผ๊ณ ์์ธกํ ๊ฒ ์ค ์ค์ ์์ฑ ๋น์จ | ์คํ(False Positive) ์ด ์น๋ช
์ ์ผ ๋ | ์ฌํ์จ์ ํฌ์ํ ์ ์์ |
Recall | ์ค์ ์์ฑ ์ค ๋ง์ถ ๋น์จ | ๋ฏธํ(False Negative) ์ด ์น๋ช
์ ์ผ ๋ | ์ ๋ฐ๋๊ฐ ๋ฎ์์ง ์ ์์ |
F1-score | Precision๊ณผ Recall์ ์กฐํ ํ๊ท | ๋ถ๊ท ํ ๋ฐ์ดํฐ, ๋ ์งํ๋ฅผ ๋์์ ๊ณ ๋ คํ ๋ | ํด์์ด ์ง๊ด์ ์ด์ง ์์ ์ ์์ |
ROC-AUC | ๋ถ๋ฅ ์๊ณ๊ฐ ์ ๋ฐ์์์ ์ฑ๋ฅ | ์๊ณ๊ฐ์ ๋
๋ฆฝ์ ๋น๊ต๊ฐ ํ์ํ ๋ | ์ค์ ์ด์ ์๊ณ๊ฐ๊ณผ ๊ดด๋ฆฌ ๊ฐ๋ฅ |
- Accuracy โ โ์ ์ฒด์ ์ผ๋ก ์ผ๋ง๋ ๋ง์ท๋?โ
- Precision โ โ๋ง๋ค๊ณ ํ ๊ฒ ์ค์ ์ง์ง๋ ์ผ๋ง๋ ๋๋?โ (์คํธ์ผ๋ก ์๋ชป ๊ฑธ๋ฉด ์ ๋ ๋)
- Recall โ โ์ง์ง๋ฅผ ์ผ๋ง๋ ๋์น์ง ์์๋?โ (์ง๋ณ/์ฌ๊ธฐ ํ์ง์ฒ๋ผ ๋์น๋ฉด ํฐ ๋ฌธ์ )
- F1-score โ โPrecision๊ณผ Recall์ ๊ท ํ ์๊ฒ ๋ณด๊ณ ์ถ์ ๋โ
- ROC-AUC โ โ์๊ณ๊ฐ ๋ฐ๊ฟ๊ฐ๋ฉฐ ๋ชจ๋ธ ์์ฒด์ ๋ถ๋ฆฌ ๋ฅ๋ ฅ์ ๋ณด๊ณ ์ถ์ ๋โ
ย
์ถ์ฒ/๋ญํน์ ์์ฃผ ์ฐ์ด๋ Metrix
Metric | ์๋ฏธ | ์ธ์ ์ฐ๋๊ฐ | ํต์ฌ ํฌ์ธํธ |
Precision@K | ์์ K๊ฐ ์ค ์ค์ ๋ก ๋ง์ ๋น์จ | ์ถ์ฒ ์ ํ๋๊ฐ ์ค์ํ ๋ | ์์๋ ๊ณ ๋ ค โ |
Recall@K | ์ค์ ์ ๋ต ์ค ์์ K์ ํฌํจ๋ ๋น์จ | ๋์น๋ฉด ์ ๋๋ ์์ดํ
์ด ์์ ๋ | K์ ๋ฏผ๊ฐ |
Hit Rate@K | ์ ๋ต์ด Top-K์ ํ๋๋ผ๋ ์์ผ๋ฉด ์ฑ๊ณต | ๋จ์ ์ถ์ฒ ์ฑ๊ณต ์ฌ๋ถ | ๋งค์ฐ ๊ฑฐ์น ์งํ |
MRR | ์ ๋ต์ด ์ฒ์ ๋ฑ์ฅํ ์์์ ์ญ์ | ๊ฒ์/QA/๋จ์ผ ์ ๋ต | ์ฒซ ์์น ์ค์ |
MAP | Precision์ ํ๊ท | ์ฌ๋ฌ ์ ๋ต ์์ ๋ | ์์ ์ผ๋ถ ๋ฐ์ |
NDCG โญโญโญ | ์์ + ์ค์๋ ๋ชจ๋ ๋ฐ์ | ์ค๋ฌด ์ต๋ค ์ฌ์ฉ | ์์ ์์์๋ก ๊ฐ์ค์น ํผ |
ย
ย
