Concept
1. Machine Learning
๊ท์น์ ์ง์ ์ฐ์ง ์๊ณ , ๋ฐ์ดํฐ๋ก๋ถํฐ ๊ท์น์ ํ์ตํ๋ ๋ฐฉ๋ฒ
- ์ ๋ ฅ โ ์ถ๋ ฅ ๊ด๊ณ๋ฅผ ํจ์๋ก ํ์ต
- ์ฑ๋ฅ์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ผ๋ก ํ๋จ
1.1 Model
๋จธ์ ๋ฌ๋์์ ๋ชจ๋ธ์ด๋ ์
๋ ฅ์ ์ถ๋ ฅ์ผ๋ก ๋งคํํ๋ ํจ์์ด๋ค.
- ์ ๋ ฅ
- ์์ธก ๊ฐ ๋ฅผ ์ถ๋ ฅํ๋ ํจ์
- ๋ ๋ชจ๋ธ์ด ํ์ตํ๋ ํ๋ผ๋ฏธํฐ
์ฆ, ๋ชจ๋ธ์ ๋ฐ์ดํฐ์ ํจํด์ ํํํ๋ ์ํ์ ํจ์์ด๋ค.
1.2 Learning
ํ์ต์ด๋, ํ๋ผ๋ฏธํฐ ๋ฅผ ์กฐ์ ํ์ฌ ๋ ๋์ ์์ธก์ ํ๋๋ก ๋ง๋๋ ๊ณผ์ ์ด๋ค.
- ์ด๊ธฐ ํ๋ผ๋ฏธํฐ์์ ์์ํด
- ์์ธก์ ์ํํ๊ณ
- ์์ธก์ด ์ผ๋ง๋ ํ๋ ธ๋์ง๋ฅผ ๊ณ์ฐํ ๋ค
- ์ด๋ฅผ ๋ฐํ์ผ๋ก ํ๋ผ๋ฏธํฐ๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ์ ๋ฐ์ดํธ ํ๋ค.
์ฆ, ํ์ต์ ์ข์ ํ์ต ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด๋ค.
1.3 Loss function
๋ชจ๋ธ์ ์์ธก์ด ์ ๋ต๊ณผ ์ผ๋ง๋ ๋ค๋ฅธ์ง ์์น๋ก ํํํ ํจ์์ด๋ค.
- ์์ธก์ด ํ๋ฆด์๋ก Loss๋ ์ปค์ง๊ณ
- ์์ธก์ด ๋ง์์๋ก Loss๋ ์์์ง๋ค.
์์ฃผ ์ฌ์ฉ๋๋ Loss ์์
- ํ๊ท ๋ฌธ์ โ MSE, MAE
- ๋ถ๋ฅ ๋ฌธ์ โ Cross-Entropy
- ์ถ์ฒ ๋ฌธ์ โ Binary Cross-Entorpy, Pairwise, Listwise Loss, Contrastive
์ฆ, Loss Function์ ๋ฌธ์ ์ ํ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ฉฐ, ์ถ์ฒ ๋ฌธ์ ์์๋ ์ ๋์ ์ธ ์์ธก๊ฐ๋ณด๋ค ์๋์ ์ธ ์ ํธ๋ฅผ ๋ฐ์ํ๋ Loss๊ฐ ์์ฃผ ์ฌ์ฉ๋๋ค
1.4 Gradient Descent
Loss Function์ ์ต์ํํ๊ธฐ ์ํด ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์
๋ฐ์ดํธํ๋ ๋ฐฉ๋ฒ์ด๋ค.
- Loss Function์ด ์ ์๋๋ฉด, ๋ชจ๋ธ์ ์ด Loss๋ฅผ ์ค์ด๋ ๋ฐฉํฅ์ผ๋ก ์งํํ๋ค.
- ํ์ฌ ํ๋ผ๋ฏธํฐ์์ Loss์ Gradient ๊ณ์ฐ ํ Learning Rate๋งํผ ์ด๋
์ข
๋ฅ
์ข
๋ฅ | ํน์ง | ์ฌ์ฉ |
Batch Gradient Descent | ์์ ์ ์ด์ง๋ง ๊ณ์ฐ ๋น์ฉ์ด ํผ | ์๊ท๋ชจ ๋ฐ์ดํฐ |
Stochastic Gradient Descent (SGD) | ๋น ๋ฅด์ง๋ง ๋
ธ์ด์ฆ๊ฐ ํผ | ์ด๋ก ์ ๋ถ์, ๊ธฐ๋ณธ ๊ฐ๋
|
Mini-batch Gradient Descent | ์๋์ ์์ ์ฑ์ ๊ท ํ | ์ค๋ฌด ํ์ค |
Adam | learning rate ์๋ ์กฐ์ , ์๋ ด ๋น ๋ฆ | ๋ฅ๋ฌ๋ ๊ธฐ๋ณธ optimizer |
- Batch โ ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ์ ํํ gradient๋ฅผ ๊ณ์ฐํ์ง๋ง ๋๋ฆฌ๋ค.
- SGD โ ์ํ ํ๋๋ก ๊ทผ์ฌํด ๋น ๋ฅด์ง๋ง ์ ๋ฐ์ดํธ๊ฐ ๋ถ์์ ํ๋ค.
- Mini-batch โ ์์ ๋ฌถ์ ๋จ์๋ก ๊ณ์ฐํด ๊ฐ์ฅ ์ค๋ฌด์ ์ผ๋ก ์ฌ์ฉ๋๋ค.
- Adam โ Momentum๊ณผ adaptive learning rate๋ฅผ ๊ฒฐํฉํ ๋ฐฉ๋ฒ์ผ๋ก, ๋ฅ๋ฌ๋์์ ๊ธฐ๋ณธ๊ฐ์ฒ๋ผ ์ฐ์ธ๋ค.
1.5 Generalization & Overfitting
๋จธ์ ๋ฌ๋์ ๊ถ๊ทน์ ์ธ ๋ชฉํ๋ ํ๋ จ ๋ฐ์ดํฐ๊ฐ ์๋๋ผ ์๋ก์ด ๋ฐ์ดํฐ์๋ ์ ์๋ํ๋ ๊ฒ์ด๋ค. โ ์ผ๋ฐํ
- Overfitting โ ํ๋ จ ๋ฐ์ดํฐ์๋ ์ ๋ง์ง๋ง, ์๋ก์ด ๋ฐ์ดํฐ์์๋ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ์ํ (๋ ธ์ด์ฆ๋ ํ์ต)
- Underfitting โ ํ๋ จ ๋ฐ์ดํฐ์กฐ์ฐจ ์ ๋๋ก ์ค๋ช ํ์ง ๋ชปํ๋ ์ํ
- Bias โ ๋ชจ๋ธ์ด ๋๋ฌด ๋จ์ํด์ ์๊ธฐ๋ ์ํ
- Variance โ ๋ฐ์ดํฐ์ ๊ณผ๋ํ๊ฒ ๋ฏผ๊ฐํด์ ์๊ธฐ๋ ์ํ
์ฆ, ์ผ๋ฐํ๋ ์๋ก์ด ๋ฐ์ดํฐ์์๋ ์ฑ๋ฅ์ ์ ์งํ๋ ๋ฅ๋ ฅ, overfitting์ ์ด๋ฅผ ๋ฐฉํดํ๋ค.
1.6 Metric
๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ฌ๋์ด ์ดํดํ๊ธฐ ์ฝ๊ฒ ์ธก์ ํ๋ ์งํ์ด๋ค.
- ํ์ต ํ์ ํ๊ฐ์ ์ฌ์ฉ
- ๋ฌธ์ ๋ชฉ์ ์ ๋ง๊ฒ ๋ฐฉ๋ฒ ์ ํ
Metric | ์๋ฏธ | ์ธ์ ์ค์ํ๊ฐ | ์ฃผ์ํ ์ |
Accuracy | ์ ์ฒด ์์ธก ์ค ๋ง์ถ ๋น์จ | ํด๋์ค๊ฐ ๊ท ํ์ ์ผ ๋ | ๋ฐ์ดํฐ ๋ถ๊ท ํ์ ๋งค์ฐ ์ทจ์ฝ |
Precision | ์์ฑ์ด๋ผ๊ณ ์์ธกํ ๊ฒ ์ค ์ค์ ์์ฑ ๋น์จ | ์คํ(False Positive) ์ด ์น๋ช
์ ์ผ ๋ | ์ฌํ์จ์ ํฌ์ํ ์ ์์ |
Recall | ์ค์ ์์ฑ ์ค ๋ง์ถ ๋น์จ | ๋ฏธํ(False Negative) ์ด ์น๋ช
์ ์ผ ๋ | ์ ๋ฐ๋๊ฐ ๋ฎ์์ง ์ ์์ |
F1-score | Precision๊ณผ Recall์ ์กฐํ ํ๊ท | ๋ถ๊ท ํ ๋ฐ์ดํฐ, ๋ ์งํ๋ฅผ ๋์์ ๊ณ ๋ คํ ๋ | ํด์์ด ์ง๊ด์ ์ด์ง ์์ ์ ์์ |
ROC-AUC | ๋ถ๋ฅ ์๊ณ๊ฐ ์ ๋ฐ์์์ ์ฑ๋ฅ | ์๊ณ๊ฐ์ ๋
๋ฆฝ์ ๋น๊ต๊ฐ ํ์ํ ๋ | ์ค์ ์ด์ ์๊ณ๊ฐ๊ณผ ๊ดด๋ฆฌ ๊ฐ๋ฅ |
- Accuracy โ โ์ ์ฒด์ ์ผ๋ก ์ผ๋ง๋ ๋ง์ท๋?โ
- Precision โ โ๋ง๋ค๊ณ ํ ๊ฒ ์ค์ ์ง์ง๋ ์ผ๋ง๋ ๋๋?โ (์คํธ์ผ๋ก ์๋ชป ๊ฑธ๋ฉด ์ ๋ ๋)
- Recall โ โ์ง์ง๋ฅผ ์ผ๋ง๋ ๋์น์ง ์์๋?โ (์ง๋ณ/์ฌ๊ธฐ ํ์ง์ฒ๋ผ ๋์น๋ฉด ํฐ ๋ฌธ์ )
- F1-score โ โPrecision๊ณผ Recall์ ๊ท ํ ์๊ฒ ๋ณด๊ณ ์ถ์ ๋โ
- ROC-AUC โ โ์๊ณ๊ฐ ๋ฐ๊ฟ๊ฐ๋ฉฐ ๋ชจ๋ธ ์์ฒด์ ๋ถ๋ฆฌ ๋ฅ๋ ฅ์ ๋ณด๊ณ ์ถ์ ๋โ
ย
์ถ์ฒ/๋ญํน์ ์์ฃผ ์ฐ์ด๋ Metrix
Metric | ์๋ฏธ | ์ธ์ ์ฐ๋๊ฐ | ํต์ฌ ํฌ์ธํธ |
Precision@K | ์์ K๊ฐ ์ค ์ค์ ๋ก ๋ง์ ๋น์จ | ์ถ์ฒ ์ ํ๋๊ฐ ์ค์ํ ๋ | ์์๋ ๊ณ ๋ ค โ |
Recall@K | ์ค์ ์ ๋ต ์ค ์์ K์ ํฌํจ๋ ๋น์จ | ๋์น๋ฉด ์ ๋๋ ์์ดํ
์ด ์์ ๋ | K์ ๋ฏผ๊ฐ |
Hit Rate@K | ์ ๋ต์ด Top-K์ ํ๋๋ผ๋ ์์ผ๋ฉด ์ฑ๊ณต | ๋จ์ ์ถ์ฒ ์ฑ๊ณต ์ฌ๋ถ | ๋งค์ฐ ๊ฑฐ์น ์งํ |
MRR | ์ ๋ต์ด ์ฒ์ ๋ฑ์ฅํ ์์์ ์ญ์ | ๊ฒ์/QA/๋จ์ผ ์ ๋ต | ์ฒซ ์์น ์ค์ |
MAP | Precision์ ํ๊ท | ์ฌ๋ฌ ์ ๋ต ์์ ๋ | ์์ ์ผ๋ถ ๋ฐ์ |
NDCG โญโญโญ | ์์ + ์ค์๋ ๋ชจ๋ ๋ฐ์ | ์ค๋ฌด ์ต๋ค ์ฌ์ฉ | ์์ ์์์๋ก ๊ฐ์ค์น ํผ |
Model
Linear Regression
์
๋ ฅ ๋ณ์์ ์ถ๋ ฅ ๋ณ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ ํ ํจ์๋ก ๋ชจ๋ธ๋งํ๋ ํ๊ท ๋ชจ๋ธ
์ธ์ ์ฐ๋๊ฐ?
- ์์ธก ๋์์ด ์ฐ์๊ฐ์ผ ๋
- ๊ด๊ณ๊ฐ ๋น๊ต์ ๋จ์ํ๋ค๊ณ ๊ฐ์ ํ ๋
์ฅ์
- ๊ตฌ์กฐ๊ฐ ๋จ์ํ๊ณ ํ์ต ์๋๊ฐ ๋น ๋ฅด๋ค
- feature ์ํฅ๋ ฅ์ ํด์ํ ์ ์๋ค
๋จ์
- ๋น์ ํ ๊ด๊ณ๋ฅผ ํํํ์ง ๋ชปํ๋ค
- Outlier์ ๋ฏผ๊ฐํ๋ค
Logistic Regression
์
๋ ฅ ๋ณ์์ ์ถ๋ ฅ ๋ณ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ํ๋ฅ ๋ก ๋ชจ๋ธ๋งํ๋ ๋ถ๋ฅ ๋ชจ๋ธ
์ธ์ ์ฐ๋๊ฐ?
- ์์ธก ๋์์ด ์ด์ง ๋ถ๋ฅ์ผ ๋
- ๊ฒฐ๊ณผ๋ฅผ ํ๋ฅ ๋ก ํด์ํ๊ณ ์ถ์ ๋
ํต์ฌ ์์ด๋์ด
- Linear Regression์ฒ๋ผ ์ ํ ๊ฒฐํฉ์ ๋ง๋ ๋ค
- ๊ฒฐ๊ณผ๋ฅผ Sigmoid ํจ์๋ก ๋ณํ
- ์ถ๋ ฅ๊ฐ์ 0~1 ์ฌ์ด๋ก ํด์
์ฅ์
- ์ถ๋ ฅ์ด ํ๋ฅ ์ด์ด์ ํด์์ด ์ฌ์
- ํ์ต์ด ๋น ๋ฅด๊ณ ์์ ์
- feature ์ํฅ๋ ฅ(๊ณ์ ํด์)์ด ๊ฐ๋ฅํ๋ค
๋จ์
- ์ ํ ๊ฒฐ์ ๊ฒฝ๊ณ๋ง ํํ ๊ฐ๋ฅ
- ๋ณต์กํ ํจํด์๋ ํ๊ณ๊ฐ ์๋ค
- outlier๋ feature ์ค์ผ์ผ์ ๋ฏผ๊ฐ
k-NN
์
๋ ฅ ๋ฐ์ดํฐ์ ๊ฐ์ฅ ๊ฐ๊น์ด k๊ฐ์ ์ด์์ ๊ธฐ์ค์ผ๋ก ์์ธกํ๋ ๋ชจ๋ธ
์ธ์ ์ฐ๋๊ฐ?
- ๋ฐ์ดํฐ๊ฐ ๋น๊ต์ ์ ์ ๋
- ๋ณต์กํ ํจํด์ ์๋ฌต์ ์ผ๋ก ๋ฐ์ํ๊ณ ์ถ์ ๋
- ๋น ๋ฅธ ๋ฒ ์ด์ค๋ผ์ธ์ด ํ์ํ ๋
ํต์ฌ ์์ด๋์ด
- ๋ชจ๋ธ์ ํ์ตํ์ง ์๊ณ , ์์ธก ์์ ์์ ๊ฐ์ฅ ๊ฐ๊น์ด ์ด์์ ์ฐพ๋๋ค
- ํ์ต ์์ด ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ์ผ๋ก ์์ธก
- Lazy Learning Model
์ฅ์
- ๊ตฌํ์ด ๋จ์
- ๋น์ ํ ๊ด๊ณ๋ฅผ ์์ฐ์ค๋ฝ๊ฒ ๋ฐ์
- ๋ณ๋์ ํ์ต ๊ณผ์ ์ด ์๋ค.
๋จ์
- ์์ธก์ด ๋๋ฆฌ๋ค (๋ชจ๋ ๋ฐ์ดํฐ์ ๊ฑฐ๋ฆฌ ๊ณ์ฐ)
- ๋ฐ์ดํฐ๊ฐ ์ปค์ง์๋ก ์ฑ๋ฅ ์ ํ
- Feature ์ค์ผ์ผ์ ๋ฏผ๊ฐ
- ํด์์ด ์ด๋ ค์
Decision Tree
์
๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์กฐ๊ฑด ๋ถ๊ธฐ ํํ๋ก ๋๋์ด ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๋ ํธ๋ฆฌ ๊ตฌ์กฐ์ ๋ชจ๋ธ
์ธ์ ์ฐ๋๊ฐ?
- ์ ๋ ฅ๊ณผ ์ถ๋ ฅ ๊ด๊ณ๊ฐ ๋น์ ํ์ผ ๋
- feature๊ฐ์ ์ํธ์์ฉ์ด ์ค์ํ ๋
- ๋ชจ๋ธ ์ค๋ช ๊ฐ๋ฅ์ฑ์ด ํ์ํ ๋
- ์ ์ฒ๋ฆฌ๋ฅผ ์ต์ํํ๊ณ ์ถ์ ๋
ํต์ฌ ์์ด๋์ด
- ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ์ ๋๋ ์ ์๋ featuredhk ๊ธฐ์ค๊ฐ์ ์ ํ
- ๋ถ๊ธฐ๋ฅผ ๋ฐ๋ณตํ๋ฉฐ ๋ถ์๋ ์ค์ด๊ธฐ
- ๋ฆฌํ ๋ ธ๋์์ ์ต์ข ์์ธก
- ์ง๋ฌธ์ ๊ณ์ ๋์ง๋ฉฐ ๋ฐ์ดํฐ๋ฅผ ์ชผ๊ฐ๋ ๋ชจ๋ธ
์ฅ์
- ๋น์ ํ ๊ด๊ณ๋ฅผ ์์ฐ์ค๋ฝ๊ฒ ํํ
- feature ์ค์ผ์ผ๋ง ๋ถํ์
- ํด์์ด ์ง๊ด์
- ์ ์ฒ๋ฆฌ ๋ถ๋ด์ด ์ ์
๋จ์
- Overfitting์ ๋งค์ฐ ์ทจ์ฝ
- ์์ ๋ฐ์ดํฐ ๋ณํ์๋ ๊ตฌ์กฐ๊ฐ ํฌ๊ฒ ๋ณํจ
- ๋จ์ผ ํธ๋ฆฌ ์ฑ๋ฅ์ ํ๊ณ๊ฐ ์๋ค.
Random Forest
XGBoost
ย
1. Linear Regression
2. Logistic Regression
ย
ย
ย
ย
ย
