Android Malware Detection: A Machine Leaning Approach

Android Malware Detection: A Machine Leaning Approach

๐Ÿ“ Abstract

**
๋ณธ ์—ฐ๊ตฌ๋Š” Decision Tree, Support Vector Machine, Logistic Regression, Neural Network ๋“ฑ ์ „ํ†ต์ ์ธ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๋‹ค์–‘ํ•œ ์•™์ƒ๋ธ” ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•˜์—ฌ ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ๋ฅผ ํƒ์ง€ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋น„๊ตยทํ‰๊ฐ€ํ•œ๋‹ค. ์‹ค์ œ ์•ˆ๋“œ๋กœ์ด๋“œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๋ฐ์ดํ„ฐ์…‹(TUANDROMD, 4,465๊ฐœ ์ƒ˜ํ”Œ, 241๊ฐœ์˜ ์ด์ง„ ํŠน์„ฑ)์œผ๋กœ ์‹คํ—˜์„ ์ง„ํ–‰ํ–ˆ์œผ๋ฉฐ, ๊ฐ ๋ชจ๋ธ์˜ ์ •ํ™•๋„, ํšจ์œจ์„ฑ, ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ถ„์„ํ•œ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, ์•™์ƒ๋ธ” ๋ฐฉ๋ฒ•์ด ๊ฐ€์žฅ ๋†’์€ ํƒ์ง€ ์„ฑ๋Šฅ์„ ๋ณด์˜€์ง€๋งŒ, ๋ชจ๋ธ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑยท์—ฐ์‚ฐ ๋น„์šฉยท์‹ค์‹œ๊ฐ„ ์ ์šฉ์„ฑ ์‚ฌ์ด์— ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๊ฐ€ ์กด์žฌํ•œ๋‹ค๋Š” ์ ์„ ํ™•์ธํ•˜์˜€๋‹ค. ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ์œ„ํ˜‘์ด ์ง€์†์ ์œผ๋กœ ์ฆ๊ฐ€ํ•˜๋Š” ํ˜„ ์ƒํ™ฉ์—์„œ, ๋ณธ ์—ฐ๊ตฌ๋Š” ํ–ฅํ›„ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ๋ณด์•ˆ ์†”๋ฃจ์…˜ ์„ค๊ณ„์™€ ์‹ค์šฉํ™”์— ๋Œ€ํ•œ ์ค‘์š”ํ•œ ์ธ์‚ฌ์ดํŠธ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.


**

๐Ÿ’ก Deep Analysis

**

1. ์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ํ•„์š”์„ฑ

  • ์•ˆ๋“œ๋กœ์ด๋“œ์˜ ์‹œ์žฅ ์ ์œ ์œจ์ด ์ „ ์„ธ๊ณ„ ์Šค๋งˆํŠธํฐ์˜ ๋Œ€๋ถ€๋ถ„์„ ์ฐจ์ง€ํ•˜๋ฉด์„œ, ์˜คํ”ˆ์†Œ์Šคยท๋‹ค์–‘ํ•œ ๋ฐฐํฌ ๊ฒฝ๋กœ๊ฐ€ ์•…์„ฑ์ฝ”๋“œ์˜ ์˜จ์ƒ์œผ๋กœ ์ž‘์šฉํ•˜๊ณ  ์žˆ๋‹ค.
  • ๊ธฐ์กด ์‹œ๊ทธ๋‹ˆ์ฒ˜ ๊ธฐ๋ฐ˜ ํƒ์ง€๋Š” ๋ณ€์ข…ยท๋‚œ๋…ํ™” ์•…์„ฑ์ฝ”๋“œ์— ์ทจ์•ฝํ•˜๊ณ , ์ง€์†์ ์ธ ์—…๋ฐ์ดํŠธ ๋น„์šฉ์ด ํฌ๋‹ค.
  • ๋”ฐ๋ผ์„œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ยทํ–‰์œ„ ๊ธฐ๋ฐ˜ ํƒ์ง€๊ฐ€ ๊ฐ€๋Šฅํ•œ ๋จธ์‹ ๋Ÿฌ๋‹(Mโ€‹L) ์ ‘๊ทผ๋ฒ•์ด ํ•„์ˆ˜์ ์ด๋ฉฐ, ํŠนํžˆ ๊ณ ์ฐจ์›ยท์ด์ง„ ํŠน์„ฑ์„ ํšจ์œจ์ ์œผ๋กœ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ ์„ค๊ณ„๊ฐ€ ํ•ต์‹ฌ ๊ณผ์ œ๋กœ ๋Œ€๋‘๋œ๋‹ค.

2. ๋ฐ์ดํ„ฐ์…‹ ๋ฐ ์ „์ฒ˜๋ฆฌ

ํ•ญ๋ชฉ ๋‚ด์šฉ
๋ฐ์ดํ„ฐ์…‹ TUANDROMD (4,465๊ฐœ ์•ฑ, 242์ปฌ๋Ÿผ)
ํŠน์„ฑ 241๊ฐœ์˜ ์ด์ง„(0/1) ํŠน์„ฑ โ€“ ๊ถŒํ•œ, API ํ˜ธ์ถœ ๋“ฑ
๋ ˆ์ด๋ธ” malware / goodware (๋ฌธ์ž์—ด โ†’ ์ˆซ์ž ๋ณ€ํ™˜)
๋ฐ์ดํ„ฐ ํƒ€์ž… ํŠน์„ฑ: float64 (์ด์ง„๊ฐ’), ๋ ˆ์ด๋ธ”: object โ†’ int ๋ณ€ํ™˜
์ „์ฒ˜๋ฆฌ ๊ฒฐ์ธก์น˜ ์—†์Œ, ์Šค์ผ€์ผ๋ง ํ•„์š” ์—†์Œ(์ด์ง„ ํŠน์„ฑ)
  • ์ด์ง„ ํŠน์„ฑ์€ ๋ชจ๋ธ ํ•™์Šต์„ ๋‹จ์ˆœํ™”ํ•˜์ง€๋งŒ, ํŠน์„ฑ ๊ฐ„ ์ƒ๊ด€๊ด€๊ณ„์™€ ํฌ์†Œ์„ฑ์ด ๋ฌธ์ œ๋  ์ˆ˜ ์žˆ๋‹ค. ์ฐจ์› ์ถ•์†Œ(PCA, SelectKBest ๋“ฑ) ํ˜น์€ ํŠน์„ฑ ์„ ํƒ์ด ์ถ”๊ฐ€ ์—ฐ๊ตฌ์—์„œ ๊ณ ๋ ค๋  ํ•„์š”๊ฐ€ ์žˆ๋‹ค.

3. ์‹คํ—˜์— ์‚ฌ์šฉ๋œ ๋ชจ๋ธ

๋ชจ๋ธ ์ฃผ์š” ํŠน์ง• ๊ธฐ๋Œ€ ์žฅ์  ์ž ์žฌ์  ํ•œ๊ณ„
Decision Tree (DT) ํŠธ๋ฆฌ ๊ตฌ์กฐ, ์ง๊ด€์  ํ•ด์„ ๊ฐ€๋Šฅ ๋น ๋ฅธ ํ•™์Šตยท์˜ˆ์ธก, ๊ทœ์น™ ๊ธฐ๋ฐ˜ ์„ค๋ช… ๊ณผ์ ํ•ฉ ์œ„ํ—˜, ๋ณต์žก๋„ ์ฆ๊ฐ€ ์‹œ ์„ฑ๋Šฅ ์ €ํ•˜
Support Vector Machine (SVM) ๊ณ ์ฐจ์› ์ดˆํ‰๋ฉด, ์ปค๋„ ํ™œ์šฉ ์ž‘์€ ๋ฐ์ดํ„ฐ์—์„œ๋„ ๋†’์€ ์ผ๋ฐ˜ํ™” ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ํ•™์Šต ๋น„์šฉ ๋†’์Œ, ํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ ์–ด๋ ค์›€
Logistic Regression (LR) ์„ ํ˜• ํ™•๋ฅ  ๋ชจ๋ธ ๊ตฌํ˜„ ๊ฐ„๋‹จ, ํ•ด์„ ์šฉ์ด ๋น„์„ ํ˜• ํŒจํ„ด ํฌ์ฐฉ ํ•œ๊ณ„
Neural Network (NN) ๋‹ค์ธต ํผ์…‰ํŠธ๋ก , ๋น„์„ ํ˜• ํ•™์Šต ๋ณต์žกํ•œ ํŒจํ„ด ํ•™์Šต ๊ฐ€๋Šฅ ๊ณผ์ ํ•ฉ, ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํƒ์ƒ‰ ๋น„์šฉ
Ensemble (Bagging, Boosting, Stacking) ์—ฌ๋Ÿฌ ๋ชจ๋ธ ๊ฒฐํ•ฉ ์ •ํ™•๋„ยท์•ˆ์ •์„ฑ ํ–ฅ์ƒ, ๊ณผ์ ํ•ฉ ๊ฐ์†Œ ์—ฐ์‚ฐยท๋ฉ”๋ชจ๋ฆฌ ๋น„์šฉ ์ฆ๊ฐ€, ํ•ด์„๋„ ์ €ํ•˜
  • ์•™์ƒ๋ธ”์ด ๊ฐ€์žฅ ๋†’์€ ์ •ํ™•๋„ยทF1-score๋ฅผ ๊ธฐ๋กํ–ˆ์œผ๋ฉฐ, ํŠนํžˆ **Boosting (์˜ˆ: XGBoost, LightGBM)**์ด ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.

4. ์„ฑ๋Šฅ ํ‰๊ฐ€ ๋ฐ ๊ฒฐ๊ณผ ํ•ด์„

  • ํ‰๊ฐ€์ง€ํ‘œ: Accuracy, Precision, Recall, F1-score, ROCโ€‘AUC.
  • ์ฃผ์š” ๊ฒฐ๊ณผ
    • ๋‹จ์ผ ๋ชจ๋ธ ์ค‘ SVM์™€ DT๊ฐ€ ๋น„๊ต์  ๋†’์€ Recall์„ ๋ณด์˜€์œผ๋‚˜ Precision์€ ๋‚ฎ์•˜๋‹ค.
    • NN์€ ๋†’์€ Recall๊ณผ Precision์„ ๋™์‹œ์— ๋‹ฌ์„ฑํ–ˆ์ง€๋งŒ, ํ•™์Šต ์‹œ๊ฐ„๊ณผ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ ๋น„์šฉ์ด ํฌ๊ฒŒ ์ฆ๊ฐ€ํ–ˆ๋‹ค.
    • ์•™์ƒ๋ธ”(ํŠนํžˆ Stacking)์—์„œ๋Š” Precision 0.96, Recall 0.94, F1 0.95 ์ˆ˜์ค€์„ ๋‹ฌ์„ฑ, ๋‹จ์ผ ๋ชจ๋ธ ๋Œ€๋น„ 35% ํ–ฅ์ƒ.
  • ํŠธ๋ ˆ์ด๋“œ์˜คํ”„
    • ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ: DT์™€ LR์€ ์ง๊ด€์ ์ด์ง€๋งŒ ์„ฑ๋Šฅ์ด ๋‚ฎ์Œ.
    • ์—ฐ์‚ฐ ํšจ์œจ์„ฑ: ๋ชจ๋ฐ”์ผ ๋””๋ฐ”์ด์Šค์—์„œ ์‹ค์‹œ๊ฐ„ ํƒ์ง€๋Š” ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ(DT, LR) ํ•„์š”, ๋ฐ˜๋ฉด ์„œ๋ฒ„โ€‘์‚ฌ์ด๋“œ์—์„œ๋Š” ๊ณ ์„ฑ๋Šฅ ์•™์ƒ๋ธ”์ด ์ ํ•ฉ.
    • ๋ณด์•ˆ ๊ฐ•์ธ์„ฑ: ์•™์ƒ๋ธ”์€ adversarial ๊ณต๊ฒฉ์— ๋Œ€ํ•œ ๋‚ด์„ฑ์ด ๋†’์ง€๋งŒ, ๋ณต์žกํ•œ ๊ตฌ์กฐ๊ฐ€ ๊ณต๊ฒฉ ํ‘œ๋ฉด์„ ํ™•๋Œ€ํ•  ๊ฐ€๋Šฅ์„ฑ๋„ ์กด์žฌ.

5. ์—ฐ๊ตฌ์˜ ๊ฐ•์ 

  1. ์‹ค์ œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜: ๊ณต๊ฐœ ๋ฐ์ดํ„ฐ์…‹(TUANDROMD)์„ ์‚ฌ์šฉํ•ด ์žฌํ˜„ ๊ฐ€๋Šฅ์„ฑ์„ ํ™•๋ณด.
  2. ๋‹ค์–‘ํ•œ ๋ชจ๋ธ ๋น„๊ต: ์ „ํ†ต์ ยท์‹ฌ์ธต ํ•™์Šตยท์•™์ƒ๋ธ”์„ ํฌ๊ด„์ ์œผ๋กœ ์‹คํ—˜, ๊ฐ ๋ชจ๋ธ์˜ ์žฅยท๋‹จ์ ์„ ๋ช…ํ™•ํžˆ ์ œ์‹œ.
  3. ์•™์ƒ๋ธ” ์ ์šฉ: ์‹ค์ œ ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€์— ์•™์ƒ๋ธ”์ด ์œ ์˜๋ฏธํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ œ๊ณตํ•œ๋‹ค๋Š” ๊ทผ๊ฑฐ๋ฅผ ์ œ์‹œ.

6. ํ•œ๊ณ„ ๋ฐ ๊ฐœ์„ ์ 

๊ตฌ๋ถ„ ๋‚ด์šฉ
๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ TUANDROMD ์™ธ ๋‹ค๋ฅธ ๊ณต๊ฐœยท์‚ฌ์„ค ๋ฐ์ดํ„ฐ์…‹(์˜ˆ: Drebin, AndroZoo)๊ณผ์˜ ๊ต์ฐจ ๊ฒ€์ฆ์ด ๋ถ€์กฑ.
ํŠน์„ฑ ์—”์ง€๋‹ˆ์–ด๋ง ํ˜„์žฌ๋Š” ๊ถŒํ•œยทAPI ํ˜ธ์ถœ ์ด์ง„ ํŠน์„ฑ๋งŒ ์‚ฌ์šฉํ–ˆ์œผ๋ฉฐ, ๋™์  ํ–‰๋™ ๋กœ๊ทธ, ๋„คํŠธ์›Œํฌ ํŠธ๋ž˜ํ”ฝ, ์ฝ”๋“œ ํ๋ฆ„ ๋“ฑ ๊ณ ๊ธ‰ ํŠน์„ฑ์€ ๋ฏธํฌํ•จ.
๋ชจ๋ธ ๊ฒฝ๋Ÿ‰ํ™” ๋ชจ๋ฐ”์ผ ๋””๋ฐ”์ด์Šค์— ์ง์ ‘ ํƒ‘์žฌ ๊ฐ€๋Šฅํ•œ ๊ฒฝ๋Ÿ‰ ์•™์ƒ๋ธ”(์˜ˆ: TinyML, ๋ชจ๋ธ ํ”„๋ฃจ๋‹) ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”.
Adversarial ๋ฐฉ์–ด ์ ๋Œ€์  ์˜ˆ์ œ(Adversarial Examples) ์ƒ์„ฑยท๋ฐฉ์–ด ์‹คํ—˜์ด ์—†์œผ๋ฉฐ, ์‹ค์ œ ๊ณต๊ฒฉ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋Œ€ํ•œ ๋‚ด์„ฑ ๊ฒ€์ฆ์ด ์š”๊ตฌ๋จ.
์‹ค์‹œ๊ฐ„ ์„ฑ๋Šฅ ์ถ”๋ก  ์ง€์—ฐ(latency) ๋ฐ ์ „๋ ฅ ์†Œ๋ชจ์— ๋Œ€ํ•œ ์ •๋Ÿ‰์  ํ‰๊ฐ€๊ฐ€ ๋ถ€์žฌ.

7. ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

  1. ๋‹ค์ค‘ ๋ฐ์ดํ„ฐ์…‹ ํ†ตํ•ฉ ๋ฐ ๊ต์ฐจ ๋„๋ฉ”์ธ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ๊ฐ•ํ™”.
  2. ๋™์  ๋ถ„์„ ํŠน์„ฑ(์‹œ์Šคํ…œ ์ฝœ, ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ, ๋„คํŠธ์›Œํฌ ํ๋ฆ„)๊ณผ ์ •์  ํŠน์„ฑ์„ ๊ฒฐํ•ฉํ•œ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ํ”ผ์ฒ˜ ์„ค๊ณ„.
  3. ๊ฒฝ๋Ÿ‰ ์•™์ƒ๋ธ”(์˜ˆ: ๋ชจ๋ธ ์••์ถ•, ์ง€์‹ ์ฆ๋ฅ˜)์œผ๋กœ ์˜จโ€‘๋””๋ฐ”์ด์Šค ์‹ค์‹œ๊ฐ„ ํƒ์ง€ ๊ตฌํ˜„.
  4. Adversarial Robustness: FGSM, PGD ๋“ฑ ์ ๋Œ€์  ๊ณต๊ฒฉ์— ๋Œ€ํ•œ ๋ฐฉ์–ด ๋ฉ”์ปค๋‹ˆ์ฆ˜(์˜ˆ: adversarial training, defensive distillation) ์—ฐ๊ตฌ.
  5. Explainable AI (XAI): SHAP, LIME ๋“ฑ์„ ํ™œ์šฉํ•ด ์•™์ƒ๋ธ” ๋ชจ๋ธ์˜ ๊ฒฐ์ • ๊ทผ๊ฑฐ๋ฅผ ์‹œ๊ฐํ™”ยท์„ค๋ช…, ๋ณด์•ˆ ๋‹ด๋‹น์ž์™€ ์‚ฌ์šฉ์ž์˜ ์‹ ๋ขฐ๋„ ํ–ฅ์ƒ.

8. ๊ฒฐ๋ก  ์š”์•ฝ

  • ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€๋Š” ์‹œ๊ทธ๋‹ˆ์ฒ˜ ๊ธฐ๋ฐ˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•  ์ˆ˜ ์žˆ๋Š” ์œ ๋งํ•œ ์ ‘๊ทผ๋ฒ•์ด๋ฉฐ, ์•™์ƒ๋ธ”์ด ๊ฐ€์žฅ ๋†’์€ ํƒ์ง€ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•œ๋‹ค.
  • ๊ทธ๋Ÿฌ๋‚˜ ๋ชจ๋ธ ๋ณต์žก๋„ยทํ•ด์„ ๊ฐ€๋Šฅ์„ฑยท์ž์› ์ œ์•ฝ ์‚ฌ์ด์˜ ๊ท ํ˜•์„ ๋งž์ถ”๋Š” ๊ฒƒ์ด ์‹ค๋ฌด ์ ์šฉ์˜ ํ•ต์‹ฌ ๊ณผ์ œ์ด๋‹ค.
  • ํ–ฅํ›„ ์—ฐ๊ตฌ๋Š” ๋‹ค์–‘ํ•œ ํŠน์„ฑ ํ†ตํ•ฉ, ๊ฒฝ๋Ÿ‰ํ™”, ์ ๋Œ€์  ๋ฐฉ์–ด, ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ์„ ๋™์‹œ์— ๊ณ ๋ คํ•œ ํ†ตํ•ฉ ๋ณด์•ˆ ํ”„๋ ˆ์ž„์›Œํฌ ๊ตฌ์ถ•์œผ๋กœ ๋‚˜์•„๊ฐ€์•ผ ํ•œ๋‹ค.

**

๐Ÿ“„ Full Content

์Šค๋งˆํŠธํฐ์€ ์ƒˆ๋กœ์šด ์—ฐ๊ฒฐ์„ฑ, ํŽธ๋ฆฌํ•จ ๋ฐ ํ˜์‹ ์˜ ์‹œ๋Œ€๋ฅผ ์—ด์—ˆ์œผ๋ฉฐ, ์•ˆ๋“œ๋กœ์ด๋“œ๊ฐ€ ๊ฐ€์žฅ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ๋ชจ๋ฐ”์ผ ์šด์˜์ฒด์ œ์ž„์€ ์ž˜ ์•Œ๋ ค์ง„ ์‚ฌ์‹ค์ด๋‹ค[1],[2]. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Ÿฌํ•œ ๋ณดํŽธ์„ฑ์€ ์—ฌ๋Ÿฌ ๋„์ „์„ ๋™๋ฐ˜ํ•œ๋‹ค. ์•ˆ๋“œ๋กœ์ด๋“œ ์ƒํƒœ๊ณ„์˜ ๋ฐฐ๊ฒฝ์„ ์‚ดํŽด๋ณด๋ฉด, ์•ˆ๋“œ๋กœ์ด๋“œ๋ฅผ ์ธ๊ธฐ ์žˆ๊ฒŒ ๋งŒ๋“  ํŠน์„ฑ๋“ค์ด ๋™์‹œ์— ์•…์„ฑ ํ–‰์œ„์— ์ทจ์•ฝํ•˜๊ฒŒ ๋งŒ๋“ ๋‹ค๋Š” ์ ์ด ๋ช…ํ™•ํ•ด์ง„๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์•ˆ๋“œ๋กœ์ด๋“œ์˜ ์˜คํ”ˆ์†Œ์Šค ํŠน์„ฑ, ๋ฐฉ๋Œ€ํ•œ ์‚ฌ์šฉ์ž ๊ธฐ๋ฐ˜, ๊ทธ๋ฆฌ๊ณ  ์†์‰ฌ์šด ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๋ฐฐํฌยท์„ค์น˜ ๋ฐฉ์‹์€ ์‚ฌ์ด๋ฒ„ ๋ฒ”์ฃ„์ž๋“ค์ด ํ™œ๊ฐœ์น  ์ˆ˜ ์žˆ๋Š” ํ™˜๊ฒฝ์„ ์กฐ์„ฑํ•œ๋‹ค. ๋”ฐ๋ผ์„œ ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ๋ผ๋Š” ์‹ฌ๊ฐํ•œ ์œ„ํ˜‘์— ๋Œ€์‘ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์•ˆ๋“œ๋กœ์ด๋“œ ์ƒํƒœ๊ณ„์˜ ๋…ํŠนํ•œ ํ’๊ฒฝ์„ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ ์ด๋‹ค. ์•„๋ž˜ ์„น์…˜์—์„œ๋Š” ์ดํ›„ ์žฅ์—์„œ ๋‹ค๋ฃฐ ์•ˆ๋“œ๋กœ์ด๋“œ ๊ธฐ๊ธฐ์šฉ ๊ณ ๊ธ‰ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€ ๊ธฐ๋ฒ•์„ ํƒ๊ตฌํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฐ๊ฒฝ์„ ์ œ์‹œํ•œ๋‹ค.


1. ์„œ๋ก 

์•ˆ๋“œ๋กœ์ด๋“œ ์šด์˜์ฒด์ œ๋Š” ์˜คํ”ˆ์†Œ์Šค๋ผ๋Š” ํŠน์„ฑ๊ณผ ๋†’์€ ์ปค์Šคํ„ฐ๋งˆ์ด์ง• ๊ฐ€๋Šฅ์„ฑ ๋•๋ถ„์— ์ „ ์„ธ๊ณ„์ ์œผ๋กœ ํญ๋„“๊ฒŒ ์ฑ„ํƒ๋˜๊ณ  ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ํŠน์„ฑ์€ ์•ˆ๋“œ๋กœ์ด๋“œ๋ฅผ ์‚ฌ์ด๋ฒ„ ๋ฒ”์ฃ„์ž๋“ค์˜ ์ฃผ์š” ํ‘œ์ ์œผ๋กœ ๋งŒ๋“ค์—ˆ๋‹ค. ์•ˆ๋“œ๋กœ์ด๋“œ์˜ ๋ฐฉ๋Œ€ํ•˜๊ณ  ๋‹ค์–‘ํ™”๋œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ์ƒํƒœ๊ณ„๋Š” ๋ณด์•ˆ ์ธก๋ฉด์—์„œ ํฐ ๋„์ „์„ ์ œ์‹œํ•œ๋‹ค. ์•…์„ฑ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์€ ์ •์‹ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์ธ ์ฒ™ ์œ„์žฅํ•ด ์ทจ์•ฝ์ ์„ ์•…์šฉํ•˜๊ณ , ์‚ฌํšŒ๊ณตํ•™ ๊ธฐ๋ฒ•์„ ๋™์›ํ•œ๋‹ค[1]โ€‘[3]. ์ด์™€ ๊ฐ™์€ ์•…์„ฑ ํ–‰์œ„์—๋Š” ๋ฏผ๊ฐํ•œ ์ •๋ณด ํƒˆ์ทจ, ํ”„๋ฆฌ๋ฏธ์—„ SMS ์ „์†ก, ์ถ”๊ฐ€ ํŽ˜์ด๋กœ๋“œ ์„ค์น˜ ๋“ฑ์ด ํฌํ•จ๋œ๋‹ค[4]โ€‘[5].

์ „ํ†ต์ ์ธ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€ ๋ฐฉ์‹์€ ์ฃผ๋กœ ์„œ๋ช… ๋งค์นญ์— ์˜์กดํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋‚œ๋…ํ™”ยทํšŒํ”ผ ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋Š” ์ •๊ตํ•˜๊ณ  ์ง„ํ™”ํ•˜๋Š” ์•…์„ฑ์ฝ”๋“œ ๋ณ€์ข…์— ๋Œ€ํ•ด์„œ๋Š” ์ ์  ํ•œ๊ณ„๊ฐ€ ๋“œ๋Ÿฌ๋‚œ๋‹ค[6]โ€‘[7]. ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ์ง€์†์ ์ธ ์—…๋ฐ์ดํŠธ๊ฐ€ ํ•„์š”ํ•˜๊ณ , ์ƒˆ๋กœ์šด ํ˜น์€ ์•Œ๋ ค์ง€์ง€ ์•Š์€ ๋ณ€์ข…์„ ํƒ์ง€ํ•˜๊ธฐ ์–ด๋ ต๋‹ค[8],[9]. ๋”ฐ๋ผ์„œ ์•ˆ๋“œ๋กœ์ด๋“œ ๊ธฐ๊ธฐ์šฉ ๊ณ ๋„ํ™”๋˜๊ณ  ์‚ฌ์ „ ์˜ˆ๋ฐฉ์ ์ธ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€ ๋ฐฉ๋ฒ•์ด ์ ˆ์‹คํžˆ ์š”๊ตฌ๋œ๋‹ค. ๋จธ์‹ ๋Ÿฌ๋‹(ML)์€ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ํ•™์Šตํ•˜๊ณ , ์ƒˆ๋กœ์šด ์œ„ํ˜‘์— ์ ์‘ํ•˜๋ฉฐ, ์ •์  ์„œ๋ช…์ด ์•„๋‹Œ ํ–‰๋™ ํŒจํ„ด์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ง€๋Šฅ์ ์ธ ๊ฒฐ์ •์„ ๋‚ด๋ฆด ์ˆ˜ ์žˆ๋Š” ์œ ๋งํ•œ ์†”๋ฃจ์…˜์œผ๋กœ ๋– ์˜ค๋ฅด๊ณ  ์žˆ๋‹ค[2],[10]โ€‘[11]. ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€์— ML์„ ์‹ค์šฉ์ ์œผ๋กœ ์ ์šฉํ•˜๋ ค๋ฉด ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ์˜ ๊ณ ์œ  ํŠน์„ฑ, ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์˜ ์–ด๋ ค์›€, ๊ทธ๋ฆฌ๊ณ  ์ ๋Œ€์ ์ธ ์‚ฌ์ด๋ฒ„ ์œ„ํ˜‘์˜ ํŠน์„ฑ์„ ์ถฉ๋ถ„ํžˆ ์ดํ•ดํ•ด์•ผ ํ•œ๋‹ค[12]โ€‘[13].

์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์—ฌ๋Ÿฌ ๋‚œ๊ด€์— ์ง๋ฉดํ•œ๋‹ค.

  • ์•…์„ฑ ๊ธฐ๋ฒ•์˜ ์ง€์†์ ์ธ ์ง„ํ™” โ€“ ๊ณต๊ฒฉ์ž๋Š” ๋Š์ž„์—†์ด ์ƒˆ๋กœ์šด ํšŒํ”ผยท๋‚œ๋…ํ™” ์ „๋žต์„ ๋„์ž…ํ•œ๋‹ค.
  • ๊ณ ์ฐจ์› ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๋ฐ์ดํ„ฐ โ€“ ์ˆ˜๋ฐฑ ๊ฐœ์˜ ๊ถŒํ•œยทAPI ํ˜ธ์ถœ ํŠน์„ฑ์ด ์กด์žฌํ•ด ์ฐจ์›์˜ ์ €์ฃผ(curse of dimensionality) ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค.
  • ์ ๋Œ€์  ์œ„ํ˜‘ โ€“ ๊ณต๊ฒฉ์ž๋Š” ML ๋ชจ๋ธ์„ ๊ต๋ž€์‹œํ‚ค๋Š” ์ ๋Œ€์  ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•œ๋‹ค.

์ „ํ†ต์ ์ธ ์‹œ๊ทธ๋‹ˆ์ฒ˜ ๊ธฐ๋ฐ˜ ์•ˆํ‹ฐ๋ฐ”์ด๋Ÿฌ์Šค๋Š” ์ œ๋กœ๋ฐ์ดยท๋‹คํ˜•์„ฑ ๋ณ€์ข…์„ ํƒ์ง€ํ•˜๋Š” ๋ฐ ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ •์  ์„œ๋ช…์ด ์•„๋‹Œ ํ–‰๋™ ๊ธฐ๋ฐ˜ยท๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์ด ํ•„์š”ํ•˜๋‹ค.

๋น„๋ก ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€๋ฅผ ์œ„ํ•œ ML ์—ฐ๊ตฌ๊ฐ€ ํ™œ๋ฐœํžˆ ์ง„ํ–‰๋˜๊ณ  ์žˆ์ง€๋งŒ, ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ถฉ๋ถ„ํ•œ ํ…Œ์ŠคํŠธ์™€ ๋น„๊ต๊ฐ€ ์•„์ง ๋ถ€์กฑํ•˜๋‹ค. ๋˜ํ•œ, ์—ฌ๋Ÿฌ ๋ชจ๋ธ์˜ ์žฅ์ ์„ ๊ฒฐํ•ฉํ•ด ํƒ์ง€ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ์•™์ƒ๋ธ” ํ•™์Šต ์ ‘๊ทผ๋ฒ•์— ๋Œ€ํ•œ ํ•„์š”์„ฑ๋„ ์ œ๊ธฐ๋˜๊ณ  ์žˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ์ ์„ ํ•ด๊ฒฐํ•˜๊ณ ์ž ML์„ ํ™œ์šฉํ•œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์˜ ์ฃผ์š” ๋ชฉํ‘œ

  1. ๋Œ€ํ‘œ์ ์ธ ML ์•Œ๊ณ ๋ฆฌ์ฆ˜(Decision Tree, Support Vector Machine, Logistic Regression, Neural Network)์˜ ์‹ค์ œ ๋ฐ์ดํ„ฐ์…‹ ๊ธฐ๋ฐ˜ ์„ฑ๋Šฅ์„ ์ •๋ฐ€ํžˆ ํ‰๊ฐ€ยท๋น„๊ตํ•œ๋‹ค.
  2. ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์ธ ๊ฐœ๋ณ„ ๋ชจ๋ธ๋“ค์„ ์ „๋žต์ ์œผ๋กœ ๊ฒฐํ•ฉํ•œ ๋งž์ถคํ˜• ์•™์ƒ๋ธ” ํ•™์Šต ๊ธฐ๋ฒ•์„ ์„ค๊ณ„ยท๊ตฌํ˜„ยทํ‰๊ฐ€ํ•˜์—ฌ ์ „์ฒด ์ •ํ™•๋„, ๊ฒฌ๊ณ ์„ฑ, ํšจ์œจ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค.

II. ๋ฌธํ—Œ ๊ฒ€ํ† 

์ด ์„น์…˜์—์„œ๋Š” ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€์™€ ๊ด€๋ จ๋œ ๊ธฐ์กด ์—ฐ๊ตฌ, ๋ฐฉ๋ฒ•๋ก , ์ฃผ์š” ๊ฒฐ๊ณผ๋ฅผ ์‚ดํŽด๋ณธ๋‹ค. ํŠนํžˆ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•œ ์ ‘๊ทผ์— ์ดˆ์ ์„ ๋งž์ถ˜๋‹ค.

1) ์ง„ํ™”์  ํ๋ฆ„

์ดˆ๊ธฐ ์„œ๋ช… ๊ธฐ๋ฐ˜ ํƒ์ง€์—์„œ ์‹œ์ž‘ํ•ด ํ˜„์žฌ์˜ ์ •๊ตํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์ด๋ฅด๊ธฐ๊นŒ์ง€์˜ ๋ฐœ์ „์€ ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€ ๋ถ„์•ผ์˜ ํ•ต์‹ฌ ์ „ํ™˜์ ์ด๋‹ค. ์‚ฌ์ด๋ฒ„ ์œ„ํ˜‘์ด ์ ์  ๋ณต์žกํ•ด์ง์— ๋”ฐ๋ผ, ๋‚œ๋…ํ™”ยท๋‹คํ˜•์„ฑ ๋“ฑ ๊ณ ๋„ํ™”๋œ ํšŒํ”ผ ๊ธฐ๋ฒ•์ด ๋“ฑ์žฅํ–ˆ์œผ๋ฉฐ, ์ด์— ๋Œ€์‘ํ•˜๊ธฐ ์œ„ํ•ด ๋™์ ยท์ •์  ๋ถ„์„์„ ๊ฒฐํ•ฉํ•œ ML ๊ธฐ๋ฐ˜ ์ „๋žต์ด ๋ถ€์ƒํ–ˆ๋‹ค[1],[10],[14],[15]. ๊ณต๊ฒฉ์ž๊ฐ€ ์ ์  ์ •๊ตํ•ด์ง์— ๋”ฐ๋ผ, ํƒ์ง€ ๊ธฐ๋ฒ• ์—ญ์‹œ ๋™์ผํ•˜๊ฒŒ ๊ณ ๋„ํ™”ยท์œ ์—ฐยทํˆฌ๋ช…ํ•ด์•ผ ํ•œ๋‹ค๋Š” ์š”๊ตฌ๊ฐ€ ์ปค์ง€๊ณ  ์žˆ๋‹ค[4],[16],[17].

2) ์•…์„ฑ์ฝ”๋“œ ๋ณ€์ฒœ์‚ฌ

  • 2010๋…„๋Œ€ ์ดˆ โ€“ ์ฃผ๋กœ ์‚ฌ๊ธฐ์„ฑ ์•ฑยทํ”„๋ฆฌ๋ฏธ์—„ SMS ํŠธ๋กœ์ด๋ชฉ๋งˆ๊ฐ€ ์ฃผ๋ฅ˜๋ฅผ ์ด๋ฃจ์—ˆ๋‹ค[14],[18].
  • 2012โ€‘2014 โ€“ ์‚ฌ์šฉ์ž ๊ธฐ๋ฐ˜ ํ™•๋Œ€์™€ ํ•จ๊ป˜ ๋žœ์„ฌ์›จ์–ดยท๋ฑ…ํ‚น ํŠธ๋กœ์ด๋ชฉ๋งˆ(์˜ˆ: Svpeng, Faketoken)๊ฐ€ ๋“ฑ์žฅํ–ˆ๋‹ค[14].
  • 2015 โ€“ Stagefright ๋ฏธ๋””์–ด ์—”์ง„ ์ทจ์•ฝ์ ์ด ์•…์šฉ๋˜๋ฉฐ ์œ„ํ˜‘ ์ˆ˜์ค€์ด ๊ธ‰๊ฒฉํžˆ ์ƒ์Šนํ–ˆ๋‹ค[19].
  • ์ตœ๊ทผ โ€“ ๊ณต๊ธ‰๋ง ๊ณต๊ฒฉยท๋ชจ๋ฐ”์ผ APT(์˜ˆ: Triada)๊ฐ€ ์ธํ”„๋ผ์™€ ์‚ฌ์šฉ์ž๋ฅผ ๋™์‹œ์— ๋…ธ๋ฆฐ๋‹ค[3],[20].

Google Play Protect์™€ ๊ฐ™์€ ๋ฐฉ์–ด ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ์กด์žฌํ•˜์ง€๋งŒ, ์•…์„ฑ์ฝ”๋“œ์˜ ์ง€์†์ ์ธ ์กด์žฌ๋Š” ๋ณด๋‹ค ์ง„๋ณด๋œ ํƒ์ง€ ๊ธฐ์ˆ ์ด ํ•„์š”ํ•จ์„ ์‹œ์‚ฌํ•œ๋‹ค[10].

3) ๊ธฐ์กด ํƒ์ง€ ๊ธฐ๋ฒ•์˜ ํ•œ๊ณ„

๊ธฐ๋ฒ• ์žฅ์  ๋‹จ์ 
์„œ๋ช… ๊ธฐ๋ฐ˜ ๊ตฌํ˜„์ด ๊ฐ„๋‹จ ์ƒˆ๋กœ์šดยท๋ณ€ํ˜• ์•…์„ฑ์ฝ”๋“œ์— ๋ฌด๋ ฅ
ํœด๋ฆฌ์Šคํ‹ฑ ํ–‰๋™ ๊ธฐ๋ฐ˜ ํƒ์ง€ ๊ฐ€๋Šฅ ๋†’์€ ์˜คํƒ๋ฅ 
์ •์  ๋ถ„์„ ๋น ๋ฅธ ๋ถ„์„ ๋‚œ๋…ํ™”ยท๋Ÿฐํƒ€์ž„ ์œ„ํ˜‘์— ์ทจ์•ฝ
๋™์  ๋ถ„์„ ์‹ค์ œ ๋™์ž‘ ๊ด€์ฐฐ ๋น„์šฉยท์‹œ๊ฐ„ ์†Œ๋ชจ, ์กฐ๊ฑด๋ถ€ ํ–‰๋™ ๋ˆ„๋ฝ

์ด์™€ ๊ฐ™์ด ์ „ํ†ต์ ์ธ ๋ฐฉ๋ฒ•์€ ์•…์„ฑ์ฝ”๋“œ์˜ ๊ทœ๋ชจยท๋‹ค์–‘์„ฑยท์ง„ํ™” ์†๋„๋ฅผ ๋”ฐ๋ผ๊ฐ€์ง€ ๋ชปํ•œ๋‹ค[3],[27].

4) ๋จธ์‹ ๋Ÿฌ๋‹ ์ ์šฉ ์‹œ ๊ณ ๋ ค์‚ฌํ•ญ

  • ํŠน์ง• ์„ ํƒ โ€“ ์ตœ์ ์˜ ํŠน์„ฑ์„ ์ฐพ๋Š” ๊ฒƒ์ด ๋ชจ๋ธ ์„ฑ๋Šฅ์— ๊ฒฐ์ •์  ์˜ํ–ฅ์„ ๋ฏธ์นœ๋‹ค[23],[20].
  • ๋ชจ๋ธ ๋ณต์žก๋„ โ€“ ๊ณผ์ ํ•ฉ์„ ๋ฐฉ์ง€ํ•˜๋ฉด์„œ ์ถฉ๋ถ„ํžˆ ๋ณต์žกํ•œ ๋ชจ๋ธ ์„ค๊ณ„๊ฐ€ ํ•„์š”ํ•˜๋‹ค[4],[28].
  • ์ ๋Œ€์  ๊ณต๊ฒฉ โ€“ ๊ณต๊ฒฉ์ž๋Š” ๋ชจ๋ธ์„ ๊ต๋ž€์‹œํ‚ค๋Š” ์ ๋Œ€์  ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•œ๋‹ค; ์ด์— ๋Œ€ํ•œ ๋ฐฉ์–ด๊ฐ€ ํ•„์ˆ˜๋‹ค[31].
  • ์ด์งˆ์„ฑ โ€“ ์•ˆ๋“œ๋กœ์ด๋“œ ๋””๋ฐ”์ด์Šค์™€ OS ๋ฒ„์ „์ด ๋‹ค์–‘ํ•˜๋ฏ€๋กœ, ๋ณดํŽธ์ ์ธ ์†”๋ฃจ์…˜์ด ์š”๊ตฌ๋œ๋‹ค[29].

5) ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ์ „ํ†ต ๋ณด์•ˆ์˜ ์ฐจ๋ณ„์ 

ML์€ ๋ฐ์ดํ„ฐโ€‘๋“œ๋ฆฌ๋ธ ๋ฐฉ์‹์œผ๋กœ, ์ƒˆ๋กœ์šดยท๋ณ€ํ˜•๋œ ์œ„ํ˜‘์„ ํƒ์ง€ํ•˜๋Š” ๋ฐ ๋›ฐ์–ด๋‚œ ์œ ์—ฐ์„ฑ๊ณผ ํ™•์žฅ์„ฑ์„ ์ œ๊ณตํ•œ๋‹ค. ๋ฐ˜๋ฉด ์ „ํ†ต์ ์ธ ์„œ๋ช… ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์€ ์•Œ๋ ค์ง„ ์œ„ํ˜‘์—๋งŒ ํšจ๊ณผ์ ์ด๋‹ค[32]. ๊ทธ๋Ÿฌ๋‚˜ ML ์ ์šฉ ์‹œ ๊ณผ์ ํ•ฉ, ๋Œ€๊ทœ๋ชจ ํ•™์Šต ๋ฐ์ดํ„ฐ ํ•„์š”์„ฑ, ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ๋ถ€์กฑ ๋“ฑ์˜ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค[9].

6) ์ดˆ๊ธฐ ML ๋ชจ๋ธ์—์„œ ํ˜„์žฌ๊นŒ์ง€

์ดˆ๊ธฐ ์—ฐ๊ตฌ์—์„œ๋Š” Decision Tree, SVM ๋“ฑ ์ •์  ํŠน์ง•(๊ถŒํ•œยทAPI ํ˜ธ์ถœ)๋งŒ์„ ํ™œ์šฉํ–ˆ๋‹ค[34]. ๊ทธ๋Ÿฌ๋‚˜ ์ •์  ํŠน์ง•์€ ๋‚œ๋…ํ™”์— ์ทจ์•ฝํ•˜๋ฏ€๋กœ, ๋Ÿฐํƒ€์ž„ ํ–‰๋™์„ ๋ถ„์„ํ•˜๋Š” ๋™์  ํŠน์ง•์œผ๋กœ ์ดˆ์ ์ด ์ด๋™ํ–ˆ๋‹ค[12],[35]. ์ตœ๊ทผ์—๋Š” ์ ๋Œ€์  ML, ์•™์ƒ๋ธ”ยทํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ชจ๋ธ์„ ํ†ตํ•ด ์ •ํ™•๋„์™€ ๊ฒฌ๊ณ ์„ฑ์„ ๋™์‹œ์— ๋†’์ด๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ๋‹ค[31],[32],[35],[37],[39].

7) ํŠน์ง• ์„ ํƒยท๊ณตํ•™

  • ๋™์  ํŠน์ง• ์ถ”์ถœ โ€“ nโ€‘gram, ์ฝ”๋“œ ํ๋ฆ„, ํ–‰๋™ ํ”„๋กœํŒŒ์ผ๋ง ๋“ฑ ๋‹ค์–‘ํ•œ ๊ธฐ๋ฒ• ์‚ฌ์šฉ[15].
  • ์ฐจ์› ์ถ•์†Œ โ€“ ๊ณ ์ฐจ์› ํŠน์„ฑ ๊ณต๊ฐ„์—์„œ โ€œ์ฐจ์›์˜ ์ €์ฃผโ€๋ฅผ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด PCA, LDA, Feature Selection ๋“ฑ์„ ์ ์šฉํ•œ๋‹ค[41].

8) ์•™์ƒ๋ธ” ํ•™์Šต

์•™์ƒ๋ธ”์€ ์—ฌ๋Ÿฌ ๊ธฐ๋ณธ ๋ชจ๋ธ์˜ ์˜ˆ์ธก์„ ๊ฒฐํ•ฉํ•ด ์ •ํ™•๋„ยท๊ฒฌ๊ณ ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค. ์ฃผ์š” ๊ธฐ๋ฒ•์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

๊ธฐ๋ฒ• ์„ค๋ช…
Bagging ๋ฐ์ดํ„ฐ ์„œ๋ธŒ์…‹์„ ์ด์šฉํ•ด ๋‹ค์ˆ˜ ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๊ณ  ํ‰๊ท ยท๋‹ค์ˆ˜๊ฒฐ๋กœ ์˜ˆ์ธก
Boosting ์ด์ „ ๋ชจ๋ธ์ด ํ‹€๋ฆฐ ์ƒ˜ํ”Œ์— ๊ฐ€์ค‘์น˜๋ฅผ ๋†’์—ฌ ์ˆœ์ฐจ์ ์œผ๋กœ ํ•™์Šต
Stacking ๋ฉ”ํƒ€ ๋ชจ๋ธ์ด ๊ธฐ๋ณธ ๋ชจ๋ธ๋“ค์˜ ์˜ˆ์ธก์„ ์ž…๋ ฅ์œผ๋กœ ์ตœ์ข… ์˜ˆ์ธก

์•™์ƒ๋ธ”์€ ํŠนํžˆ ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€์—์„œ ์ •ํ™•๋„ยท์žฌํ˜„์œจยทF1 ์ ์ˆ˜๋ฅผ ํฌ๊ฒŒ ๋Œ์–ด์˜ฌ๋ฆฐ๋‹ค[18],[41]. ๋‹ค๋งŒ, ๋ชจ๋ธ ์ˆ˜๊ฐ€ ๋Š˜์–ด๋‚˜๋ฉด์„œ ์ปดํ“จํŒ… ๋น„์šฉ์ด ์ฆ๊ฐ€ํ•˜๊ณ , ๋ชจ๋ฐ”์ผ ํ™˜๊ฒฝ์—์„œ๋Š” ์„œ๋ฒ„โ€‘์‚ฌ์ด๋“œ ๋ฐฐ์น˜๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ๋‹ค[42],[5].

9) ์—ฐ๊ตฌ ๊ณผ์ œ์™€ ํ–ฅํ›„ ๋ฐฉํ–ฅ

  • ๋ชจ๋ธ ์ ์‘์„ฑ โ€“ ์ง€์†์ ์ธ ์•…์„ฑ์ฝ”๋“œ ์ง„ํ™”์— ๋Œ€์‘ํ•  ์ˆ˜ ์žˆ๋Š” ์ž๋™ ์—…๋ฐ์ดํŠธยท์ฆ๋ถ„ ํ•™์Šต ํ•„์š”.
  • ์‹ค์ œ ํ™˜๊ฒฝ ํšจ์œจ์„ฑ โ€“ ์ œํ•œ๋œ ๋ฆฌ์†Œ์Šค(CPU, ๋ฉ”๋ชจ๋ฆฌ, ๋ฐฐํ„ฐ๋ฆฌ)์—์„œ ์‹ค์‹œ๊ฐ„ ํƒ์ง€๊ฐ€ ๊ฐ€๋Šฅํ•˜๋„๋ก ๊ฒฝ๋Ÿ‰ํ™”.
  • ํด๋ž˜์Šค ๋ถˆ๊ท ํ˜• โ€“ ์•…์„ฑ ์ƒ˜ํ”Œ์ด ์ƒ๋Œ€์ ์œผ๋กœ ์ ์€ ์ƒํ™ฉ์—์„œ ์ •ํ™•ํ•œ ํ‰๊ฐ€์™€ ํ•™์Šต์ด ํ•„์š”.
  • ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ โ€“ ๋ณด์•ˆ ๋‹ด๋‹น์ž๊ฐ€ ๋ชจ๋ธ ๊ฒฐ์ •์„ ์ดํ•ดํ•˜๊ณ  ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•จ.

III. ์—ฐ๊ตฌ ๋ฐฉ๋ฒ•๋ก 

๋ณธ ์—ฐ๊ตฌ๋Š” ์ •๋Ÿ‰์  ์ ‘๊ทผ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ, ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€๋ฅผ ์œ„ํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฒ• ์ ์šฉ์— ์ดˆ์ ์„ ๋งž์ถ˜๋‹ค. ์ฃผ์š” ๋‹จ๊ณ„๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

1) ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ „์ฒ˜๋ฆฌ

  • ๋ฐ์ดํ„ฐ์…‹: โ€œTUANDROMDโ€ ๋ฐ์ดํ„ฐ์…‹(4,465๊ฐœ ์•ฑ) ์‚ฌ์šฉ.
    • ํŠน์ง•: 241๊ฐœ์˜ ์ด์ง„ํ˜• ๊ถŒํ•œยทAPI ํ˜ธ์ถœ ํŠน์„ฑ.
    • ๋ผ๋ฒจ: โ€˜malwareโ€™(์•…์„ฑ)์™€ โ€˜goodwareโ€™(์ •์ƒ) ๋‘ ํด๋ž˜์Šค.
  • ํ˜•์‹: ๋ชจ๋“  ํŠน์„ฑ์€ float64 ํ˜•์‹์ด๋ฉฐ, ๋ผ๋ฒจ์€ object ํ˜•์‹ โ†’ int(0/1)๋กœ ๋ณ€ํ™˜.
  • ์ „์ฒ˜๋ฆฌ: ๊ฒฐ์ธก์น˜ ์ œ๊ฑฐ, ํŠน์„ฑ ์ •๊ทœํ™”, ๋ผ๋ฒจ ์ธ์ฝ”๋”ฉ ์ˆ˜ํ–‰.

2) ๋ชจ๋ธ ์„ ์ • ๋ฐ ๊ตฌํ˜„

๋ชจ๋ธ ์ฃผ์š” ํŠน์ง• ์ ์šฉ ์ด์œ 
Decision Tree (DT) ์ง๊ด€์ ยทํ•ด์„ ์šฉ์ด ๋ฒ ์ด์Šค๋ผ์ธ ๊ตฌ์ถ•
Random Forest (RF) ๋‹ค์ˆ˜ DT ๊ฒฐํ•ฉ, ๋†’์€ ์ •ํ™•๋„ยท๊ฒฌ๊ณ ์„ฑ ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ์— ๊ฐ•ํ•จ
Support Vector Machine (SVM) ๊ณ ์ฐจ์› ๊ณต๊ฐ„์—์„œ ํšจ๊ณผ์  ๋‹ค์ˆ˜ ํŠน์„ฑ ํ™œ์šฉ
Logistic Regression (LR) ์„ ํ˜• ๋ถ„๋ฅ˜, ๋น ๋ฅธ ํ•™์Šต ๋น„๊ต ๋Œ€์ƒ
Neural Network (NN) ๊นŠ์€ ๊ตฌ์กฐ, ๋ณต์žก ํŒจํ„ด ํ•™์Šต ๋น„์„ ํ˜• ๊ด€๊ณ„ ํฌ์ฐฉ
AdaBoost ์•ฝํ•œ ํ•™์Šต๊ธฐ(Decision Stump) ๊ฒฐํ•ฉ ์˜ค๋ฅ˜ ๋ณด์ •
Stacking Classifier ๋ฉ”ํƒ€ ๋ชจ๋ธ ํ™œ์šฉ ๋‹ค์–‘ํ•œ ๋ชจ๋ธ ์žฅ์  ๊ฒฐํ•ฉ

๊ฐ ๋ชจ๋ธ์€ rando$m_s$tate=42(์žฌํ˜„์„ฑ ํ™•๋ณด) ๋“ฑ ๋™์ผํ•œ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ์„ค์ •์„ ์ ์šฉํ•˜์˜€๋‹ค.

3) ํ•™์Šตยทํ‰๊ฐ€ ์ ˆ์ฐจ

  • ๋ฐ์ดํ„ฐ ๋ถ„ํ• : Stratified 70โ€ฏ% ํ›ˆ๋ จ / 30โ€ฏ% ํ…Œ์ŠคํŠธ.
  • ๊ต์ฐจ ๊ฒ€์ฆ: kโ€‘fold(๋ณดํ†ต k=5) ๊ต์ฐจ ๊ฒ€์ฆ์œผ๋กœ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ ํ™•์ธ.
  • ํ†ต๊ณ„ ๊ฒ€์ฆ: ๋ชจ๋ธ ๊ฐ„ ์„ฑ๋Šฅ ์ฐจ์ด๋ฅผ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด tโ€‘test ์ˆ˜ํ–‰.
  • ํ‰๊ฐ€์ง€ํ‘œ: Accuracy, Precision, Recall, F1โ€‘Score, AUCโ€‘ROC, ํ•™์Šตยท์˜ˆ์ธก ์‹œ๊ฐ„, ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰, ๋ชจ๋ธ ๋ณต์žก๋„(๋…ธ๋“œ ์ˆ˜) ๋“ฑ ๋‹ค๊ฐ๋„๋กœ ํ‰๊ฐ€.

4) ์•™์ƒ๋ธ” ๊ตฌํ˜„

  • Voting Ensemble: ๊ฐœ๋ณ„ ๋ชจ๋ธ(DT, RF, SVM, NN)์˜ ์˜ˆ์ธก์„ Hard Voting(๋‹ค์ˆ˜๊ฒฐ) ๋ฐฉ์‹์œผ๋กœ ๊ฒฐํ•ฉ.
  • ๋ชฉํ‘œ: ๊ฐœ๋ณ„ ๋ชจ๋ธ์˜ ์žฅ์ ์„ ์‚ด๋ฆฌ๊ณ  ์•ฝ์ ์„ ๋ณด์™„ํ•˜์—ฌ ์ „๋ฐ˜์ ์ธ ํƒ์ง€ ์ •ํ™•๋„์™€ ๊ฒฌ๊ณ ์„ฑ์„ ํ–ฅ์ƒ.

IV. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ฐ ๋ถ„์„

1) ๊ฐœ๋ณ„ ๋ชจ๋ธ ์„ฑ๋Šฅ

๋ชจ๋ธ Accuracy Precision Recall F1 AUC ํ•™์Šต ์‹œ๊ฐ„ ๋ฉ”๋ชจ๋ฆฌ
DT 0.842 0.81 0.78 0.79 0.86 0.12โ€ฏs 45โ€ฏMB
RF 0.913 0.89 0.87 0.88 0.95 1.34โ€ฏs 210โ€ฏMB
SVM 0.889 0.86 0.84 0.85 0.92 2.07โ€ฏs 180โ€ฏMB
LR 0.831 0.79 0.76 0.77 0.84 0.09โ€ฏs 40โ€ฏMB
NN (3โ€‘layer) 0.902 0.88 0.85 0.86 0.94 3.21โ€ฏs 250โ€ฏMB

Random Forest๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ์ •ํ™•๋„์™€ AUC๋ฅผ ๊ธฐ๋กํ–ˆ์œผ๋ฉฐ, Neural Network๋„ ์ „๋ฐ˜์ ์œผ๋กœ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค. Decision Tree์™€ Logistic Regression์€ ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ์ž„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋น„๊ต์  ๊ดœ์ฐฎ์€ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.

2) ์•™์ƒ๋ธ” ๋ชจ๋ธ ์„ฑ๋Šฅ

์•™์ƒ๋ธ” ๋ฐฉ์‹ Accuracy Precision Recall F1 AUC
Hard Voting (DT+RF+SVM+NN) 0.928 0.91 0.89 0.90 0.97
Soft Voting (ํ™•๋ฅ  ํ‰๊ท ) 0.925 0.90 0.88 0.89 0.96
Stacking (Metaโ€‘LR) 0.931 0.92 0.90 0.91 0.98

์•™์ƒ๋ธ” ๋ฐ ์Šคํƒœํ‚น ๋ฐฉ์‹์€ ๊ฐœ๋ณ„ ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์ •ํ™•๋„ 92โ€ฏ%โ€ฏ~โ€ฏ93โ€ฏ%, AUC 0.96โ€ฏ~โ€ฏ0.98์„ ๋‹ฌ์„ฑํ•˜์˜€๋‹ค. ํŠนํžˆ ์Šคํƒœํ‚น(๋ฉ”ํƒ€ ๋ชจ๋ธ๋กœ Logistic Regression ์‚ฌ์šฉ)์€ ๊ฐ€์žฅ ๋†’์€ F1โ€‘Score์™€ AUC๋ฅผ ๊ธฐ๋กํ–ˆ๋‹ค.

3) ํ†ต๊ณ„์  ๊ฒ€์ฆ

  • tโ€‘test ๊ฒฐ๊ณผ: ์•™์ƒ๋ธ”(์Šคํƒœํ‚น)๊ณผ ์ตœ์šฐ์ˆ˜ ๋‹จ์ผ ๋ชจ๋ธ(Random Forest) ์‚ฌ์ด์˜ F1โ€‘Score ์ฐจ์ด๋Š” pโ€ฏ<โ€ฏ0.01๋กœ ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•จ์„ ํ™•์ธํ•˜์˜€๋‹ค. ์ด๋Š” ์•™์ƒ๋ธ”์ด ๋‹จ์ผ ๋ชจ๋ธ๋ณด๋‹ค ์ผ๊ด€๋˜๊ฒŒ ์šฐ์ˆ˜ํ•จ์„ ์˜๋ฏธํ•œ๋‹ค.

4) ๋ฆฌ์†Œ์Šค ์†Œ๋น„

๋ชจ๋ธ ํ•™์Šต ์‹œ๊ฐ„ ์ถ”๋ก  ์‹œ๊ฐ„(1โ€ฏsample) ๋ฉ”๋ชจ๋ฆฌ
DT 0.12โ€ฏs 0.001โ€ฏs 45โ€ฏMB
RF 1.34โ€ฏs 0.006โ€ฏs 210โ€ฏMB
SVM 2.07โ€ฏs 0.004โ€ฏs 180โ€ฏMB
NN 3.21โ€ฏs 0.008โ€ฏs 250โ€ฏMB
Stacking 5.12โ€ฏs 0.015โ€ฏs 340โ€ฏMB

๋ชจ๋ฐ”์ผ ๋””๋ฐ”์ด์Šค์— ์ง์ ‘ ๋ฐฐํฌํ•˜๋ ค๋ฉด ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ(DT, LR) ํ˜น์€ ํด๋ผ์šฐ๋“œโ€‘์˜คํ”„๋กœ๋“œํ˜• ์•™์ƒ๋ธ”์ด ํ˜„์‹ค์ ์ด๋‹ค. ๋ฐ˜๋ฉด, ๋†’์€ ์ •ํ™•๋„๊ฐ€ ์š”๊ตฌ๋˜๋Š” ์„œ๋ฒ„โ€‘์‚ฌ์ด๋“œ ํ™˜๊ฒฝ์—์„œ๋Š” ์Šคํƒœํ‚น๊ณผ ๊ฐ™์€ ๋ณตํ•ฉ ๋ชจ๋ธ์ด ์ ํ•ฉํ•˜๋‹ค.


V. ๊ฒฐ๋ก  ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ

๋ณธ ์—ฐ๊ตฌ๋Š” ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€๋ฅผ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋น„๊ตํ•˜๊ณ , ์•™์ƒ๋ธ”ยท์Šคํƒœํ‚น์„ ํ†ตํ•ด ์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™”ํ•˜์˜€๋‹ค. ์ฃผ์š” ๊ฒฐ๊ณผ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  1. ๊ณ ์ฐจ์› ์ด์ง„ ํŠน์„ฑ(๊ถŒํ•œยทAPI ํ˜ธ์ถœ)๋งŒ์œผ๋กœ๋„ ์ถฉ๋ถ„ํžˆ ๊ฐ•๋ ฅํ•œ ๋ถ„๋ฅ˜๊ฐ€ ๊ฐ€๋Šฅํ•จ์„ ํ™•์ธํ•˜์˜€๋‹ค.
  2. Random Forest์™€ Neural Network์ด ๋‹จ์ผ ๋ชจ๋ธ ์ค‘ ๊ฐ€์žฅ ๋†’์€ ์ •ํ™•๋„์™€ AUC๋ฅผ ๋ณด์˜€์œผ๋ฉฐ, ์Šคํƒœํ‚น ์•™์ƒ๋ธ”์ด ์ด๋ฅผ ๋Šฅ๊ฐ€ํ•˜์˜€๋‹ค.
  3. ์•™์ƒ๋ธ”์€ ํŠนํžˆ ๋‹คํ˜•์„ฑยท๋‚œ๋…ํ™” ์•…์„ฑ์ฝ”๋“œ์— ๋Œ€ํ•œ ๊ฒฌ๊ณ ์„ฑ์„ ๋†’์ด๋ฉฐ, ํด๋ž˜์Šค ๋ถˆ๊ท ํ˜• ๋ฌธ์ œ์—๋„ ์–ด๋А ์ •๋„ ์™„ํ™” ํšจ๊ณผ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
  4. ๋ฆฌ์†Œ์Šค ์ธก๋ฉด์—์„œ๋Š” ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ์ด ๋ชจ๋ฐ”์ผ ๋””๋ฐ”์ด์Šค์— ์ ํ•ฉํ•˜๊ณ , ๋ณตํ•ฉ ๋ชจ๋ธ์€ ์„œ๋ฒ„โ€‘์‚ฌ์ด๋“œ ํ˜น์€ ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜ ๋ฐฐ์น˜๊ฐ€ ๋ฐ”๋žŒ์งํ•˜๋‹ค.

ํ–ฅํ›„ ์—ฐ๊ตฌ ๊ณผ์ œ

  • ์ฆ๋ถ„ ํ•™์Šต ๋ฐ ์˜จ๋ผ์ธ ์—…๋ฐ์ดํŠธ โ€“ ์ƒˆ๋กœ์šด ์•…์„ฑ์ฝ”๋“œ ์ƒ˜ํ”Œ์ด ์ง€์†์ ์œผ๋กœ ์ถ”๊ฐ€๋˜๋Š” ํ™˜๊ฒฝ์— ๋งž์ถฐ ๋ชจ๋ธ์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ฐฑ์‹ ํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๊ฐœ๋ฐœ.
  • ๋‹ค์ค‘ ๋ชจ๋‹ฌ ํŠน์ง• ํ†ตํ•ฉ โ€“ ์ •์ ยท๋™์  ํŠน์ง•, ๋„คํŠธ์›Œํฌ ํŠธ๋ž˜ํ”ฝ, ์‹œ์Šคํ…œ ์ฝœ ๋กœ๊ทธ ๋“ฑ์„ ๊ฒฐํ•ฉํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต ๋ชจ๋ธ ํƒ์ƒ‰.
  • ์ ๋Œ€์  ๋ฐฉ์–ด ๊ฐ•ํ™” โ€“ ์ ๋Œ€์  ์ƒ˜ํ”Œ ์ƒ์„ฑ ๊ธฐ๋ฒ•์— ๋Œ€ํ•œ ๋ฐฉ์–ด ๋ฉ”์ปค๋‹ˆ์ฆ˜(์˜ˆ: adversarial training, defensive distillation) ์ ์šฉ ๋ฐ ํ‰๊ฐ€.
  • ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ํ–ฅ์ƒ โ€“ SHAP, LIME ๋“ฑ ์„ค๋ช… ๊ฐ€๋Šฅํ•œ AI ๊ธฐ๋ฒ•์„ ๋„์ž…ํ•ด ๋ณด์•ˆ ๋‹ด๋‹น์ž๊ฐ€ ๋ชจ๋ธ ๊ฒฐ์ •์„ ์ง๊ด€์ ์œผ๋กœ ์ดํ•ดํ•˜๋„๋ก ์ง€์›.
  • ์—๋„ˆ์ง€ ํšจ์œจ ์ตœ์ ํ™” โ€“ ๋ชจ๋ฐ”์ผ ๋””๋ฐ”์ด์Šค์—์„œ์˜ ์ „๋ ฅ ์†Œ๋น„๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๊ฒฝ๋Ÿ‰ํ™” ๋ชจ๋ธ ๋ฐ ํ•˜๋“œ์›จ์–ด ๊ฐ€์†๊ธฐ ํ™œ์šฉ ๋ฐฉ์•ˆ ์—ฐ๊ตฌ.

๋ณธ ๋…ผ๋ฌธ์€ ์•ˆ๋“œ๋กœ์ด๋“œ ์•…์„ฑ์ฝ”๋“œ ํƒ์ง€ ๋ถ„์•ผ์—์„œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ•˜๊ณ , ์•™์ƒ๋ธ” ํ•™์Šต์ด ์ œ๊ณตํ•˜๋Š” ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์‹ค์ฆํ•˜์˜€๋‹ค. ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ์ œ์‹œ๋œ ๊ณผ์ œ๋“ค์„ ํ•ด๊ฒฐํ•จ์œผ๋กœ์จ, ๋ณด๋‹ค ์‹ค์‹œ๊ฐ„ยท๊ฒฝ๋Ÿ‰ยท๊ฒฌ๊ณ ํ•œ ์•…์„ฑ์ฝ”๋“œ ๋ฐฉ์–ด ์ฒด๊ณ„๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์ด๋‹ค.

View Original PDF on ArXiv