์ •๋ฆฌ.

LETS(Local Exchange and Trading System)

  • ์„œ๋กœ๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ๋ฐฐ์›€๊ณผ ์ง€์‹์˜ ํ’ˆ์•—์ด ์‹œ์Šคํ…œ
  • ํฌ์ŠคํŠธ ์ž‡์„ ํ†ตํ•œ ์ƒˆ๋กœ์šด ์•„์ด๋””์–ด ๊ณต์œ  ๋ฐฉ๋ฒ•.
    • ๋‚ด๊ฐ€ ์˜ค๋Š˜ ์•Œ์•„๊ฐ€๊ณ  ์‹ถ์€ ๊ฒƒ
    • ๋‚ด๊ฐ€ ์˜ค๋Š˜ ์•Œ๋ ค์ค„ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ
    • ๋‚ด๊ฐ€ ์˜ค๋Š˜ ๋ฐฐ์›€์„ ๋‚˜๋ˆˆ ๊ฒƒ

๋‚ด์šฉ.

  • ํ•œ๊ตญ์–ด ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์˜ ์–ด๋ ค์›€

  • ํ•œ๊ตญ์–ด ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋Š” PreProcessing๊ฐ€ 80% ์ด์ƒ

  • ๋ฌธ์ œ ์ •์˜๋ฅผ ์ž˜ ํ•˜๋Š” ๊ฒƒ์ด ๋ชจ๋ธ์„ ๊ตฌํ˜„ํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ์ค‘์š”.

  • Preprocessing์˜ ์ค‘์š”์„ฑ.

    • Garbage in, Garbage Out
    • ํ˜•ํƒœ์†Œ ๋ถ„์„๊ธฐ๊ฐ€ ์–ด๋–ค Vocabulary๋ฅผ ์‚ฌ์šฉํ•˜๋Š”์ง€?
  • ๊ผญ Deep Learning์œผ๋กœ ํ’€์–ด์•ผํ•˜๋Š” ๋ฌธ์ œ์ธ๊ฐ€?

    • ๋” ๊ฐ„๋‹จํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์œผ๋ฉด ๊ทธ ๋ฐฉ๋ฒ•์œผ๋กœ ํ•ด๊ฒฐํ•˜์ž.
  • EDA ํƒ์ƒ‰์  ๋ฐ์ดํ„ฐ ๋ถ„์„(Exploratory Data Analysis)

  • Domain Analysis

  • Feature Engineering

    • ๋”ฅ๋Ÿฌ๋‹์€ ๋ชจ๋ธ๋ณด๋‹ค Feature๊ฐ€ ๋” ์ค‘์š”.
    • ๋ฌธ์ œ ํ•ด๊ฒฐ์— ํ•„์š”ํ•œ Feature๋ฅผ Selectionํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”.
    • Feature์˜ ๊ฐœ์ˆ˜๋ฅผ ๊ณ ๋ฏผํ•˜๊ธฐ. ์ฐจ์›์ˆ˜๊ฐ€ ๋†’์•„์ง€๋ฉด ์ œ๋Œ€๋กœ ํด๋Ÿฌ์Šคํ„ฐ๋ง์ด ์•ˆ๋œ๋‹ค.
    • Feature์˜ ๊ฐœ์ˆ˜๋ฅผ ์ค„์ด๋ฉด Overfitting ๋ฐฉ์ง€ํ•œ๋‹ค.
    • ๋ชจ๋“  ๋ฐ์ดํ„ฐ ๋‹ค ๋•Œ๋ ค๋„ฃ์œผ๋ฉด ์•ˆ๋ ๊นŒ์š”?
      • ํ•  ์ˆ˜๋Š” ์žˆ๋Š”๋ฐ Overfitting ๋ฌธ์ œ โ†’ ์ •ํ™•๋„๋Š” ๋†’์œผ๋‚˜ ์˜ˆ์ธก์€ ๋‚ฎ๋‹ค.
      • ์ฐจ์›์ด ๋„ˆ๋ฌด ๋งŽ์•„์ ธ์„œ ๋ฐ์ดํ„ฐ์˜ ๋ฐ€๋„๊ฐ€ ๋–จ์–ด์ง
    • ์–ด๋–ค Feature ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋†’์€์ง€๋Š” ์‚ฌํ›„ ๋ถ„์„ํ•ด๋ด์•ผ ์•ˆ๋‹ค.
    • ์‚ฌ๋žŒ์ด ์ง์ ‘ ํŠน์ดํ•œ ํŒจํ„ด์„ ์ฐพ๋Š”๋‹ค.
    • ์ฒ˜์Œ๋ถ€ํ„ฐ ๋ฌด์Šจ Feature ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋†’์€์ง€ ๋ชจ๋ฅธ๋‹ค.
    • ์šฉ๋Ÿ‰์€ ๋”์šฑ ์ปค์งˆ ์ˆ˜ ๋ฐ–์— ์—†์Œ โ†’ Gigaโ†’ Tera โ†’ Peta
      • Json๋ณด๋‹ค๋Š” ํŠน์ •ํ•œ Feature๋ฅผ ์„ ๋ณ„ํ•˜์—ฌ CSV, TSV๋กœ ๋ณ€ํ™˜.
      • ๋ชฉ์ ์— ๋งž๋„๋ก ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ : Cohort Retention๋ฅผ ์œ„ํ•œ DataSet
      • ๋ฐ์ดํ„ฐ์— ์ค‘๋ณต์ด ์—†๋„๋ก ์ตœ๋Œ€ํ•œ ์„ค์ •
      • ์ตœ๋Œ€ํ•œ ๋ฐ์ดํ„ฐํฌ๊ธฐ๋ฅผ ์ค„์ด๊ธฐ.
      • Flatten Table Data
      • Table Size ์••์ถ•
    • ์ฝœ๋“œ๋ฐ์ดํ„ฐ๋Š” ๋น„์šฉ์ ˆ๊ฐ์— ์ฃผ๋ ฅ
    • ํŠธ๋ ˆ์ด๋‹ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์ฆˆ๋ฅผ ์ค„์—ฌ๋ณด๋Š” ๊ฒƒ๋„ ๋ฐฉ๋ฒ• (1๊ฐœ์›” โ†’ 10์ผ โ†’ 24์‹œ๊ฐ„ )
    • ๋จธ์‹ ๋Ÿฌ๋‹์— ๋“ค์–ด๊ฐ€๋Š” ํ”ผ์ณ๋Š” ์ตœ๋Œ€ํ•œ ์ค„์ด๊ณ  ์ฐจ์›์„ ์ถ•์†Œํ•ด์„œ ํŠธ๋ ˆ์ด๋‹ ๋น„์šฉ์„ ์ค„์ด๊ธฐ.
  • ์–ด๋–ป๊ฒŒ ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด์•ผ ํ• ๊นŒ?

    • ์–ด๋–ค๊ฒŒ ๋” ์ค‘์š”ํ•œ์ง€ ๋ชจ๋ฅด๋‹ˆ ๋ชจ๋“ ๊ฑธ ๋‹ค ๋กœ๊ทธ๋กœ ์Œ“๊ณ 
    • EDA๋ฅผ ์ง„ํ•˜๊ฒŒ ์ง„ํ–‰ํ•ด์„œ ํŠน์ดํ•œ ํŒจํ„ด์„ ์ฐพ๊ณ 
    • ํŠน์ดํ•œ ํŒจํ„ด์„ ํ†ตํ•ด ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ค๊ณ 
    • ๋ฐ์ดํ„ฐ๋Š” ํ…Œ์ŠคํŠธ ๊ธฐ๋ฐ˜ Validation.
    • ๊ณ„์†ํ•ด์„œ ์‹œ๋„ํ•˜๊ณ  ์‹คํŒจํ•˜๋‹ค ๋ณด๋ฉด
    • ์›ํ•˜์‹œ๋Š” ๋ชจ๋ธ์ด ๋‚˜์˜ฌ๊ฒ๋‹ˆ๋‹ค.
  • SVM์€ ์™œ ์ ์šฉ์„ ์•ˆํ–ˆ๋Š”๊ฐ€?

    • ์ฒ˜์Œ ์ ์šฉํ–ˆ์ง€๋งŒ ์ ์  ์ •ํ™•๋„๊ฐ€ ๊ฐ์†Œํ•œ๋‹ค.
    • Feature๋ฅผ ์„ ๋ณ„ํ•ด์„œ DeepLearning์„ ์ ์šฉํ–ˆ๋‹ค.
  • ๋ชจ๋ธ์ด ๋ณ€๊ฒฝ๋œ๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ํ• ๊นŒ์š”?

    • ๊ทœ์•ฝ์„ ๋ฏธ๋ฆฌ ์ •ํ•˜๊ธฐ Code Level
    • Validation์„ ํ•ด์„œ Warning์ด ๋‚˜์˜จ๋‹ค๋ฉด ์ปค๋ฎค๋‹ˆ์ผ€์ด์…˜ํ•˜๊ธฐ.
  • Preprocessing โ†’ normalize โ†’ 0~1์‚ฌ์ด๋กœ ๋ฐ”๊พธ๊ธฐ. log

๋‚˜๋Š” ๋ฌด์—‡์„ ์–ป์—ˆ๋Š”๊ฐ€?

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ

  • ์ธํ„ด ๊ณผ์ œ๋กœ ๋ฐ›์•˜๋˜ ํ•œ๊ตญ์–ด ๋Œ“๊ธ€ ๋ถ„์„์—์„œ ๋‚ด๊ฐ€ ๊ฒช์˜€๋˜ ๋ฌธ์ œ๋“ค์„ ์ด๋ ‡๊ฒŒ๋„ ํ’€ ์ˆ˜ ์žˆ๊ตฌ๋‚˜๋ผ๋Š” ๊ฑธ ์•Œ๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • ํ•œ๊ตญ์–ด ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๊ฐ€ ๋งค์šฐ ์ค‘์š”ํ•˜๋‹ค๋Š” ์ .
  • ๋‚ด๊ฐ€ ์‚ฌ์šฉํ•˜๊ณ  ์žˆ๋Š” ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๊ฐ€ ์–ด๋–ป๊ฒŒ ์ž์—ฐ์–ด ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ์žˆ๋Š”์ง€?
  • ๋‚ด๊ฐ€ ์–ด๋– ํ•œ ํ˜•ํƒœ์˜ ํ•œ๊ตญ์–ด๋ฅผ ๋ถ„์„ํ•˜๊ณ  ์žˆ๋Š”์ง€?

๋ฌธ์ œ์— ๋Œ€ํ•œ ์ •์˜ ์ค‘์š”์„ฑ.

  • ์š”๊ตฌ์‚ฌํ•ญ์— ๋Œ€ํ•œ ์ •์˜๊ฐ€ ๋ช…ํ™•ํ•˜์ง€ ์•Š์œผ๋ฉด ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค์ง€ ์•Š์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๋‹ค.
  • ํšŒ์‚ฌ๊ฐ€ ์ปค์ง€๋ฉด ์ปค์งˆ์ˆ˜๋ก ๋ฌธ์ œ์— ๋Œ€ํ•œ ์ดํ•ด์™€ ์š”๊ตฌ์‚ฌํ•ญ์„ ์ •์˜ํ•˜๋Š”๊ฒŒ ์ค‘์š”ํ•˜๋‹ค.
  • ๋ฌธ์ œ๋ฅผ ์–ด๋–ป๊ฒŒ ์ •์˜ํ•  ๊ฒƒ์ธ๊ฐ€?
    • ๋ญ˜ ์›ํ•˜๋Š”์ง€? ์–ด๋–ค ๊ฒƒ์„ ํ•ด๊ฒฐํ•˜๊ณ  ์‹ถ์€์ง€?
    • ์ด๋Ÿฐ Case์—๋Š” ์–ด๋–ป๊ฒŒ ํ•  ๊ฒƒ์ธ์ง€?
  • ์š”๊ตฌํ•˜๋Š” ์‚ฌ๋žŒ์ด ์›ํ•˜๋Š” ๊ฒƒ์„ ์ถฉ์กฑํ•˜๋Š” ๊ฒŒ ๊ฐ€์žฅ ์ค‘์š”ํ•˜๋‹ค.

๋ฐ์ดํ„ฐ ์ •์ œ์˜ ์ค‘์š”์„ฑ.

  • ์—„์ฒญ๋‚˜๊ฒŒ ๋งŽ์€ Feature๋ฅผ ์ƒ๋Œ€๋กœ ์˜๋ฏธ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋ฝ‘์•„๋‚ด๊ธฐ ์œ„ํ•ด์„ ?
    • Peta ํฌ๊ธฐ๋ณด๋‹ค ๋” ๋งŽ์€ Data์™€ ์—„์ฒญ๋‚œ Computing์ด ํ•„์š”ํ•˜๋‹ค.
    • ๊ตฌ๊ธ€ ์ •๋„์˜ ๋ฐ์ดํ„ฐ ํฌ๊ธฐ์™€ Computing์ด๋ฉด ๊ฐ€๋Šฅํ• ์ง€๋„?
  • ์šฐ๋ฆฌ๋Š” ๋Œ€๋ถ€๋ถ„ ๊ทธ๋Ÿฐ ๋ฐ์ดํ„ฐ๊ฐ€ ์—†๋‹ค.
    • ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— ๋ฐ์ดํ„ฐ์—์„œ Feature๋ฅผ ์„ ๋ณ„ํ•  ์ˆ˜ ์žˆ์–ด์•ผํ•˜๋ฉฐ.
    • ๋‹ค์–‘ํ•œ Feature๋ฅผ ์‹คํ—˜ํ•˜๊ณ  ์ •์˜ํ•˜๋Š”๊ฒŒ ์ค‘์š”ํ•œ ๊ฒƒ ๊ฐ™๋‹ค.

์•ž์œผ๋กœ ๋ฏธ๋ž˜?

  • SQL์„ ์˜ˆ์ „์—๋Š” ๊ฐœ๋ฐœ์ž๋งŒ ์‚ฌ์šฉํ–ˆ๋”๋ผ๋ฉด ํ˜„์žฌ๋Š” ๊ฐœ๋ฐœ์ž๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์ด ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ
    • ์•ž์œผ๋กœ ์ด๋Ÿฐ Data๋ฅผ ์‰ฝ๊ฒŒ ์‚ฌ์šฉํ•˜๋Š” Tool์ด ๋‚˜์˜ฌ ๊ฒƒ ๊ฐ™๋‹ค.
    • Data๋ฅผ ์–ด๋–ป๊ฒŒ ํ•ด์„ํ•  ๊ฒƒ์ธ๊ฐ€? ์–ด๋–ป๊ฒŒ ์ •์ œํ•  ๊ฒƒ์ธ๊ฐ€? ์ค‘์š”ํ•ด์งˆ ๊ฒƒ ๊ฐ™๋‹ค.
  • ์ƒ๊ฐ๋ณด๋‹ค ์—„์ฒญ๋‚œ Data์˜ ํฌ๊ธฐ.
  • ๊ด€๋ จ ๋…ผ๋ฌธ ๋งŽ์ด ์ฝ์–ด๋ณด๊ธฐ.

์„ธ์ƒ์€ ๋Œ€๋‹จํ•œ ์‚ฌ๋žŒ๋“ค์ด ๋„ˆ๋ฌด ๋งŽ๊ณ  ์–ธ์ œ๋‚˜ ๋‚˜์˜ ๋ถ€์กฑํ•จ์„ ๋Š๋‚€๋‹ค. ๊ฐœ๋ฐœ์ž๊ฐ€ ๊ณผ์—ฐ ๊ฐœ๋ฐœ๋งŒ ํ•˜๋Š” ์‚ฌ๋žŒ์ธ๊ฐ€? ์ง€๊ธˆ์€ ๋ฌธ์ œํ•ด๊ฒฐ์„ ํ•˜๊ธฐ ์œ„ํ•ด ์†Œํ”„ํŠธ์›จ์–ด๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์‚ฌ๋žŒ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™๋‹ค.

Reference