Cartinoe5930 commited on
Commit
258f7a1
ยท
verified ยท
1 Parent(s): 4d47020

Create KOREAN_README.md

Browse files
Files changed (1) hide show
  1. KOREAN_README.md +172 -0
KOREAN_README.md ADDED
@@ -0,0 +1,172 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [English](https://huggingface.co/KRX-Data/WON-Reasoning/blob/main/README.md) | **ํ•œ๊ตญ์–ด**
2
+
3
+ # โ‚ฉON: ํ•œ๊ตญ ๊ธˆ์œต์„ ์œ„ํ•œ LLM
4
+
5
+ ## ์†Œ๊ฐœ
6
+ โ‚ฉON์€ ํ•œ๊ตญ ๊ธˆ์œต ๋ถ„์•ผ์˜ ์ž‘์—…์— ํŠนํ™”๋œ ๊ณ ๊ธ‰ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ž…๋‹ˆ๋‹ค.
7
+ โ‚ฉON์€ ๊ธˆ์œต ๋ถ„์•ผ์˜ AI ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ ์‹ ๋ขฐ์„ฑ๊ณผ ํˆฌ๋ช…์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
8
+ โ‚ฉON ๊ฐœ๋ฐœ์˜ ํ•ต์‹ฌ ๋ชฉ์ ์€ ์—ฐ๊ตฌ์˜ ๊ฐœ๋ฐฉ์„ฑ์„ ์ด‰์ง„ํ•˜๊ณ , ์—„๊ฒฉํ•œ ๊ธˆ์œต ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ค€์„ ๋งˆ๋ จํ•˜๋ฉฐ, ํ•œ๊ตญ ๊ธˆ์œต ํŠนํ™” ์–ธ์–ด ๋ชจ๋ธ ํ›ˆ๋ จ์— ์žˆ์–ด ์ตœ์ ์˜ ์‹ค์ฒœ ์‚ฌ๋ก€๋ฅผ ํ™•๋ฆฝํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
9
+ ์ด ๋ชจ๋ธ์€ ํŠนํžˆ 2๋‹จ๊ณ„ ๊ตฌ์กฐํ™”๋œ ์ถ”๋ก  ๋ฐฉ์‹์„ ๋„์ž…ํ•˜์—ฌ ์ž์ฒด์ ์œผ๋กœ ์˜ค๋ฅ˜๋ฅผ ์ˆ˜์ •ํ•˜๋Š” ์ถ”๋ก  ๊ณผ์ •์„ ๊ฑฐ์นœ ๋’ค ๊ฒฐ๋ก ์  ์š”์•ฝ์„ ์ œ๊ณตํ•จ์œผ๋กœ์จ, ๊ธˆ์œต ์˜์‚ฌ๊ฒฐ์ • ํ”„๋กœ์„ธ์Šค์˜ ๋ช…ํ™•์„ฑ๊ณผ ์ •ํ™•์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ์ค‘์ ์„ ๋‘์—ˆ์Šต๋‹ˆ๋‹ค.
10
+
11
+ ## KRX ๊ธˆ์œต ์–ธ์–ด ๋ชจ๋ธ ๊ฒฝ์ง„๋Œ€ํšŒ
12
+
13
+ **๋Œ€ํšŒ ๊ฐœ์š”**
14
+
15
+ KRX ๊ธˆ์œต ์–ธ์–ด ๋ชจ๋ธ ๊ฒฝ์ง„๋Œ€ํšŒ๋Š” ํ•œ๊ตญ ๊ธˆ์œต ๋ถ„์•ผ์—์„œ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์ฒ˜์Œ์œผ๋กœ ์—ด๋ฆฐ ๋ฆฌ๋”๋ณด๋“œ ํ˜•์‹์˜ ๋Œ€ํšŒ์˜€์Šต๋‹ˆ๋‹ค.
16
+ ๋‘ ๋‹ฌ์— ๊ฑธ์ณ ์˜ˆ์„ ๊ณผ ๋ณธ์„ ์œผ๋กœ ์ง„ํ–‰๋˜์—ˆ์œผ๋ฉฐ, ์ด 233๊ฐœ์˜ ํŒ€์ด ์ฐธ๊ฐ€ํ•˜์—ฌ 1,100๊ฐœ ์ด์ƒ์˜ ๋ชจ๋ธ์„ ์ œ์ถœํ•˜์˜€์Šต๋‹ˆ๋‹ค.
17
+ ์˜ˆ์„  ๋ผ์šด๋“œ์—์„œ๋Š” ๊ธˆ์œต์‹œ์žฅ, ์žฌ๋ฌดํšŒ๊ณ„, ๊ตญ๋‚ด ๊ธฐ์—… ๋ถ„์„, ๊ธˆ์œต ์—์ด์ „ํŠธ ์ž‘์—…, ์ฃผ๊ฐ€ ์˜ˆ์ธก ๋“ฑ ์ด ๋‹ค์„ฏ ๊ฐ€์ง€ ๋ถ„์•ผ์˜ ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ•˜์˜€์œผ๋ฉฐ, ๋ณธ์„  ๋ผ์šด๋“œ์—์„œ๋Š” ์žฌ๋ฌดํšŒ๊ณ„, ๊ธˆ์œต์‹œ์žฅ, ๊ธˆ์œต ์งˆ์˜์‘๋‹ต(Open-Ended Finance QA) ๋ถ„์•ผ์— ์ค‘์ ์„ ๋‘์—ˆ์Šต๋‹ˆ๋‹ค.
18
+
19
+ **๋ฒค์น˜๋งˆํฌ ์„ค๋ช…**
20
+
21
+ ๋Œ€ํšŒ์—์„œ ์‚ฌ์šฉ๋œ ๋ฒค์น˜๋งˆํฌ๋Š” ๊ธˆ์œต ๋ถ„์•ผ ์ „๋ฐ˜์— ๊ฑธ์ณ ์‹ ์ค‘ํ•˜๊ฒŒ ์„ ์ •๋œ ์•ฝ 5,500๊ฐœ์˜ ๊ฐ๊ด€์‹ ๋ฐ ์ง€์‹œ๋ฌธ ๊ธฐ๋ฐ˜์˜ ์งˆ์˜์‘๋‹ต ๋ฌธ์ œ๋กœ ๊ตฌ์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค:
22
+
23
+ - **์žฌ๋ฌดํšŒ๊ณ„**: ๋Œ€ํ•™ ์ˆ˜์ค€์˜ ํšŒ๊ณ„ ๋ฐ ๊ธˆ์œต ์›๋ฆฌ๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ๊ฐ๊ด€์‹ ๋ฌธ์ œ๋กœ ๊ตฌ์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
24
+ - **๊ธˆ์œต์‹œ์žฅ**: ๊ธˆ์œต ๊ทœ์ œ ๋ฐ ํ•œ๊ตญ ์‹œ์žฅ ์ฒด๊ณ„์— ๋Œ€ํ•œ ์ดํ•ด๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ์‹œํ—˜์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
25
+ - **์ฃผ๊ฐ€ ์˜ˆ์ธก**: ์ตœ๊ทผ ์ฃผ๊ฐ€ ๋ฐ์ดํ„ฐ ๋ฐ ๊ณ„์‚ฐ๋œ ์ง€ํ‘œ๋ฅผ ํ™œ์šฉํ•œ ์ด์ง„ ์˜ˆ์ธก ๊ณผ์ œ๋ฅผ ํฌํ•จํ•˜์˜€์Šต๋‹ˆ๋‹ค.
26
+ - **๊ตญ๋‚ด ๊ธฐ์—… ๋ถ„์„**: ํ•œ๊ตญ ๊ธฐ์—…์˜ ๊ณต์‹œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ƒ์„ฑ๋œ KRX-Bench ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค.
27
+ - **๊ธˆ์œต ์—์ด์ „ํŠธ**: ๊ธˆ์œต ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ๋ฐ ์ฝ”๋”ฉ ์ž‘์—… ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
28
+ - **๊ธˆ์œต ์งˆ์˜์‘๋‹ต(Open-Ended FinQA)**: ๋Œ€ํ•™์› ์ˆ˜์ค€์˜ ๊ณ„๋Ÿ‰ ๊ฒฝ์ œํ•™ ๋ฐ ๋ฒ•๋ฅ ์  ์ถ”๋ก ์„ ํฌํ•จํ•œ ๋ณตํ•ฉ์  ๊ณผ์ œ๋กœ ๊ตฌ์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
29
+
30
+ **๋Œ€ํšŒ ํ†ต๊ณ„**
31
+
32
+ ๊ธฐ์ˆ  ๋ฐ ๊ธˆ์œต ๋ถ„์•ผ ๋“ฑ ๊ธฐ์—… ์ฐธ๊ฐ€์ž๊ฐ€ ์ „์ฒด์˜ 52.5%๋ฅผ ์ฐจ์ง€ํ–ˆ์œผ๋ฉฐ, ๊ทธ ์™ธ์—๋Š” ํ•™๊ณ„ ๊ด€๋ จ ์ฐธ๊ฐ€์ž๊ฐ€ ๋Œ€๋ถ€๋ถ„์„ ์ด๋ฃจ์—ˆ์Šต๋‹ˆ๋‹ค.
33
+ ์ด๋Š” ๋‹ค์–‘ํ•œ ์ดํ•ด๊ด€๊ณ„์ž์˜ ํ•œ๊ตญ ๊ธˆ์œต ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์— ๋Œ€ํ•œ ํญ๋„“์€ ๊ด€์‹ฌ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
34
+
35
+ <figure style="text-align: center;">
36
+ <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/XTxJM0nXAs18RiJEdwksU.png" width="700" height="900" alt="์ƒ˜ํ”Œ ์ด๋ฏธ์ง€" style="display: block; margin: auto;">
37
+ <figcaption style="font-style: italic; color: gray; margin-top: 8px;">
38
+ ์ฐธ๊ฐ€์ž ๋ถ„ํฌ. ํŒŒ๋ž€์ƒ‰ ์Œ์˜์œผ๋กœ ์ด๋ฃจ์–ด์ง„ ๋ถ€๋ถ„์ด ๊ธฐ์—… ์ฐธ๊ฐ€์ž๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
39
+ </figcaption>
40
+ </figure>
41
+
42
+ **๋Œ€ํšŒ ๊ฒฐ๊ณผ ๋ถ„์„**
43
+
44
+ ์˜ˆ์„  ๋ผ์šด๋“œ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๊ณผ๋ฅผ ๋‚ธ ๋ชจ๋ธ๋“ค์€ ์ฃผ๋กœ ์ง€๋„ SFT๋ฅผ ํ™œ์šฉํ•˜์˜€์œผ๋ฉฐ, ํŠนํžˆ ๊ตญ๋‚ด ๊ธฐ์—… ๋ถ„์„(Domestic Company Analysis) ๋ถ€๋ฌธ์—์„œ ๋‘๋“œ๋Ÿฌ์ง„ ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
45
+ ์ด ๋ถ„์•ผ์—์„œ๋Š” ์ƒ๋‹นํ•œ ๊ฐœ์„ ์ด ์ด๋ฃจ์–ด์กŒ์œผ๋‚˜, ๊ธˆ์œต ๋ฐ ํšŒ๊ณ„(Financial & Accounting), ๊ธˆ์œต ์‹œ์žฅ(Financial Markets) ๋ถ€๋ฌธ์—์„œ์˜ ํ–ฅ์ƒ์€ ์ƒ๋Œ€์ ์œผ๋กœ ๋ฏธ๋ฏธํ–ˆ์Šต๋‹ˆ๋‹ค.
46
+ ๋Œ€๋ถ€๋ถ„์˜ ๋ชจ๋ธ์ด ๊ฐ„๋‹จํ•œ SFT ์ ‘๊ทผ๋ฒ•์„ ์ฑ„ํƒํ–ˆ์ง€๋งŒ, ์ผ๋ถ€ ํŒ€์€ ์ถ”๊ฐ€์ ์ธ ํ›ˆ๋ จ ๊ธฐ๋ฒ•์ธ Continual Pre-training(CPT)์„ ์‹คํ—˜ํ•˜๊ธฐ๋„ ํ•˜์˜€์œผ๋‚˜, ์ž‘์€ ๊ทœ๋ชจ์—์„œ๋Š” ๊ทธ ํšจ๊ณผ๊ฐ€ ๋ช…ํ™•ํžˆ ์ž…์ฆ๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.
47
+
48
+ <figure style="text-align: center;">
49
+ <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/ru3aA2ISwtqS3sJuSPVLN.png" width="600" height="750" alt="์ƒ˜ํ”Œ ์ด๋ฏธ์ง€" style="display: block; margin: auto;">
50
+ <figcaption style="font-style: italic; color: gray; margin-top: 8px;">
51
+ ์˜ˆ์„  ๋ชจ๋ธ ์„ฑ๋Šฅ ๋ณ€ํ™” ํŠธ๋ Œ๋“œ
52
+ </figcaption>
53
+ </figure>
54
+
55
+ ๋ณธ์„ ์—์„œ๋Š” ๊ณ ๋„ํ™”๋œ ๋‹ค๋‹จ๊ณ„ ํ•™์Šต ๋ฐฉ๋ฒ•๋ก ์ด ๋„๋ฆฌ ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
56
+ ํŠนํžˆ, ์—ฌ๋Ÿฌ ํŒ€๋“ค์€ ์ปค๋ฆฌํ˜๋Ÿผ ๊ธฐ๋ฐ˜์˜ SFT ์ „๋žต์„ ์ ์šฉํ•˜์—ฌ, ๊ฐ„๋‹จํ•œ ํ”„๋กฌํ”„ํŠธ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์—ฌ Evolve Instruct์™€ ๊ฐ™์€ ๋ฐฉ๋ฒ•์œผ๋กœ ์ƒ์„ฑ๋œ ๋” ๋‚œ์ด๋„ ๋†’์€ ์‚ฌ๋ก€๋กœ ์ ์ฐจ ๋ฐœ์ „์‹œํ‚ค๋Š” ๋ฐฉ์‹์„ ์ทจํ–ˆ์Šต๋‹ˆ๋‹ค.
57
+ ์ตœ์ƒ์œ„ ์„ฑ๋Šฅ์„ ๋ณด์ธ ๋ชจ๋ธ๋“ค์€ ์ถ”๊ฐ€๋กœ LLM-as-a-Judge ๊ธฐ๋ฒ•์œผ๋กœ ํ‰๊ฐ€๋œ ์‘๋‹ต๋“ค์„ ํ™œ์šฉํ•˜์—ฌ Direct Preference Optimization(DPO) ๋ฐ KTO์™€ ๊ฐ™์€ ์„ ํ˜ธ๋„ ์ตœ์ ํ™” ๊ธฐ์ˆ ์„ ํ†ตํ•ด ์„ฑ๋Šฅ์„ ๋”์šฑ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.
58
+ ํŠนํžˆ Hi-Q ํŒ€์€ Continual Pre-training๊ณผ SFT ๋ฐ DPO๋ฅผ ๊ฒฐํ•ฉํ•œ ๋ฐฉ์‹์˜ ํšจ๊ณผ์„ฑ์„ ์ž…์ฆํ•˜์—ฌ ๊ด„๋ชฉํ•  ๋งŒํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ด๋ฃจ์—ˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์ฒด๊ณ„์ ์ด๊ณ  ๋‹ค๋‹จ๊ณ„์ ์ธ ํ›ˆ๋ จ ๊ณผ์ •์˜ ๊ฐ€์น˜๋ฅผ ๋ช…ํ™•ํžˆ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.
59
+
60
+ <figure style="text-align: center;">
61
+ <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/VV6tYXtJkV5yTzNvMdzP9.png" width="700" height="900" alt="์ƒ˜ํ”Œ ์ด๋ฏธ์ง€" style="display: block; margin: auto;">
62
+ <figcaption style="font-style: italic; color: gray; margin-top: 8px;">
63
+ Continual pre-trained ๋ชจ๋ธ๋“ค์˜ ์„ฑ๋Šฅ ๊ฒฐ๊ณผ
64
+ </figcaption>
65
+ </figure>
66
+
67
+ ## ๋ชจ๋ธ ํ›ˆ๋ จ
68
+ ### ๋ฐ์ดํ„ฐ์…‹ ์ˆ˜์ง‘
69
+
70
+ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ณผ์ •์„ ํ†ตํ•ด ์•ฝ 400,000๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ์ง€์‹œํ˜• ์ƒ˜ํ”Œ๋กœ ์ด๋ฃจ์–ด์ง„ ์ข…ํ•ฉ์ ์ธ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค:
71
+ - **๊ฒฝ์ง„๋Œ€ํšŒ**: ๊ฒฝ์ง„๋Œ€ํšŒ ์ค‘ HuggingFace์— ์ œ์ถœ๋œ 200,000๊ฐœ ์ด์ƒ์˜ ๋ฐ์ดํ„ฐ ์ค‘ MinHash ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ์ •๊ทœ์‹ ํ•„ํ„ฐ๋ง์„ ํ†ตํ•ด ์‹ ์ค‘ํ•˜๊ฒŒ ์„ ๋ณ„๋œ ๊ณต๊ฐœ๋œ 80,000๊ฐœ์˜ ์ง€์‹œํ˜• ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
72
+ - **์ถ”๋ก  ์‘๋‹ต**: DeepSeek-R1 ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ƒ์„ฑ๋œ ์‘๋‹ต๊ณผ ํ•จ๊ป˜ ๊ณต๊ฐœ์ ์œผ๋กœ ์ด์šฉ ๊ฐ€๋Šฅํ•œ ์˜์–ด ๋ฐ ํ•œ๊ตญ์–ด ์˜จ๋ผ์ธ ์ž๋ฃŒ์—์„œ ์ˆ˜์ง‘ํ•œ Prompt-Response ์Œ์œผ๋กœ ๋ณด์™„ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
73
+ - **๊ฒ€์ฆ**: GPT-4o๋ฅผ LLM-as-a-Judge๋กœ ํ™œ์šฉํ•œ ๊ฒ€์ฆ ํ”„๋กœ์„ธ์Šค ๋ฐ ์ž๋™ ํ’ˆ์งˆ ๊ฒ€์‚ฌ๋ฅผ ํ†ตํ•ด ๋ฐ์ดํ„ฐ์˜ ๋ฌด๊ฒฐ์„ฑ๊ณผ ์ •ํ™•์„ฑ์„ ๊ฐ•ํ™”ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
74
+
75
+ ### ํ•™์Šต ๋ฐฉ๋ฒ•
76
+
77
+ โ‚ฉON ํ•™์Šต์„ ์œ„ํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ 2๋‹จ๊ณ„ ํ•™์Šต์„ ์ง„ํ–‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค:
78
+ - SFT: ์ด ๋‹จ๊ณ„๋Š” ๊ธˆ์œต ์ถ”๋ก  ์ž‘์—…๊ณผ ๊ด€๋ จ๋œ ๋ชจ๋ธ์˜ ์ดˆ๊ธฐ ํ–‰๋™์„ ์กฐ์ •ํ•˜๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ท„์œผ๋ฉฐ, DeepSeek-R1 ๋ชจ๋ธ๋กœ ์ƒ์„ฑํ•œ ์ƒ์„ธํ•œ ์‘๋‹ต๊ณผ ์„ธ์‹ฌํ•˜๊ฒŒ ์„ ์ •๋œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ์…‹์€ ํ•œ๊ตญ์–ด์™€ ์˜์–ด์—์„œ ์–ธ์–ด์  ์ผ๊ด€์„ฑ์„ ํ™•๋ณดํ•˜๊ธฐ ์œ„ํ•ด ์ฒ ์ €ํžˆ ๊ฒ€ํ† ๋œ Prompt-Response ์Œ์œผ๋กœ ๊ตฌ์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค.
79
+ - DPO: SFT ์ง„ํ–‰ ํ›„, ๋ชจ๋ธ์˜ ๊ณผ๋„ํ•œ ์ƒ๊ฐ ๊ณผ์ • ๋˜๋Š” ์ผ๋ถ€ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ž˜๋ชป๋œ ํ•ด์„๊ณผ ๊ฐ™์€ ์›์น˜ ์•Š๋Š” ํ–‰๋™์„ ์ค„์ด๊ธฐ ์œ„ํ•ด DPO๋ฅผ ํ™œ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์„ ํ˜ธ๋„ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ๊ณผ DeepSeek-R1์˜ ์ถœ๋ ฅ์„ ๋น„๊ตํ•จ์œผ๋กœ์จ ํšจ๊ณผ์ ์œผ๋กœ ๋ชจ๋ธ ์‘๋‹ต์„ ๊ฐœ์„ ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
80
+
81
+ ### ๋ชจ๋ธ ์‚ฌ์–‘
82
+
83
+ - Base model: Qwen2.5-Math-7B-Instruct
84
+ - Language: ํ•œ๊ตญ์–ด, ์˜์–ด
85
+ - Model size: 7B
86
+
87
+ โ‚ฉON์€ ๋‘ ๋‹จ๊ณ„์˜ ๊ตฌ์กฐ์  ์ถ”๋ก  ๊ณผ์ •์„ ํ†ตํ•ด ์ตœ์ข… ์‘๋‹ต์„ ์ถœ๋ ฅํ•˜๋„๋ก ์„ค๊ณ„ํ•˜์˜€์Šต๋‹ˆ๋‹ค:
88
+ - **์ƒ๊ฐ ๋‹จ๊ณ„**: ๋ชจ๋ธ์€ `<think>` ๋ฐ `</think>` ํƒœ๊ทธ ๋‚ด์—์„œ ์ž์‹ ์˜ ์ถ”๋ก  ๊ณผ์ •์„ ๋ช…์‹œ์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด๋Š” ํˆฌ๋ช…์„ฑ์„ ๋†’์ด๊ณ , ์‚ฌ์šฉ์ž๋“ค์ด โ‚ฉON์˜ ๊ฒฐ๋ก  ๋„์ถœ ๋ฐฉ์‹์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
89
+ - **ํ•ด๊ฒฐ ๋‹จ๊ณ„**: ์ถ”๋ก  ์ง„ํ–‰ ํ›„, ๋ชจ๋ธ์€ ๊ฒฐ๋ก ์„ `<solution>` ๋ฐ `</solution>` ํƒœ๊ทธ ๋‚ด์—์„œ ๋ช…ํ™•ํ•˜๊ณ  ๊ฐ„๊ฒฐํ•˜๊ฒŒ ์š”์•ฝํ•˜์—ฌ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
90
+
91
+ ## ๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ
92
+
93
+ โ‚ฉON์€ ๋Œ€ํšŒ์—์„œ ์‚ฌ์šฉ๋œ ์ข…ํ•ฉ์ ์ธ ๋ฒค์น˜๋งˆํฌ๋ฅผ ํ†ตํ•ด ํ‰๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
94
+ ์ด ๋ฒค์น˜๋งˆํฌ๋Š” ๊ฐ๊ด€์‹ ๋ฌธ์ œ(MCQA)์™€ ๊ฐœ๋ฐฉํ˜• ์งˆ๋ฌธ์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด ๊ธˆ์œต ์–ธ์–ด ๋ชจ๋ธ์˜ ์‹ค๋ฌด์  ๋ฐ ์ด๋ก ์  ๋Šฅ๋ ฅ์„ ์ฒ ์ €ํžˆ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
95
+ ๋ฒค์น˜๋งˆํฌ๋Š” ์žฌ๋ฌดํšŒ๊ณ„, ๊ธˆ์œต์‹œ์žฅ, ๊ธˆ์œต ์งˆ์˜์‘๋‹ต(Open-Ended FinQA) ํƒœ์Šคํฌ๋กœ ๋ถ„๋ฅ˜๋ฉ๋‹ˆ๋‹ค:
96
+
97
+ - **์žฌ๋ฌดํšŒ๊ณ„**: ๊ธˆ์œต ๊ฐœ๋…, ํšŒ๊ณ„ ์›์น™ ๋ฐ ๊ณ„๋Ÿ‰ ๊ฒฝ์ œ ์ถ”๋ก ์— ๋Œ€ํ•œ ๋ชจ๋ธ์˜ ์ง€์‹๊ณผ ๋ถ„์„ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
98
+ - **๊ธˆ์œต์‹œ์žฅ**: ๊ธˆ์œต ์‹œ์žฅ, ์‹œ์Šคํ…œ, ๊ทœ์ œ ๋ฐ ๋ถ„์•ผ๋ณ„ ์‚ฌ์‹ค์  ์ง€์‹์— ๋Œ€ํ•œ ๋ชจ๋ธ์˜ ์ดํ•ด๋ฅผ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
99
+ - **๊ธˆ์œต ์งˆ์˜์‘๋‹ต(Open-Ended FinQA)**: ์‹ค์ œ ๊ธˆ์œต ๋ฌธ์ œ ํ•ด๊ฒฐ ์ƒํ™ฉ์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•œ ๋ณต์žกํ•˜๊ณ  ์„ธ๋ถ€์ ์ธ ์ถ”๋ก  ๋ฌธ์ œ๋“ค๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.
100
+
101
+ ์ด ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹์˜ ์˜ˆ์‹œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:
102
+
103
+ <figure style="text-align: center;">
104
+ <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/7vLKeR6wTbr88UdOeikaE.png" width="700" height="900" alt="์ƒ˜ํ”Œ ์ด๋ฏธ์ง€" style="display: block; margin: auto;">
105
+ <figcaption style="font-style: italic; color: gray; margin-top: 8px;">
106
+ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํฌ ์˜ˆ์‹œ. ๊ฐ ์˜ˆ์‹œ๋Š” ๊ฐ ์นดํ…Œ๊ณ ๋ฆฌ์— ๋Œ€ํ•œ ๊ตฌ์ฒด์ ์ธ question type์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
107
+ </figcaption>
108
+ </figure>
109
+
110
+ **๊ฒฐ๊ณผ**
111
+
112
+ โ‚ฉON์€ KRX ๊ธˆ์œต ์–ธ์–ด๋ชจ๋ธ ๊ฒฝ์ง„๋Œ€ํšŒ์—์„œ ์ˆ˜์ƒํ•œ ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ ํ‰๊ท ์ ์œผ๋กœ ๊ฐ€์žฅ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
113
+ ํŠนํžˆ ์žฌ๋ฌดํšŒ๊ณ„ ๋ฐ ๊ธˆ์œต ์งˆ์˜์‘๋‹ต(Open-Ended FinQA) ์„œ๋ธŒ์…‹์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ์ด ๋ชจ๋ธ์ด ๋›ฐ์–ด๋‚œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
114
+ ๋˜ํ•œ ๋„๋ฉ”์ธ ์ „๋ฌธ ์ง€์‹(์‹œ์žฅ ๋ถ„์•ผ)์— ์ค‘์ ์„ ๋œ ๋‘์—ˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ๊ธˆ์œต์‹œ์žฅ ์„œ๋ธŒ์…‹์—์„œ ๋Œ€๋ถ€๋ถ„์˜ ๋ชจ๋ธ๋“ค์„ ์•ž์„œ๋ฉฐ โ‚ฉON์˜ ๋›ฐ์–ด๋‚œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋‹ค์‹œ ํ•œ ๋ฒˆ ์ž…์ฆํ•˜์˜€์Šต๋‹ˆ๋‹ค.
115
+
116
+ <!-- | Models | F&A | Market | Open-Ended | Average |
117
+ |-------------------------------------------|------|--------|------------|---------|
118
+ | overfit-brothers/hello_world06 | 0.65 | **0.83** | 0.01 | 0.50 |
119
+ | AnonymousLLMer/krx-qwen2.5-v1206-1 | 0.63 | 0.65 | 0.04 | 0.44 |
120
+ | shibainu24/qwen2.5-7B-inst-release-1516wk | 0.56 | 0.67 | 0.04 | 0.43 |
121
+ | Q-PING/krx_1205_test_model_3 | 0.58 | 0.64 | 0.02 | 0.42 |
122
+ | Hi-Q/krx_1206_test_model_2 | 0.60 | 0.61 | 0.02 | 0.41 |
123
+ | **โ‚ฉON (Ours)** | **0.78** | 0.66 | **0.18** | **0.54** | -->
124
+
125
+ <figure style="text-align: center;">
126
+ <img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/--5Kkwfuf8c6hbNUvpJq6.png" width="700" height="900" alt="์ƒ˜ํ”Œ ์ด๋ฏธ์ง€" style="display: block; margin: auto;">
127
+ <!-- <figcaption style="font-style: italic; color: gray; margin-top: 8px;">
128
+ Overview of the benchmark used for evaluation. Each example demonstrates a specific question type for each category.
129
+ </figcaption> -->
130
+ </figure>
131
+
132
+ ## Quick Start
133
+
134
+ ```python
135
+ from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
136
+
137
+ model = AutoModelForCausalLM.from_pretrained("KRX-Data/WON-Reasoning", device_map="auto")
138
+ tokenizer = AutoTokenizer.from_pretrained("KRX-Data/WON-Reasoning")
139
+
140
+ messages = [
141
+ {"role": "user", "content": <your_promt>} # Replace `<your_prompt>` with your query!
142
+ ]
143
+ text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
144
+ model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
145
+
146
+ generated_ids = model.generate(
147
+ **model_inputs,
148
+ max_new_tokens=512
149
+ )
150
+ generated_ids = [
151
+ output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
152
+ ]
153
+
154
+ response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
155
+ ```
156
+
157
+ ## Citation
158
+
159
+ ```
160
+ @article{son2025won,
161
+ title={Won: Establishing Best Practices for Korean Financial NLP},
162
+ author={Son, Guijin and Ko, Hyunwoo and Jung, Haneral and Hwang, Chami},
163
+ journal={arXiv preprint arXiv:2503.17963},
164
+ year={2025}
165
+ }
166
+ ```
167
+
168
+ ## Contact
169
+
170
+ ```
171
172
+ ```