Create KOREAN_README.md
Browse files- KOREAN_README.md +172 -0
KOREAN_README.md
ADDED
|
@@ -0,0 +1,172 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
[English](https://huggingface.co/KRX-Data/WON-Reasoning/blob/main/README.md) | **ํ๊ตญ์ด**
|
| 2 |
+
|
| 3 |
+
# โฉON: ํ๊ตญ ๊ธ์ต์ ์ํ LLM
|
| 4 |
+
|
| 5 |
+
## ์๊ฐ
|
| 6 |
+
โฉON์ ํ๊ตญ ๊ธ์ต ๋ถ์ผ์ ์์
์ ํนํ๋ ๊ณ ๊ธ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์
๋๋ค.
|
| 7 |
+
โฉON์ ๊ธ์ต ๋ถ์ผ์ AI ์ ํ๋ฆฌ์ผ์ด์
์์ ์ ๋ขฐ์ฑ๊ณผ ํฌ๋ช
์ฑ์ ๋์ด๊ธฐ ์ํด ์ค๊ณ๋์์ต๋๋ค.
|
| 8 |
+
โฉON ๊ฐ๋ฐ์ ํต์ฌ ๋ชฉ์ ์ ์ฐ๊ตฌ์ ๊ฐ๋ฐฉ์ฑ์ ์ด์งํ๊ณ , ์๊ฒฉํ ๊ธ์ต ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํ ์ ์๋ ๊ธฐ์ค์ ๋ง๋ จํ๋ฉฐ, ํ๊ตญ ๊ธ์ต ํนํ ์ธ์ด ๋ชจ๋ธ ํ๋ จ์ ์์ด ์ต์ ์ ์ค์ฒ ์ฌ๋ก๋ฅผ ํ๋ฆฝํ๋ ๊ฒ์
๋๋ค.
|
| 9 |
+
์ด ๋ชจ๋ธ์ ํนํ 2๋จ๊ณ ๊ตฌ์กฐํ๋ ์ถ๋ก ๋ฐฉ์์ ๋์
ํ์ฌ ์์ฒด์ ์ผ๋ก ์ค๋ฅ๋ฅผ ์์ ํ๋ ์ถ๋ก ๊ณผ์ ์ ๊ฑฐ์น ๋ค ๊ฒฐ๋ก ์ ์์ฝ์ ์ ๊ณตํจ์ผ๋ก์จ, ๊ธ์ต ์์ฌ๊ฒฐ์ ํ๋ก์ธ์ค์ ๋ช
ํ์ฑ๊ณผ ์ ํ์ฑ์ ๋์ด๋ ๋ฐ ์ค์ ์ ๋์์ต๋๋ค.
|
| 10 |
+
|
| 11 |
+
## KRX ๊ธ์ต ์ธ์ด ๋ชจ๋ธ ๊ฒฝ์ง๋ํ
|
| 12 |
+
|
| 13 |
+
**๋ํ ๊ฐ์**
|
| 14 |
+
|
| 15 |
+
KRX ๊ธ์ต ์ธ์ด ๋ชจ๋ธ ๊ฒฝ์ง๋ํ๋ ํ๊ตญ ๊ธ์ต ๋ถ์ผ์์ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํด ์ฒ์์ผ๋ก ์ด๋ฆฐ ๋ฆฌ๋๋ณด๋ ํ์์ ๋ํ์์ต๋๋ค.
|
| 16 |
+
๋ ๋ฌ์ ๊ฑธ์ณ ์์ ๊ณผ ๋ณธ์ ์ผ๋ก ์งํ๋์์ผ๋ฉฐ, ์ด 233๊ฐ์ ํ์ด ์ฐธ๊ฐํ์ฌ 1,100๊ฐ ์ด์์ ๋ชจ๋ธ์ ์ ์ถํ์์ต๋๋ค.
|
| 17 |
+
์์ ๋ผ์ด๋์์๋ ๊ธ์ต์์ฅ, ์ฌ๋ฌดํ๊ณ, ๊ตญ๋ด ๊ธฐ์
๋ถ์, ๊ธ์ต ์์ด์ ํธ ์์
, ์ฃผ๊ฐ ์์ธก ๋ฑ ์ด ๋ค์ฏ ๊ฐ์ง ๋ถ์ผ์ ํ๊ฐ๋ฅผ ์ํํ์์ผ๋ฉฐ, ๋ณธ์ ๋ผ์ด๋์์๋ ์ฌ๋ฌดํ๊ณ, ๊ธ์ต์์ฅ, ๊ธ์ต ์ง์์๋ต(Open-Ended Finance QA) ๋ถ์ผ์ ์ค์ ์ ๋์์ต๋๋ค.
|
| 18 |
+
|
| 19 |
+
**๋ฒค์น๋งํฌ ์ค๋ช
**
|
| 20 |
+
|
| 21 |
+
๋ํ์์ ์ฌ์ฉ๋ ๋ฒค์น๋งํฌ๋ ๊ธ์ต ๋ถ์ผ ์ ๋ฐ์ ๊ฑธ์ณ ์ ์คํ๊ฒ ์ ์ ๋ ์ฝ 5,500๊ฐ์ ๊ฐ๊ด์ ๋ฐ ์ง์๋ฌธ ๊ธฐ๋ฐ์ ์ง์์๋ต ๋ฌธ์ ๋ก ๊ตฌ์ฑ๋์์ต๋๋ค:
|
| 22 |
+
|
| 23 |
+
- **์ฌ๋ฌดํ๊ณ**: ๋ํ ์์ค์ ํ๊ณ ๋ฐ ๊ธ์ต ์๋ฆฌ๋ฅผ ํ๊ฐํ๋ ๊ฐ๊ด์ ๋ฌธ์ ๋ก ๊ตฌ์ฑ๋์์ต๋๋ค.
|
| 24 |
+
- **๊ธ์ต์์ฅ**: ๊ธ์ต ๊ท์ ๋ฐ ํ๊ตญ ์์ฅ ์ฒด๊ณ์ ๋ํ ์ดํด๋ฅผ ํ๊ฐํ๋ ์ํ์ ๊ธฐ๋ฐ์ผ๋ก ํ์์ต๋๋ค.
|
| 25 |
+
- **์ฃผ๊ฐ ์์ธก**: ์ต๊ทผ ์ฃผ๊ฐ ๋ฐ์ดํฐ ๋ฐ ๊ณ์ฐ๋ ์งํ๋ฅผ ํ์ฉํ ์ด์ง ์์ธก ๊ณผ์ ๋ฅผ ํฌํจํ์์ต๋๋ค.
|
| 26 |
+
- **๊ตญ๋ด ๊ธฐ์
๋ถ์**: ํ๊ตญ ๊ธฐ์
์ ๊ณต์ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์์ฑ๋ KRX-Bench ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์์ต๋๋ค.
|
| 27 |
+
- **๊ธ์ต ์์ด์ ํธ**: ๊ธ์ต ๋ฐ์ดํฐ ์กฐ์ ๋ฐ ์ฝ๋ฉ ์์
์ํ ๋ฅ๋ ฅ์ ํ๊ฐํ์์ต๋๋ค.
|
| 28 |
+
- **๊ธ์ต ์ง์์๋ต(Open-Ended FinQA)**: ๋ํ์ ์์ค์ ๊ณ๋ ๊ฒฝ์ ํ ๋ฐ ๋ฒ๋ฅ ์ ์ถ๋ก ์ ํฌํจํ ๋ณตํฉ์ ๊ณผ์ ๋ก ๊ตฌ์ฑ๋์์ต๋๋ค.
|
| 29 |
+
|
| 30 |
+
**๋ํ ํต๊ณ**
|
| 31 |
+
|
| 32 |
+
๊ธฐ์ ๋ฐ ๊ธ์ต ๋ถ์ผ ๋ฑ ๊ธฐ์
์ฐธ๊ฐ์๊ฐ ์ ์ฒด์ 52.5%๋ฅผ ์ฐจ์งํ์ผ๋ฉฐ, ๊ทธ ์ธ์๋ ํ๊ณ ๊ด๋ จ ์ฐธ๊ฐ์๊ฐ ๋๋ถ๋ถ์ ์ด๋ฃจ์์ต๋๋ค.
|
| 33 |
+
์ด๋ ๋ค์ํ ์ดํด๊ด๊ณ์์ ํ๊ตญ ๊ธ์ต ์์ฐ์ด ์ฒ๋ฆฌ์ ๋ํ ํญ๋์ ๊ด์ฌ์ ๋ณด์ฌ์ค๋๋ค.
|
| 34 |
+
|
| 35 |
+
<figure style="text-align: center;">
|
| 36 |
+
<img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/XTxJM0nXAs18RiJEdwksU.png" width="700" height="900" alt="์ํ ์ด๋ฏธ์ง" style="display: block; margin: auto;">
|
| 37 |
+
<figcaption style="font-style: italic; color: gray; margin-top: 8px;">
|
| 38 |
+
์ฐธ๊ฐ์ ๋ถํฌ. ํ๋์ ์์์ผ๋ก ์ด๋ฃจ์ด์ง ๋ถ๋ถ์ด ๊ธฐ์
์ฐธ๊ฐ์๋ฅผ ์๋ฏธํฉ๋๋ค.
|
| 39 |
+
</figcaption>
|
| 40 |
+
</figure>
|
| 41 |
+
|
| 42 |
+
**๋ํ ๊ฒฐ๊ณผ ๋ถ์**
|
| 43 |
+
|
| 44 |
+
์์ ๋ผ์ด๋์์ ์ฐ์ํ ์ฑ๊ณผ๋ฅผ ๋ธ ๋ชจ๋ธ๋ค์ ์ฃผ๋ก ์ง๋ SFT๋ฅผ ํ์ฉํ์์ผ๋ฉฐ, ํนํ ๊ตญ๋ด ๊ธฐ์
๋ถ์(Domestic Company Analysis) ๋ถ๋ฌธ์์ ๋๋๋ฌ์ง ์ฑ๊ณผ๋ฅผ ๋ณด์์ต๋๋ค.
|
| 45 |
+
์ด ๋ถ์ผ์์๋ ์๋นํ ๊ฐ์ ์ด ์ด๋ฃจ์ด์ก์ผ๋, ๊ธ์ต ๋ฐ ํ๊ณ(Financial & Accounting), ๊ธ์ต ์์ฅ(Financial Markets) ๋ถ๋ฌธ์์์ ํฅ์์ ์๋์ ์ผ๋ก ๋ฏธ๋ฏธํ์ต๋๋ค.
|
| 46 |
+
๋๋ถ๋ถ์ ๋ชจ๋ธ์ด ๊ฐ๋จํ SFT ์ ๊ทผ๋ฒ์ ์ฑํํ์ง๋ง, ์ผ๋ถ ํ์ ์ถ๊ฐ์ ์ธ ํ๋ จ ๊ธฐ๋ฒ์ธ Continual Pre-training(CPT)์ ์คํํ๊ธฐ๋ ํ์์ผ๋, ์์ ๊ท๋ชจ์์๋ ๊ทธ ํจ๊ณผ๊ฐ ๋ช
ํํ ์
์ฆ๋์ง ์์์ต๋๋ค.
|
| 47 |
+
|
| 48 |
+
<figure style="text-align: center;">
|
| 49 |
+
<img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/ru3aA2ISwtqS3sJuSPVLN.png" width="600" height="750" alt="์ํ ์ด๋ฏธ์ง" style="display: block; margin: auto;">
|
| 50 |
+
<figcaption style="font-style: italic; color: gray; margin-top: 8px;">
|
| 51 |
+
์์ ๋ชจ๋ธ ์ฑ๋ฅ ๋ณํ ํธ๋ ๋
|
| 52 |
+
</figcaption>
|
| 53 |
+
</figure>
|
| 54 |
+
|
| 55 |
+
๋ณธ์ ์์๋ ๊ณ ๋ํ๋ ๋ค๋จ๊ณ ํ์ต ๋ฐฉ๋ฒ๋ก ์ด ๋๋ฆฌ ์ฌ์ฉ๋์์ต๋๋ค.
|
| 56 |
+
ํนํ, ์ฌ๋ฌ ํ๋ค์ ์ปค๋ฆฌํ๋ผ ๊ธฐ๋ฐ์ SFT ์ ๋ต์ ์ ์ฉํ์ฌ, ๊ฐ๋จํ ํ๋กฌํํธ๋ถํฐ ์์ํ์ฌ Evolve Instruct์ ๊ฐ์ ๋ฐฉ๋ฒ์ผ๋ก ์์ฑ๋ ๋ ๋์ด๋ ๋์ ์ฌ๋ก๋ก ์ ์ฐจ ๋ฐ์ ์ํค๋ ๋ฐฉ์์ ์ทจํ์ต๋๋ค.
|
| 57 |
+
์ต์์ ์ฑ๋ฅ์ ๋ณด์ธ ๋ชจ๋ธ๋ค์ ์ถ๊ฐ๋ก LLM-as-a-Judge ๊ธฐ๋ฒ์ผ๋ก ํ๊ฐ๋ ์๋ต๋ค์ ํ์ฉํ์ฌ Direct Preference Optimization(DPO) ๋ฐ KTO์ ๊ฐ์ ์ ํธ๋ ์ต์ ํ ๊ธฐ์ ์ ํตํด ์ฑ๋ฅ์ ๋์ฑ ํฅ์์์ผฐ์ต๋๋ค.
|
| 58 |
+
ํนํ Hi-Q ํ์ Continual Pre-training๊ณผ SFT ๋ฐ DPO๋ฅผ ๊ฒฐํฉํ ๋ฐฉ์์ ํจ๊ณผ์ฑ์ ์
์ฆํ์ฌ ๊ด๋ชฉํ ๋งํ ์ฑ๋ฅ ํฅ์์ ์ด๋ฃจ์์ผ๋ฉฐ, ์ด๋ฅผ ํตํด ์ฒด๊ณ์ ์ด๊ณ ๋ค๋จ๊ณ์ ์ธ ํ๋ จ ๊ณผ์ ์ ๊ฐ์น๋ฅผ ๋ช
ํํ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
|
| 59 |
+
|
| 60 |
+
<figure style="text-align: center;">
|
| 61 |
+
<img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/VV6tYXtJkV5yTzNvMdzP9.png" width="700" height="900" alt="์ํ ์ด๋ฏธ์ง" style="display: block; margin: auto;">
|
| 62 |
+
<figcaption style="font-style: italic; color: gray; margin-top: 8px;">
|
| 63 |
+
Continual pre-trained ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ ๊ฒฐ๊ณผ
|
| 64 |
+
</figcaption>
|
| 65 |
+
</figure>
|
| 66 |
+
|
| 67 |
+
## ๋ชจ๋ธ ํ๋ จ
|
| 68 |
+
### ๋ฐ์ดํฐ์
์์ง
|
| 69 |
+
|
| 70 |
+
๋ค์๊ณผ ๊ฐ์ ๊ณผ์ ์ ํตํด ์ฝ 400,000๊ฐ์ ๊ณ ํ์ง ์ง์ํ ์ํ๋ก ์ด๋ฃจ์ด์ง ์ข
ํฉ์ ์ธ ํ๋ จ ๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ์ต๋๋ค:
|
| 71 |
+
- **๊ฒฝ์ง๋ํ**: ๊ฒฝ์ง๋ํ ์ค HuggingFace์ ์ ์ถ๋ 200,000๊ฐ ์ด์์ ๋ฐ์ดํฐ ์ค MinHash ์๊ณ ๋ฆฌ์ฆ๊ณผ ์ ๊ท์ ํํฐ๋ง์ ํตํด ์ ์คํ๊ฒ ์ ๋ณ๋ ๊ณต๊ฐ๋ 80,000๊ฐ์ ์ง์ํ ๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ์์ต๋๋ค.
|
| 72 |
+
- **์ถ๋ก ์๋ต**: DeepSeek-R1 ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์์ฑ๋ ์๋ต๊ณผ ํจ๊ป ๊ณต๊ฐ์ ์ผ๋ก ์ด์ฉ ๊ฐ๋ฅํ ์์ด ๋ฐ ํ๊ตญ์ด ์จ๋ผ์ธ ์๋ฃ์์ ์์งํ Prompt-Response ์์ผ๋ก ๋ณด์ํ์์ต๋๋ค.
|
| 73 |
+
- **๊ฒ์ฆ**: GPT-4o๋ฅผ LLM-as-a-Judge๋ก ํ์ฉํ ๊ฒ์ฆ ํ๋ก์ธ์ค ๋ฐ ์๋ ํ์ง ๊ฒ์ฌ๋ฅผ ํตํด ๋ฐ์ดํฐ์ ๋ฌด๊ฒฐ์ฑ๊ณผ ์ ํ์ฑ์ ๊ฐํํ์์ต๋๋ค.
|
| 74 |
+
|
| 75 |
+
### ํ์ต ๋ฐฉ๋ฒ
|
| 76 |
+
|
| 77 |
+
โฉON ํ์ต์ ์ํด ๋ค์๊ณผ ๊ฐ์ 2๋จ๊ณ ํ์ต์ ์งํํ์์ต๋๋ค:
|
| 78 |
+
- SFT: ์ด ๋จ๊ณ๋ ๊ธ์ต ์ถ๋ก ์์
๊ณผ ๊ด๋ จ๋ ๋ชจ๋ธ์ ์ด๊ธฐ ํ๋์ ์กฐ์ ํ๋ ๋ฐ ์ด์ ์ ๋ง์ท์ผ๋ฉฐ, DeepSeek-R1 ๋ชจ๋ธ๋ก ์์ฑํ ์์ธํ ์๋ต๊ณผ ์ธ์ฌํ๊ฒ ์ ์ ๋ ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ต๋๋ค. ๋ฐ์ดํฐ์
์ ํ๊ตญ์ด์ ์์ด์์ ์ธ์ด์ ์ผ๊ด์ฑ์ ํ๋ณดํ๊ธฐ ์ํด ์ฒ ์ ํ ๊ฒํ ๋ Prompt-Response ์์ผ๋ก ๊ตฌ์ฑํ์์ต๋๋ค.
|
| 79 |
+
- DPO: SFT ์งํ ํ, ๋ชจ๋ธ์ ๊ณผ๋ํ ์๊ฐ ๊ณผ์ ๋๋ ์ผ๋ถ ์ง๋ฌธ์ ๋ํ ์๋ชป๋ ํด์๊ณผ ๊ฐ์ ์์น ์๋ ํ๋์ ์ค์ด๊ธฐ ์ํด DPO๋ฅผ ํ์ฉํ์์ต๋๋ค. ์ ํธ๋ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ์ ์ถ๋ ฅ๊ณผ DeepSeek-R1์ ์ถ๋ ฅ์ ๋น๊ตํจ์ผ๋ก์จ ํจ๊ณผ์ ์ผ๋ก ๋ชจ๋ธ ์๋ต์ ๊ฐ์ ํ์์ต๋๋ค.
|
| 80 |
+
|
| 81 |
+
### ๋ชจ๋ธ ์ฌ์
|
| 82 |
+
|
| 83 |
+
- Base model: Qwen2.5-Math-7B-Instruct
|
| 84 |
+
- Language: ํ๊ตญ์ด, ์์ด
|
| 85 |
+
- Model size: 7B
|
| 86 |
+
|
| 87 |
+
โฉON์ ๋ ๋จ๊ณ์ ๊ตฌ์กฐ์ ์ถ๋ก ๊ณผ์ ์ ํตํด ์ต์ข
์๋ต์ ์ถ๋ ฅํ๋๋ก ์ค๊ณํ์์ต๋๋ค:
|
| 88 |
+
- **์๊ฐ ๋จ๊ณ**: ๋ชจ๋ธ์ `<think>` ๋ฐ `</think>` ํ๊ทธ ๋ด์์ ์์ ์ ์ถ๋ก ๊ณผ์ ์ ๋ช
์์ ์ผ๋ก ๋ณด์ฌ์ค๋๋ค. ์ด๋ ํฌ๋ช
์ฑ์ ๋์ด๊ณ , ์ฌ์ฉ์๋ค์ด โฉON์ ๊ฒฐ๋ก ๋์ถ ๋ฐฉ์์ ์ดํดํ๋ ๋ฐ ๋์์ ์ค๋๋ค.
|
| 89 |
+
- **ํด๊ฒฐ ๋จ๊ณ**: ์ถ๋ก ์งํ ํ, ๋ชจ๋ธ์ ๊ฒฐ๋ก ์ `<solution>` ๋ฐ `</solution>` ํ๊ทธ ๋ด์์ ๋ช
ํํ๊ณ ๊ฐ๊ฒฐํ๊ฒ ์์ฝํ์ฌ ์ ์ํฉ๋๋ค.
|
| 90 |
+
|
| 91 |
+
## ๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ
|
| 92 |
+
|
| 93 |
+
โฉON์ ๋ํ์์ ์ฌ์ฉ๋ ์ข
ํฉ์ ์ธ ๋ฒค์น๋งํฌ๋ฅผ ํตํด ํ๊ฐ๋์์ต๋๋ค.
|
| 94 |
+
์ด ๋ฒค์น๋งํฌ๋ ๊ฐ๊ด์ ๋ฌธ์ (MCQA)์ ๊ฐ๋ฐฉํ ์ง๋ฌธ์ผ๋ก ๊ตฌ์ฑ๋์ด ๊ธ์ต ์ธ์ด ๋ชจ๋ธ์ ์ค๋ฌด์ ๋ฐ ์ด๋ก ์ ๋ฅ๋ ฅ์ ์ฒ ์ ํ ํ๊ฐํฉ๋๋ค.
|
| 95 |
+
๋ฒค์น๋งํฌ๋ ์ฌ๋ฌดํ๊ณ, ๊ธ์ต์์ฅ, ๊ธ์ต ์ง์์๋ต(Open-Ended FinQA) ํ์คํฌ๋ก ๋ถ๋ฅ๋ฉ๋๋ค:
|
| 96 |
+
|
| 97 |
+
- **์ฌ๋ฌดํ๊ณ**: ๊ธ์ต ๊ฐ๋
, ํ๊ณ ์์น ๋ฐ ๊ณ๋ ๊ฒฝ์ ์ถ๋ก ์ ๋ํ ๋ชจ๋ธ์ ์ง์๊ณผ ๋ถ์ ๋ฅ๋ ฅ์ ํ๊ฐํฉ๋๋ค.
|
| 98 |
+
- **๊ธ์ต์์ฅ**: ๊ธ์ต ์์ฅ, ์์คํ
, ๊ท์ ๋ฐ ๋ถ์ผ๋ณ ์ฌ์ค์ ์ง์์ ๋ํ ๋ชจ๋ธ์ ์ดํด๋ฅผ ํ๊ฐํฉ๋๋ค.
|
| 99 |
+
- **๊ธ์ต ์ง์์๋ต(Open-Ended FinQA)**: ์ค์ ๊ธ์ต ๋ฌธ์ ํด๊ฒฐ ์ํฉ์ ์๋ฎฌ๋ ์ด์
ํ ๋ณต์กํ๊ณ ์ธ๋ถ์ ์ธ ์ถ๋ก ๋ฌธ์ ๋ค๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
|
| 100 |
+
|
| 101 |
+
์ด ํ๊ฐ ๋ฐ์ดํฐ์
์ ์์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
|
| 102 |
+
|
| 103 |
+
<figure style="text-align: center;">
|
| 104 |
+
<img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/7vLKeR6wTbr88UdOeikaE.png" width="700" height="900" alt="์ํ ์ด๋ฏธ์ง" style="display: block; margin: auto;">
|
| 105 |
+
<figcaption style="font-style: italic; color: gray; margin-top: 8px;">
|
| 106 |
+
ํ๊ฐ ๋ฒค์น๋งํฌ ์์. ๊ฐ ์์๋ ๊ฐ ์นดํ
๊ณ ๋ฆฌ์ ๋ํ ๊ตฌ์ฒด์ ์ธ question type์ ๋ณด์ฌ์ค๋๋ค.
|
| 107 |
+
</figcaption>
|
| 108 |
+
</figure>
|
| 109 |
+
|
| 110 |
+
**๊ฒฐ๊ณผ**
|
| 111 |
+
|
| 112 |
+
โฉON์ KRX ๊ธ์ต ์ธ์ด๋ชจ๋ธ ๊ฒฝ์ง๋ํ์์ ์์ํ ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ์ ๋ ํ๊ท ์ ์ผ๋ก ๊ฐ์ฅ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค.
|
| 113 |
+
ํนํ ์ฌ๋ฌดํ๊ณ ๋ฐ ๊ธ์ต ์ง์์๋ต(Open-Ended FinQA) ์๋ธ์
์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ, ์ด ๋ชจ๋ธ์ด ๋ฐ์ด๋ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฐ์ง๊ณ ์์์ ๋ณด์ฌ์ค๋๋ค.
|
| 114 |
+
๋ํ ๋๋ฉ์ธ ์ ๋ฌธ ์ง์(์์ฅ ๋ถ์ผ)์ ์ค์ ์ ๋ ๋์์์๋ ๋ถ๊ตฌํ๊ณ , ๊ธ์ต์์ฅ ์๋ธ์
์์ ๋๋ถ๋ถ์ ๋ชจ๋ธ๋ค์ ์์๋ฉฐ โฉON์ ๋ฐ์ด๋ ์ถ๋ก ๋ฅ๋ ฅ์ ๋ค์ ํ ๋ฒ ์
์ฆํ์์ต๋๋ค.
|
| 115 |
+
|
| 116 |
+
<!-- | Models | F&A | Market | Open-Ended | Average |
|
| 117 |
+
|-------------------------------------------|------|--------|------------|---------|
|
| 118 |
+
| overfit-brothers/hello_world06 | 0.65 | **0.83** | 0.01 | 0.50 |
|
| 119 |
+
| AnonymousLLMer/krx-qwen2.5-v1206-1 | 0.63 | 0.65 | 0.04 | 0.44 |
|
| 120 |
+
| shibainu24/qwen2.5-7B-inst-release-1516wk | 0.56 | 0.67 | 0.04 | 0.43 |
|
| 121 |
+
| Q-PING/krx_1205_test_model_3 | 0.58 | 0.64 | 0.02 | 0.42 |
|
| 122 |
+
| Hi-Q/krx_1206_test_model_2 | 0.60 | 0.61 | 0.02 | 0.41 |
|
| 123 |
+
| **โฉON (Ours)** | **0.78** | 0.66 | **0.18** | **0.54** | -->
|
| 124 |
+
|
| 125 |
+
<figure style="text-align: center;">
|
| 126 |
+
<img src="https://cdn-uploads.huggingface.co/production/uploads/63e087b6a98d931aa90c1b9c/--5Kkwfuf8c6hbNUvpJq6.png" width="700" height="900" alt="์ํ ์ด๋ฏธ์ง" style="display: block; margin: auto;">
|
| 127 |
+
<!-- <figcaption style="font-style: italic; color: gray; margin-top: 8px;">
|
| 128 |
+
Overview of the benchmark used for evaluation. Each example demonstrates a specific question type for each category.
|
| 129 |
+
</figcaption> -->
|
| 130 |
+
</figure>
|
| 131 |
+
|
| 132 |
+
## Quick Start
|
| 133 |
+
|
| 134 |
+
```python
|
| 135 |
+
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
|
| 136 |
+
|
| 137 |
+
model = AutoModelForCausalLM.from_pretrained("KRX-Data/WON-Reasoning", device_map="auto")
|
| 138 |
+
tokenizer = AutoTokenizer.from_pretrained("KRX-Data/WON-Reasoning")
|
| 139 |
+
|
| 140 |
+
messages = [
|
| 141 |
+
{"role": "user", "content": <your_promt>} # Replace `<your_prompt>` with your query!
|
| 142 |
+
]
|
| 143 |
+
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
|
| 144 |
+
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
|
| 145 |
+
|
| 146 |
+
generated_ids = model.generate(
|
| 147 |
+
**model_inputs,
|
| 148 |
+
max_new_tokens=512
|
| 149 |
+
)
|
| 150 |
+
generated_ids = [
|
| 151 |
+
output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
|
| 152 |
+
]
|
| 153 |
+
|
| 154 |
+
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
|
| 155 |
+
```
|
| 156 |
+
|
| 157 |
+
## Citation
|
| 158 |
+
|
| 159 |
+
```
|
| 160 |
+
@article{son2025won,
|
| 161 |
+
title={Won: Establishing Best Practices for Korean Financial NLP},
|
| 162 |
+
author={Son, Guijin and Ko, Hyunwoo and Jung, Haneral and Hwang, Chami},
|
| 163 |
+
journal={arXiv preprint arXiv:2503.17963},
|
| 164 |
+
year={2025}
|
| 165 |
+
}
|
| 166 |
+
```
|
| 167 |
+
|
| 168 |
+
## Contact
|
| 169 |
+
|
| 170 |
+
```
|
| 171 | |
| 172 |
+
```
|