โ ๐ ์ด๋ฒ ์ฃผ Weekly Digest๋ก ๋์๊ฐ๊ธฐ
DD-001 Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs
arXiv: 2601.17058 ๊ธฐ๊ด: Shanghai Jiao Tong University Upvotes: 181 | Comments: 4 ์์: ์ด๋ฒ ์ฃผ Top 1

[๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs
Paper Info: arXiv:2601.17058
Topic: LLM์ ํ์ฉํ ๋ฐ์ดํฐ ์ค๋น(Data Preparation) ์ค๋ฌธ ์กฐ์ฌ
Target Audience: Junior Data Engineers, ML Engineers
1. ์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ?
๊ธฐ์กด์ ๋ฐ์ดํฐ ์ค๋น ๋ฐฉ์์ ์ ํด์ง ๊ท์น(Rule-based)์ ์ง๋์น๊ฒ ์์กดํ์ฌ, ๋ฐ์ดํฐ ํ์์ด ์กฐ๊ธ๋ง ๋ฌ๋ผ์ ธ๋ ์๋ํ์ง ์๊ฑฐ๋ ๊ฐ๋ฐ์๊ฐ ์์์ ์ผ๋ก ์ฝ๋๋ฅผ ๊ณ ์ณ์ผ ํ๋ ํ๊ณ๊ฐ ์์์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ ๋ฐ์ดํฐ ์ ์ , ํตํฉ, ๋ณด๊ฐ์ ์ ๊ณผ์ ์์ LLM(๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ)์ ํ์ฉํ์ฌ โ๊ท์น ๊ธฐ๋ฐโ์์ โ์๋ฏธ ์ดํด ๊ธฐ๋ฐโ์ผ๋ก ํจ๋ฌ๋ค์์ ์ ํํ ์ ์์์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ต๋๋ค. ์๋ฐฑ ๊ฐ์ ์ต์ ์ฐ๊ตฌ๋ฅผ ๋ถ์ํ์ฌ, LLM์ด ๋จ์ํ ํ ์คํธ ์์ฑ์ ๋์ด ์ค์ ๊ธฐ์ ์ ๋๋ฌ์ด ๋ฐ์ดํฐ(Messy Data)๋ฅผ ์ฒญ์ํ๊ณ ๊ฐ์น ์๋ ์์ฐ์ผ๋ก ๋ง๋๋ ํต์ฌ ๋๊ตฌ๋ก ์๋ฆฌ ์ก๊ณ ์์์ ์ ์ฆํ์ต๋๋ค.
2. ํต์ฌ ์์ด๋์ด ์ฝ๊ฒ ์ดํดํ๊ธฐ
๐ท๏ธ ์ผ์์ํ ๋น์ : โ์๋ฆฌ์ฌ์ ๋ก๋ด ํ์ ์ฐจ์ดโ
๋ฐ์ดํฐ ์ค๋น๋ฅผ **โ์๋ฆฌ๋ฅผ ์ํ ์ฌ๋ฃ ์์งโ**์ ๋น์ ํด ๋ณด๊ฒ ์ต๋๋ค.
- ๊ธฐ์กด ๋ฐฉ์ (Rule-based): โํ ๋งํ ๋ ๋ฌด์กฐ๊ฑด 2cm ํ๋ธ๋ก ์ฐ์ด๋ผโ, โ๋น๊ทผ์ 3๋ถ๊ฐ ์ถ์๋ผโ๋ผ๊ณ ์ ํ ๋งค๋ด์ผ๋๋ก๋ง ์์ง์ด๋ ๋ก๋ด ํ๊ณผ ๊ฐ์ต๋๋ค. ์ฌ๋ฃ(๋ฐ์ดํฐ)๊ฐ ์กฐ๊ธ ์ํ๊ฑฐ๋ ๋ชจ์์ด ์์์ง ์์๋ ๋งค๋ด์ผ์ ์์ผ๋ฉด ์ฒ๋ฆฌํ์ง ๋ชปํฉ๋๋ค. ์์ธ ์ํฉ์ ๋์ฒํ๋ ค๋ฉด ์ฌ๋์ด ์ผ์ผ์ด ์ฝ๋(๋งค๋ด์ผ)๋ฅผ ์์ ํด์ผ ํฉ๋๋ค.
- ๋ ผ๋ฌธ์ด ์ ์ํ๋ LLM ๋ฐฉ์: **โ๋ฏธ์๋ญ ์ ฐํ(LLM)โ**์ ๊ณ ์ฉํ๋ ๊ฒ์ ๋๋ค. ์ ฐํ์๊ฒ โ๋น๋น๋ฐฅ์ ๋ง๋ค ์ฌ๋ฃ๋ฅผ ์ค๋นํด ์คโ๋ผ๊ณ ์ํค๋ฉด, ์ ฐํ๋ ์ํ ์์ฌ๊ท๋ฅผ ๊ณจ๋ผ๋ด๊ณ (Cleaning), ๋ค๊นจ ๊ฐ๋ฃจ์ ์ฐธ๊ธฐ๋ฆ์ ์ ์ ํ ์์ด(Enrichment), ์ฌ๋ฃ๋ค์ด ์ด์ธ๋ฆฌ๊ฒ ์ค๋นํฉ๋๋ค. ๋งค๋ด์ผ์ด ์์ด๋ ์ฌ๋ฃ์ **๋งฅ๋ฝ(Context)**์ ์ดํดํ๊ณ ์ ์ฐํ๊ฒ ์ฒ๋ฆฌํฉ๋๋ค.
โ๏ธ ๋จ๊ณ๋ณ ๋์ ๋ฐฉ์
์ด ๋ ผ๋ฌธ์ LLM์ด ๋ฐ์ดํฐ๋ฅผ ์ค๋นํ๋ 3๋จ๊ณ ํ๋ก์ธ์ค๋ฅผ ์ ์ํฉ๋๋ค.
- Data Cleaning (์ฒญ์ - ์ป๊ณ ๋ค๋ฌ๊ธฐ)
- ๊ณผ์ : ๋ ์ง ํ์์ด
2024/01/01์ธ ๊ณณ๋ ์๊ณJan 1st์ธ ๊ณณ๋ ์์ ๋, LLM์๊ฒ โ๋ชจ๋ ๋ ์ง๋ฅผ YYYYMMDD ํ์์ผ๋ก ํต์ผํด์คโ๋ผ๊ณ ์ง์ํฉ๋๋ค. - LLM ์ญํ : ๋จ์ํ ๋ฌธ์์ด์ ์๋ฅด๋ ๊ฒ์ด ์๋๋ผ, ๋ฌธ๋งฅ์ ๋ณด๊ณ
01/02/03์ด 2001๋ ์ธ์ง 2003๋ ์ธ์ง ํ๋จํ์ฌ ํ์คํํฉ๋๋ค.
- ๊ณผ์ : ๋ ์ง ํ์์ด
- Data Integration (ํตํฉ - ๋ฌถ๊ธฐ)
- ๊ณผ์ : A ๋ฐ์ดํฐ๋ฒ ์ด์ค์ โ์ผ์ฑ์ ์โ์ B ๋ฐ์ดํฐ๋ฒ ์ด์ค์ โSamsung Electronicsโ๊ฐ ๊ฐ์ ํ์ฌ์ธ์ง ํ์ธํฉ๋๋ค.
- LLM ์ญํ : ๋จ์ ์คํ ๋ง ๋งค์นญ์ด ์๋๋ผ, ๋ ๊ธฐ์ ์ ์ค๋ช ์ด๋ ์์น ์ ๋ณด๋ฅผ ๋ณด๊ณ **โ๊ฐ์ ์ค์ฒด(Entity)์ด๋คโ**๋ผ๊ณ ์๋ฏธ์ ์ผ๋ก ํ๋จํฉ๋๋ค (Entity Matching).
- Data Enrichment (๋ณด๊ฐ - ์๋
ํ๊ธฐ)
- ๊ณผ์ : ๋ฉํ๋ฐ์ดํฐ๊ฐ ์๋ ๋ฐ์ดํฐ์ ํ๊ทธ๋ฅผ ๋ฌ๊ฑฐ๋, ์ค๋ช ์ ๋ง๋ถ์ ๋๋ค.
- LLM ์ญํ : ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ์ฌ ์๋์ผ๋ก ์์ฝ๋ณธ์ ๋ง๋ค๊ฑฐ๋ ๋น ์ง ์๋ฏธ๋ฅผ ์ฑ์ ๋ฃ์ต๋๋ค.
๐ง ํต์ฌ ์๊ณ ๋ฆฌ์ฆ ๋ฐ ๊ธฐ๋ฒ
์ด ๋ ผ๋ฌธ์ ๋จ์ผ ์๊ณ ๋ฆฌ์ฆ๋ณด๋ค๋ ํ๋กฌํํธ ์์ง๋์ด๋ง ์ ๋ต์ ํต์ฌ ๊ธฐ๋ฒ์ผ๋ก ๋ค๋ฃน๋๋ค.
- Prompt-Based End-to-End Standardization:
- ์ฌ์ฉ์๊ฐ โ๋ ์ง๋ฅผ YYYYMMDD๋ก ๋ฐ๊ฟโ๋ผ๊ณ ๋ช
๋ น์ด(Instruction)์ ์์(In-context example)๋ฅผ ํจ๊ป ์ฃผ๋ฉด, LLM์ด ์ด๋ฅผ ์ฐธ์กฐํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ณํํฉ๋๋ค. (์:
LLM-GDO๋ชจ๋ธ ๋ฐฉ์)
- ์ฌ์ฉ์๊ฐ โ๋ ์ง๋ฅผ YYYYMMDD๋ก ๋ฐ๊ฟโ๋ผ๊ณ ๋ช
๋ น์ด(Instruction)์ ์์(In-context example)๋ฅผ ํจ๊ป ์ฃผ๋ฉด, LLM์ด ์ด๋ฅผ ์ฐธ์กฐํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ณํํฉ๋๋ค. (์:
- Reasoning-Enhanced Batch Processing:
- ๋ฐ์ดํฐ๋ฅผ ํ๋์ฉ ์ฒ๋ฆฌํ์ง ์๊ณ ํ๊บผ๋ฒ์(Batch) ๋ณด์ฌ์ฃผ๋, โ์๊ฐํ๋ ๊ณผ์ (Chain-of-Thought)โ์ ํ๋กฌํํธ์ ํฌํจ์์ผ ์ค๋ฅ(Hallucination)๋ฅผ ์ค์ด๋ ๋ฐฉ์์
๋๋ค. (์:
LLM-Preprocessor)
- ๋ฐ์ดํฐ๋ฅผ ํ๋์ฉ ์ฒ๋ฆฌํ์ง ์๊ณ ํ๊บผ๋ฒ์(Batch) ๋ณด์ฌ์ฃผ๋, โ์๊ฐํ๋ ๊ณผ์ (Chain-of-Thought)โ์ ํ๋กฌํํธ์ ํฌํจ์์ผ ์ค๋ฅ(Hallucination)๋ฅผ ์ค์ด๋ ๋ฐฉ์์
๋๋ค. (์:
3. ์คํ ๊ฒฐ๊ณผ ๋ถ์
์ฃผ์: ์ด ๋ ผ๋ฌธ์ **Survey(์กฐ์ฌ ๋ ผ๋ฌธ)**์ด๋ฏ๋ก, ํน์ ๋ชจ๋ธ ํ๋์ ์ฑ์ ํ๊ฐ ์๋ ๊ฒ์ด ์๋๋ผ ์๋ฐฑ ๊ฐ์ ๋ ผ๋ฌธ์์ ๋ฐ๊ฒฌ๋ **ํต์ฐฐ(Insights)**์ ์ ๋ฆฌํ ๊ฒฐ๊ณผ์ ๋๋ค.
๐ ์ฃผ์ ๋ฒค์น๋งํฌ ๋ฐ ์ฑ๊ณผ
- ๋ฒค์น๋งํฌ: ๋ค์ํ ๋๋ฉ์ธ(์ ์์๊ฑฐ๋, ๊ธ์ต, ์๋ฃ ๋ฑ)์ Dirty Dataset๊ณผ ๊ธฐ์กด ๋ฐ์ดํฐ ์ ์ ํด๋ค์ด ์ฌ์ฉํ๋ Entity Matching ํ์ค ๋ฐ์ดํฐ์ ๋ค์ ๋์์ผ๋ก ์ํ๋ ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ๋ถ์ํ์ต๋๋ค.
- ์ฑ๊ณผ ๋ถ์:
- ์ผ๋ฐํ ๋ฅ๋ ฅ (Generalization): ๊ธฐ์กด์ ์ฌ์ ํ์ต๋ ์ธ์ด ๋ชจ๋ธ(Pretrained LMs)์ ํน์ ๋๋ฉ์ธ ๋ฐ์ดํฐ์๋ง ์ ๋ง์ถฐ์ ธ ์์ด(OOD, Out-of-Distribution) ๋ฐ์ดํฐ๊ฐ ์กฐ๊ธ๋ง ๋ฌ๋ผ์ง๋ฉด ์ฑ๋ฅ์ด ๊ธ๊ฒฉํ ๋จ์ด์ก์ต๋๋ค. ๋ฐ๋ฉด, ์ต์ LLM๋ค์ ๋๋ฉ์ธ ์ง์์ด ์๋๋ผ๋ **๊ฐ๋ ฅํ ์๋ฏธ ์ดํด ๋ฅ๋ ฅ(Semantic Understanding)**์ ๋ฐํ์ผ๋ก ๋ฐ์ดํฐ์ ๊ด๊ณ๋ฅผ ์ฐพ์๋ด๋ ๋ฐ ์์ด **๊ฐ๊ฑดํ ์ฑ๋ฅ(Robust Performance)**์ ๋ณด์์ต๋๋ค.
- ํจ์จ์ฑ: โReasoning-Enhanced Batch Promptingโ ๊ธฐ๋ฒ์ ์ฌ์ฉํ๋ฉด, ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ์ ํ๋๋ฅผ ๋์ด๋ ๋์์ ํ ๋ฒ์ ์ฌ๋ฌ ๋ฐ์ดํฐ๋ฅผ ๋ฌถ์ด ์ฒ๋ฆฌํ์ฌ API ํธ์ถ ๋น์ฉ๊ณผ ์๊ฐ์ ์ ์ฝํ ์ ์์์ด ํ์ธ๋์์ต๋๋ค.
- ์์์ ๊ฐ์: ์ ๋ฌธ๊ฐ๊ฐ ์ง์ ๊ท์น์ ์ฝ๋ฉํ๋ ๋ฐฉ์๋ณด๋ค ์์ฐ์ด ๋ช ๋ น๋ง์ผ๋ก๋ 80% ์ด์์ ์ ์ ์์ ์ ์๋ํํ ์ ์์ด, ์ธ๊ฑด๋น์ ์๊ฐ์ ํ๊ธฐ์ ์ผ๋ก ์ค์๋ค๊ณ ๋ณด๊ณ ๋์์ต๋๋ค.
4. ํ๊ณ์ ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
๐ ์ ์๊ฐ ์ธ๊ธํ ํ๊ณ์
- ํ ๋ฃจ์๋ค์ด์ (Hallucination): LLM์ ๊ฐ๋ ์กด์ฌํ์ง ์๋ ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋ด๋ฏํ๊ฒ ์ง์ด๋ผ ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ์ ์ ๊ณผ์ ์์ ์๋ณธ ๋ฐ์ดํฐ๋ฅผ ์๋ฑํ๊ฒ ์์ ํ๋ฉด ์น๋ช ์ ์ ๋๋ค.
- ๋น์ฉ ๋ฐ ์๋: ๋ฐ์ดํฐ๊ฐ ์์ฒ๋ง ๊ฑด ์ด์์ผ ๊ฒฝ์ฐ, LLM์ ํธ์ถํ๋ ๋ฐ ๋๋ ๋น์ฉ๊ณผ ์๊ฐ์ด ๊ธฐ์กด ๊ท์น ๊ธฐ๋ฐ ๋ฐฉ์๋ณด๋ค ํจ์ฌ ๋น์ ์ ์์ต๋๋ค.
- ํ๋ผ์ด๋ฒ์: ๊ธฐ์ ์ ๋ฏผ๊ฐํ ๋ฐ์ดํฐ๋ฅผ LLM์ ์ ๋ ฅํ์ฌ ์ฒ๋ฆฌํ ๋ ๋ณด์ ์ด์๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค.
๐ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
- Agentic Workflows (์์ด์ ํธ ์ํฌํ๋ก์ฐ): LLM์ด ๋จ์ํ ๋ต๋ณ๋ง ํ๋ ๊ฒ์ด ์๋๋ผ, ๊ฒ์ ๋๊ตฌ(SQL ์ฟผ๋ฆฌ ๋ฑ)๋ฅผ ์ฌ์ฉํ๊ฑฐ๋ ์ฝ๋๋ฅผ ์คํํ์ฌ ์ค์ค๋ก ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ฆํ๊ณ ์์ ํ๋ ์์จ์ ์ธ ์์ด์ ํธ(Agent) ํํ๋ก ๋ฐ์ ํด์ผ ํฉ๋๋ค.
- ์ํ ๋ชจ๋ธ ๋ฐ ํจ์จํ: ๊ฑฐ๋ํ ๋ชจ๋ธ ๋์ , ๋ฐ์ดํฐ ์ ์ ํนํ์ ์ต์ ํ๋ ์๊ณ ํจ์จ์ ์ธ ๋ชจ๋ธ(SLM)์ ์ฐ๊ตฌํ์ฌ ๋น์ฉ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํด์ผ ํฉ๋๋ค.
5. ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ
๐ข ์ด๋์ ๋ฐ๋ก ์ ์ฉ ๊ฐ๋ฅํ๊ฐ?
- BI(๋น์ฆ๋์ค ์ธํ ๋ฆฌ์ ์ค) ๋์๋ณด๋ ๊ตฌ์ถ: ์๋ก ๋ค๋ฅธ ํ์์ ์์ ํ์ผ๋ค์ด ์์ฌ ์์ ๋, ์ด๋ฅผ ํ๋๋ก ํตํฉํ์ฌ ๋ถ์ ๊ฐ๋ฅํ ํํ๋ก ๋ง๋๋ ETL(์ถ์ถ, ๋ณํ, ์ ์ฌ) ํ์ดํ๋ผ์ธ์ ์ฒซ ๋จ๊ณ์ ์ฆ์ ์ฌ์ฉ ๊ฐ๋ฅํฉ๋๋ค.
- ๋ง์ด๊ทธ๋ ์ด์ ์์คํ : ๋ ๊ฑฐ์ ์์คํ (์๋ ๋ฐฉ์)์์ ํ๋์ ์ธ ์์คํ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ฎ๊ธธ ๋, ๋ฐ์ดํฐ ํฌ๋งท์ ์๋์ผ๋ก ๋ณํํ๋ ์์ ์ ์ ์ฉํฉ๋๋ค.
- ๊ณ ๊ฐ ๋ฐ์ดํฐ ํตํฉ(CDP): ์ด๋ฆ์ด ๋ค๋ฅด๊ฒ ๊ธฐ๋ก๋ ๊ณ ๊ฐ(ํ๊ธธ๋ vs ๊ธธ๋ ํ)์ ํ๋๋ก ๋ฌถ๋ ๊ณ ๊ฐ 360๋ ๋ทฐ ๊ตฌ์ถ ์์ ์ ํ์ฉ๋ฉ๋๋ค.
๐ป ํ์ํ ๋ฆฌ์์ค
- ํ๋์จ์ด: ๋ก์ปฌ์์ LLM์ ๋๋ฆฌ๋ ค๋ฉด ๊ณ ์ฌ์ GPU(์: A100, RTX 4090)๊ฐ ํ์ํ์ง๋ง, **API ๋ฐฉ์(OpenAI, Claude ๋ฑ)**์ ์ฌ์ฉํ๋ฉด ๋ณ๋์ GPU ์์ด ์ผ๋ฐ ๊ฐ๋ฐ์ฉ ๋ ธํธ๋ถ์ผ๋ก๋ ๋ฐ๋ก ๊ฐ๋ฐ ๊ฐ๋ฅํฉ๋๋ค.
- ๋ฐ์ดํฐ: ํ๋กฌํํธ ํ๋์ ์ํ ์๋์ ์์ ๋ฐ์ดํฐ(์: ์ ์ ์ ๊ณผ ํ์ ์)๊ฐ ํ์ํฉ๋๋ค.
- ๋ผ์ด๋ธ๋ฌ๋ฆฌ: LangChain, LlamaIndex์ ๊ฐ์ LLM ์ฐ๋ ํ๋ ์์ํฌ์ Pandas/SQL ๊ฐ์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋๊ตฌ๊ฐ ๊ธฐ๋ณธ์ ์ผ๋ก ํ์ํฉ๋๋ค.
6. ์ด ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํ ์ฌ์ ์ง์
- LLM (Large Language Model): ๋๊ท๋ชจ ํ ์คํธ๋ก ํ์ตํ์ฌ ์์ฐ์ด๋ฅผ ์ดํดํ๊ณ ์์ฑํ๋ AI ๋ชจ๋ธ(์: GPT-4, Llama).
- Prompt Engineering: LLM์ด ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋๋ก ์ ๋ ฅํ๋ ๋ช ๋ น์ด๋ ์ง๋ฌธ์ ์ต์ ํํ๋ ๊ธฐ์ .
- Data Cleaning (๋ฐ์ดํฐ ์ ์ ): ๋ฐ์ดํฐ์ ํฌํจ๋ ์ค๋ฅ, ์ก์, ์ค๋ณต์ ์ ๊ฑฐํ์ฌ ํ์ง์ ๋์ด๋ ๊ณผ์ .
- Entity Resolution (์ํฐํฐ ํด๊ฒฐ/๋งค์นญ): ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ ์์ค์์ โ์์ธํน๋ณ์โ์ โSeoulโ์ด ๊ฐ์ ๋์์ ๊ฐ๋ฆฌํค๋์ง ์๋ณํ์ฌ ํตํฉํ๋ ๊ธฐ์ .
- In-Context Learning (๋ฌธ๋งฅ ๋ด ํ์ต): ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฌํ์ต์ํค์ง ์๊ณ , ํ๋กฌํํธ์ ์์๋ฅผ ๋ณด์ฌ์ค์ผ๋ก์จ ๋ชจ๋ธ์ด ๋ฌธ์ ๋ฅผ ํ๊ฒ ํ๋ ๋ฐฉ์.
- Few-Shot Learning: ๋จ ๋ช ๊ฐ์ ์์๋ง ์ฃผ์ด๋ ๋ชจ๋ธ์ด ํจํด์ ํ์ตํ์ฌ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฅ๋ ฅ.
- Semantic Understanding (์๋ฏธ์ ์ดํด): ๋จ์ด์ ํ๋ฉด์ ํํ๊ฐ ์๋๋ผ, ๊ทธ ๋จ์ด๊ฐ ๋ดํฌํ๋ ๋ป๊ณผ ๋ฌธ๋งฅ์ ์ดํดํ๋ ๋ฅ๋ ฅ.
๐ ์ด๋ฒ ์ฃผ ๊ด๋ จ Deep Dive
| ์์ | ๋ ผ๋ฌธ | Deep Dive |
|---|---|---|
| ๐ฅ | Can LLMs Clean Up Your Mess? A Survโฆ | ๐ ํ์ฌ ๋ฌธ์ |
| ๐ฅ | LongCat-Flash-Thinking-2601 Technicโฆ | DD-002 |
| ๐ฅ | Idea2Story: An Automated Pipeline fโฆ | DD-003 |
| 4. | daVinci-Dev: Agent-native Mid-trainโฆ | DD-004 |
| 5. | AgentDoG: A Diagnostic Guardrail Frโฆ | DD-005 |
๐ ์์ฑ์ผ: 2026-02-02 | ๐ค GLM-4.7 Deep Dive