๐ Weekly AI Paper Digest
๊ธฐ๊ฐ: 2026-02-16 ~ 2026-02-21 ์ ์ : ์ด๋ฒ ์ฃผ ๊ฐ์ฅ ์ฃผ๋ชฉ๋ฐ์ ๋ ผ๋ฌธ Top 5
๐ ์ด๋ฒ ์ฃผ Top 5
| ์์ | ๋ ผ๋ฌธ | โฌ๏ธ | Deep Dive |
|---|---|---|---|
| ๐ฅ | Less is Enough: Synthesizing Diverse Datโฆ | 219 | DD-026 |
| ๐ฅ | SQuTR: A Robustness Benchmark for Spokenโฆ | 140 | DD-027 |
| ๐ฅ | GLM-5: from Vibe Coding to Agentic Enginโฆ | 71 | DD-028 |
| 4. | Experiential Reinforcement Learning | 61 | DD-029 |
| 5. | MedXIAOHE: A Comprehensive Recipe for Buโฆ | 58 | DD-030 |
๐ ์ด๋ฒ ์ฃผ ํธ๋ ๋
ํต์ฌ ํค์๋
- ํผ์ฒ ๊ณต๊ฐ ๋ฐ์ดํฐ ํฉ์ฑ (Feature Space Synthesis): ํ ์คํธ์ ์ธ์ด์ ๋ค์์ฑ์ด ์๋ ๋ชจ๋ธ์ ํผ์ฒ ๊ณต๊ฐ์์ ์ ์๋ฏธํ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ์ฌ ์ฌํ ํ์ต ํจ์จ์ ๊ทน๋ํํ๋ ์ ๊ทผ๋ฒ
- ์์ด์ ํธ ์์ง๋์ด๋ง (Agentic Engineering): ๋จ์ํ ์ฝ๋ ์์ฑ์ด๋ ์ถ๋ก ์ ๋์ด, ๋ชจ๋ธ์ด ์์จ์ ์ผ๋ก ์์ง๋์ด๋ง ์์ ์ ์ํํ๋ ํจ๋ฌ๋ค์์ผ๋ก์ ์ ํ
- ์ค์ธ๊ณ ๊ฐ์ธ์ฑ (Real-world Robustness): ์์ฑ ๋ ธ์ด์ฆ๋ ์๋ฃ ํ์ฅ ๋ฑ ์ค์ ํ๊ฒฝ์์ ๋ฐ์ํ๋ ๋ณต์กํ ๋ณ๋๊ณผ ํผ๋๋ฐฑ ์์์๋ ๊ฒฌ๊ณ ํ๊ฒ ์ฑ๋ฅ์ ์ ์งํ๋ ๊ฒ
- ๊ฒฝํ์ ๊ฐํํ์ต (Experiential RL): ํฌ์ํ๊ณ ์ง์ฐ๋ ํผ๋๋ฐฑ ํ๊ฒฝ์์ ์ธ์ด ๋ชจ๋ธ์ด ๊ด์ฐฐ๋ ์คํจ๋ฅผ ๋ฏธ๋์ ํ๋ ๋ณํ๋ก ํจ๊ณผ์ ์ผ๋ก ์ ํ์ํค๋ ํ์ต ๋ฐฉ๋ฒ
๊ณตํต ์ฃผ์
์ด๋ฒ ์ฃผ ๋ ผ๋ฌธ๋ค์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์์ ํ๋ณด๋ณด๋ค๋ ๋ฐ์ดํฐ์ ์ง์ ํจ์จ์ฑ๊ณผ ๋ชจ๋ธ์ ์ค์ฉ์ ๊ฐ์ธ์ฑ์ ๊ณ ๋ํํ๋ ๋ฐ ์ด์ ์ ๋ง์ถ๊ณ ์์ต๋๋ค. ์ฐ๊ตฌ์๋ค์ ๋ชจ๋ธ์ ๋ด๋ถ ํผ์ฒ ๊ณต๊ฐ์ ์ดํดํ์ฌ ์ ์ ๋ฐ์ดํฐ๋ก๋ ํ์ต ํจ๊ณผ๋ฅผ ๋์ด๊ฑฐ๋, ๋ ธ์ด์ฆ์ ์ ๋ฌธ ๋๋ฉ์ธ ๋ฑ ์ค์ ํ๊ฒฝ์ ์ด๋ ค์์ ๊ทน๋ณตํ๋ ๋ฐฉํฅ์ผ๋ก ์ฐ๊ตฌ๋ฅผ ํ์ฅํ๊ณ ์์ต๋๋ค.
์ฃผ๋ชฉํ ์
GLM-5 ์ฐ๊ตฌ์์ ์ ์๋ โ๋ฐ์ด๋ธ ์ฝ๋ฉ(Vibe Coding)โ์์ โ์์ด์ ํธ ์์ง๋์ด๋งโ์ผ๋ก์ ํจ๋ฌ๋ค์ ์ ํ์ AI๊ฐ ๋จ์ํ ๋๊ตฌ๋ฅผ ๋์ด ์ฌ์ฉ์์ ์๋๋ฅผ ์์จ์ ์ผ๋ก ํด์ํ๊ณ ์คํํ๋ ๋จ๊ณ๋ก ์ง์ ํ๊ณ ์์์ ์์ฌํฉ๋๋ค. ๋ํ, ๊ธฐ์กด ํ ์คํธ ๊ธฐ๋ฐ์ ๋ค์์ฑ ์งํ์ ํ๊ณ๋ฅผ ์ง์ ํ๊ณ ํผ์ฒ ๊ณต๊ฐ์์ ๋ฐ์ดํฐ ํฉ์ฑ์ ํตํด โLess is Enoughโ๋ฅผ ์คํํ๋ ค๋ ์๋์, ๊ฐํํ์ต์์์ ์คํจ๋ฅผ ๋ ์ ํ์ต์ํค๋ ๊ฒฝํ์ ์ ๊ทผ๋ฒ์ ๋ฐ์ดํฐ ํจ์จ์ฑ๊ณผ ํ์ต ๋ฉ์ปค๋์ฆ์ ํ์ ์ ๋ณด์ฌ์ค๋๋ค.
์ค๋ฌด ์์ฌ์
LLM์ ์ฌํ ํ์ต(Post-training)ํ ๋๋ ๋จ์ํ ๋ฐ์ดํฐ ์์ ๋๋ฆฌ๊ธฐ๋ณด๋ค, ํผ์ฒ ๊ณต๊ฐ ๋ถ์์ ํตํด ํ์คํฌ ๊ด๋ จ ํน์ง์ ์ ํฌ์ฐฉํ๋ ๊ณ ํ์ง์ ๋ฐ์ดํฐ๋ฅผ ์ ๋ณํ๊ฑฐ๋ ํฉ์ฑํ๋ ์ ๋ต์ด ๋น์ฉ ์ ๊ฐ๊ณผ ์ฑ๋ฅ ํฅ์์ crucialํ ๊ฒ์ ๋๋ค. ๋ํ ์์ฑ ๊ฒ์์ด๋ ์๋ฃ ๋ถ์ผ ๋ฑ ํน์ ๋๋ฉ์ธ ์๋น์ค๋ฅผ ๊ฐ๋ฐํ ๋๋ ๊นจ๋ํ ํ์ต ๋ฐ์ดํฐ๋ฟ๋ง ์๋๋ผ SQuTR์ด๋ MedXIAOHE ์ฌ๋ก์ฒ๋ผ ๋ ธ์ด์ฆ์ ๋ณต์กํ ์ํฉ์ ๋ฐ์ํ ๊ฐ์ธ์ฑ ํ ์คํธ๋ฅผ ๋ชจ๋ธ ๊ฒ์ฆ ํ๋ก์ธ์ค์ ๋ฐ๋์ ํฌํจํด์ผ ํฉ๋๋ค.
๐ ๋ ผ๋ฌธ๋ณ ์์ฝ
๐ฅ 1. Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs
arXiv: 2602.10388 | โฌ๏ธ 219 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
llmdata-synthesissparse-autoencoderfeature-learningpost-traininginterpretabilityalignmentdata-diversity
๊ธฐ์กด ํ ์คํธ ๊ธฐ๋ฐ ๋ค์์ฑ ์งํ์ ํ๊ณ๋ฅผ ๋์ด, ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋ด๋ถ ํน์ฑ ๊ณต๊ฐ(Feature Space)์์ ๋๋ฝ๋ ์ค์ํ ํน์ง์ ์๋ณํ๊ณ ์ด๋ฅผ ์ฑ์ฐ๋ ๋ฐฉ์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ํฉ์ฑํ์ฌ ์ ์ ์์ผ๋ก๋ ํ์ ํ์ต ํจ์จ์ ๊ทน๋ํํ๋ ์๋ก์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๊ธฐ ๋๋ฌธ์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ฅ 2. SQuTR: A Robustness Benchmark for Spoken Query to Text Retrieval under Acoustic Noise
arXiv: 2602.12783 | โฌ๏ธ 140 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
spoken-query-retrievalrobustness-benchmarkacoustic-noiseasr-error-propagationinformation-retrievalnoise-robustnesssqutrmultimodal-retrieval
์ค์ ํ๊ฒฝ์ ์์(Noise)์ ๊ณ ๋ คํ์ฌ ์์ฑ ๊ฒ์ ์์คํ ์ ๋ด๊ตฌ์ฑ์ ํ๊ฐํ ์ ์๋ ๋๊ท๋ชจ ๋ฒค์น๋งํฌ(SQuTR)๋ฅผ ์ ์ํจ์ผ๋ก์จ, ์์ฑ ์ธ์ ์ค๋ฅ๊ฐ ์ ๋ณด ๊ฒ์ ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ ์ํฅ์ ์ ๋์ ์ผ๋ก ๋ถ์ํ๊ณ ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ํ๊ฐ ๊ฒฉ์ฐจ๋ฅผ ํด์ํ๋ค๋ ์ ์์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ฅ 3. GLM-5: from Vibe Coding to Agentic Engineering
arXiv: 2602.15763 | โฌ๏ธ 71 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
glm-5agentic-aiasynchronous-rlsoftware-engineeringllm-post-trainingmodel-alignmentlong-contextvibe-coding
์ด ๋ ผ๋ฌธ์ ์ธ๊ฐ์ด ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํ๋ โ๋ฐ์ด๋ธ ์ฝ๋ฉ(Vibe Coding)โ ๋จ๊ณ๋ฅผ ๋์ด, AI ์ค์ค๋ก ๊ณํํ๊ณ ์ฝ๋๋ฅผ ์์ฑํ๋ โ์์ด์ ํธ ์์ง๋์ด๋ง(Agentic Engineering)โ ์๋๋ฅผ ์ด์์ผ๋ฉฐ, ๋น๋๊ธฐ ๊ฐํ ํ์ต(Asynchronous RL)์ ํตํด ํจ์จ์ฑ์ ๊ทน๋ํํ์ฌ ์คํ ์์ค ๋ชจ๋ธ์ด ์ต์์ ์์ฉ ๋ชจ๋ธ์ ๋ฐ์ด๋์ ์ ์์์ ์ฆ๋ช ํ๊ธฐ์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
4. 4. Experiential Reinforcement Learning
arXiv: 2602.13949 | โฌ๏ธ 61 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
reinforcement-learningexperiential-learningagentic-aisparse-rewardsreflection-loopreasoningllm-training
์ด ๋ ผ๋ฌธ์ ์ธ์ด ๋ชจ๋ธ์ด ํฌ์ํ๊ณ ์ง์ฐ๋ ํผ๋๋ฐฑ ํ๊ฒฝ์์ ๊ฒช๋ ํ์ต์ ๋นํจ์จ์ ํด๊ฒฐํ๊ธฐ ์ํด, ์ธ๊ฐ์ ๊ฒฝํ ํ์ต ๊ณผ์ ์ฒ๋ผ ์ฑ์ฐฐ(Reflection)๊ณผ ๊ต์ (Correction) ๋จ๊ณ๋ฅผ ๊ฐํ ํ์ต ๋ฃจํ์ ๋ช ์์ ์ผ๋ก ํตํฉํ์ฌ ํ์ต ํจ์จ๊ณผ ์ฑ๋ฅ์ ํ๊ธฐ์ ์ผ๋ก ๋์๊ธฐ์ ๋งค์ฐ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
5. 5. MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs
arXiv: 2602.12705 | โฌ๏ธ 58 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
medical-aimultimodal-learningcontinual-pretrainingreasoningclinical-decision-supportllmreinforcement-learningdata-curation
์๋ฃ ๋ถ์ผ์ ์ด๊ธฐ์ข ๋ฐ์ดํฐ๋ฅผ ํตํฉํ์ฌ ์ง์์ ๊ณต๋ฐฑ์ ๋ฉ์ฐ๊ณ ๊ฐํ ํ์ต ๋ฐ ๋๊ตฌ ํ์ฉ ํ๋ จ์ ํตํด ์ ๋ฌธ๊ฐ ์์ค์ ์์ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฐ์ถ ์ต๊ณ ์ฑ๋ฅ์ ์๋ฃ์ฉ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ ๊ตฌ์ถํ ์ ์์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ ์์ฑ์ผ: 2026-02-22 | ๐ค GLM-4.7 Weekly Digest