๐ Weekly AI Paper Digest
๊ธฐ๊ฐ: 2026-01-26 ~ 2026-01-31 ์ ์ : ์ด๋ฒ ์ฃผ ๊ฐ์ฅ ์ฃผ๋ชฉ๋ฐ์ ๋ ผ๋ฌธ Top 5
๐ ์ด๋ฒ ์ฃผ Top 5
| ์์ | ๋ ผ๋ฌธ | โฌ๏ธ | Deep Dive |
|---|---|---|---|
| ๐ฅ | Can LLMs Clean Up Your Mess? A Survey ofโฆ | 181 | DD-001 |
| ๐ฅ | LongCat-Flash-Thinking-2601 Technical Reโฆ | 171 | DD-002 |
| ๐ฅ | Idea2Story: An Automated Pipeline for Trโฆ | 149 | DD-003 |
| 4. | daVinci-Dev: Agent-native Mid-training fโฆ | 123 | DD-004 |
| 5. | AgentDoG: A Diagnostic Guardrail Framewoโฆ | 120 | DD-005 |
๐ ๋ ผ๋ฌธ๋ณ ์์ฝ
๐ฅ 1. Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs
arXiv: 2601.17058 | โฌ๏ธ 181 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
llmdata-preparationdata-cleaningdata-integrationsurveyprompt-engineeringentity-matchingdata-centric-ai
์ด ๋ ผ๋ฌธ์ ์๋ฐฑ ๊ฐ์ ์ฐ๊ตฌ๋ฅผ ์ข ํฉํ์ฌ, ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํ์ฉํด ์ ํต์ ์ผ๋ก ์์์ ์ ์์กดํ๋ ๋ณต์กํ๊ณ ๋น์ผ ๋ฐ์ดํฐ ์ค๋น ๊ณผ์ ์ ์ด๋ป๊ฒ ์๋ํํ๊ณ ํ์ ํ ์ ์๋์ง ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ๊ธฐ ๋๋ฌธ์ ๋งค์ฐ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ฅ 2. LongCat-Flash-Thinking-2601 Technical Report
arXiv: 2601.16725 | โฌ๏ธ 171 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
longcat-flash-thinkingmixture-of-expertsagentic-aireinforcement-learningheavy-thinkingtest-time-scalingllm-reasoning
5,600์ต ํ๋ผ๋ฏธํฐ์ MoE(Mixture-of-Experts) ๊ตฌ์กฐ๋ฅผ ํ์ฉํ์ฌ, ๋๊ตฌ ์ฌ์ฉ ๋ฐ ์ธ๋ถ ํ๊ฒฝ๊ณผ์ ์ํธ์์ฉ์ด ํ์ํ ๋ณต์กํ ์ค์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ์ต๊ณ ์์ค(SOTA)์ ์์ด์ ํธ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ตฌํํ๊ณ , ์ด๋ฅผ โHeavy Thinkingโ์ด๋ผ๋ ์ถ๋ก ์๊ฐ ๊ณ์ฐ ํ์ฅ ๊ธฐ๋ฒ์ผ๋ก ๊ทน๋ํํ๋ค๋ ์ ์์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ฅ 3. Idea2Story: An Automated Pipeline for Transforming Research Concepts into Complete Scientific Narratives
arXiv: 2601.20833 | โฌ๏ธ 149 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
autonomous-sciencellm-agentsknowledge-graphresearch-automationoffline-computationscientific-discoveryidea-generation
์ด ๋ ผ๋ฌธ์ ์ฐ๊ตฌ ์๋ํ ์์คํ ์ด ๊ธฐ์กด์ ๋๋ฆฌ๊ณ ๋นํจ์จ์ ์ธ โ์ค์๊ฐ ์จ๋ผ์ธ ์ถ๋ก โ ๋ฐฉ์์์ ๋ฒ์ด๋, ์ฌ์ ์ ๊ตฌ์ถํ ์ง์ ๊ทธ๋ํ(Knowledge Graph)๋ฅผ ํ์ฉํด ๋น์ฉ๊ณผ ํ ๋ฃจ์๋ค์ด์ (Hallucination)์ ์ค์ด๊ณ ๋ชจํธํ ์์ด๋์ด๋ฅผ ์๋ฒฝํ ๊ณผํ์ ์์ฌ๋ก ๋ณํํ๋ ํ๊ธฐ์ ์ธ ํ์ดํ๋ผ์ธ Idea2Story๋ฅผ ์ ์ํ๊ธฐ ๋๋ฌธ์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
4. 4. daVinci-Dev: Agent-native Mid-training for Software Engineering
arXiv: 2601.18418 | โฌ๏ธ 123 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
ai-agentllmsoftware-engineeringmid-trainingfine-tuningcode-generationscalabilitymlops
์ด ๋ ผ๋ฌธ์ ๊ธฐ์กด์ ๋น์ผ ํ์ฒ๋ฆฌ(post-training) ๋ฐฉ์์ ๋์ด, LLM์ ํ๋ จ ์ค๊ฐ(mid-training) ๋จ๊ณ๋ถํฐ ์์ด์ ํธ์ฒ๋ผ ํ๋ํ๋ ๊ธฐ๋ฐ ๋ฅ๋ ฅ์ ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ก ํ์ต์์ผ ๋ ํ์ฅ ๊ฐ๋ฅํ๊ณ ๊ฐ๋ ฅํ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์์ด์ ํธ๋ฅผ ๋ง๋๋ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
5. 5. AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security
arXiv: 2601.18491 | โฌ๏ธ 120 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
ai-agentsafetyguardrailllmsecuritytrajectory-analysisatbenchdiagnostic-framework
์ด ๋ ผ๋ฌธ์ AI ์์ด์ ํธ์ ๋จ์ํ ์ถ๋ ฅ ํํฐ๋ง์ ๋์ด, ์ ์ฒด ์คํ ๊ณผ์ (๊ถค์ )์ ์ธ๋ฐํ๊ฒ ์ง๋จํ๊ณ โ์ด๋์, ์ด๋ป๊ฒ, ๋ฌด์์ดโ ๋ฌธ์ ์ธ์ง 3์ฐจ์์ ์ผ๋ก ๋ถ๋ฅํ ์ ์๋ ์ต์ด์ ์ง๋จ์ ๊ฐ๋๋ ์ผ ํ๋ ์์ํฌ(AgentDoG)์ ๋ฒค์น๋งํฌ(ATBench)๋ฅผ ์ ์ํ๋ค๋ ์ ์์ ๋งค์ฐ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ ์์ฑ์ผ: 2026-02-02 | ๐ค GLM-4.7 Weekly Digest