📚 Weekly AI Paper Digest

기간: 2026-01-26 ~ 2026-01-31 선정: 이번 주 가장 주목받은 논문 Top 5

🏆 이번 주 Top 5

순위	논문	⬆️	Deep Dive
🥇	Can LLMs Clean Up Your Mess? A Survey of…	181	DD-001
🥈	LongCat-Flash-Thinking-2601 Technical Re…	171	DD-002
🥉	Idea2Story: An Automated Pipeline for Tr…	149	DD-003
4.	daVinci-Dev: Agent-native Mid-training f…	123	DD-004
5.	AgentDoG: A Diagnostic Guardrail Framewo…	120	DD-005

📑 논문별 요약

🥇 1. Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs

arXiv: 2601.17058 | ⬆️ 181 → Deep Dive 보기 태그: llm data-preparation data-cleaning data-integration survey prompt-engineering entity-matching data-centric-ai

이 논문은 수백 개의 연구를 종합하여, 거대 언어 모델(LLM)을 활용해 전통적으로 수작업에 의존했던 복잡하고 비싼 데이터 준비 과정을 어떻게 자동화하고 혁신할 수 있는지 체계적으로 정리했기 때문에 매우 중요합니다.

📖 상세 분석: → Deep Dive 보기에서 심층 분석을 확인하세요.

🥈 2. LongCat-Flash-Thinking-2601 Technical Report

arXiv: 2601.16725 | ⬆️ 171 → Deep Dive 보기 태그: longcat-flash-thinking mixture-of-experts agentic-ai reinforcement-learning heavy-thinking test-time-scaling llm-reasoning

5,600억 파라미터의 MoE(Mixture-of-Experts) 구조를 활용하여, 도구 사용 및 외부 환경과의 상호작용이 필요한 복잡한 실제 문제를 해결할 수 있는 최고 수준(SOTA)의 에이전트 추론 능력을 구현하고, 이를 ‘Heavy Thinking’이라는 추론 시간 계산 확장 기법으로 극대화했다는 점에서 중요합니다.

📖 상세 분석: → Deep Dive 보기에서 심층 분석을 확인하세요.

🥉 3. Idea2Story: An Automated Pipeline for Transforming Research Concepts into Complete Scientific Narratives

arXiv: 2601.20833 | ⬆️ 149 → Deep Dive 보기 태그: autonomous-science llm-agents knowledge-graph research-automation offline-computation scientific-discovery idea-generation

이 논문은 연구 자동화 시스템이 기존의 느리고 비효율적인 ‘실시간 온라인 추론’ 방식에서 벗어나, 사전에 구축한 지식 그래프(Knowledge Graph)를 활용해 비용과 할루시네이션(Hallucination)을 줄이고 모호한 아이디어를 완벽한 과학적 서사로 변환하는 획기적인 파이프라인 Idea2Story를 제안했기 때문에 중요합니다.

📖 상세 분석: → Deep Dive 보기에서 심층 분석을 확인하세요.

4. 4. daVinci-Dev: Agent-native Mid-training for Software Engineering

arXiv: 2601.18418 | ⬆️ 123 → Deep Dive 보기 태그: ai-agent llm software-engineering mid-training fine-tuning code-generation scalability mlops

이 논문은 기존의 비싼 후처리(post-training) 방식을 넘어, LLM의 훈련 중간(mid-training) 단계부터 에이전트처럼 행동하는 기반 능력을 대규모 데이터로 학습시켜 더 확장 가능하고 강력한 소프트웨어 엔지니어링 에이전트를 만드는 새로운 패러다임을 제시했기 때문입니다.

📖 상세 분석: → Deep Dive 보기에서 심층 분석을 확인하세요.

5. 5. AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

arXiv: 2601.18491 | ⬆️ 120 → Deep Dive 보기 태그: ai-agent safety guardrail llm security trajectory-analysis atbench diagnostic-framework

이 논문은 AI 에이전트의 단순한 출력 필터링을 넘어, 전체 실행 과정(궤적)을 세밀하게 진단하고 ‘어디서, 어떻게, 무엇이’ 문제인지 3차원적으로 분류할 수 있는 최초의 진단적 가드레일 프레임워크(AgentDoG)와 벤치마크(ATBench)를 제안했다는 점에서 매우 중요합니다.

📖 상세 분석: → Deep Dive 보기에서 심층 분석을 확인하세요.

📅 생성일: 2026-02-02 | 🤖 GLM-4.7 Weekly Digest