๐ Weekly AI Paper Digest
๊ธฐ๊ฐ: 2026-03-02 ~ 2026-03-07 ์ ์ : ์ด๋ฒ ์ฃผ ๊ฐ์ฅ ์ฃผ๋ชฉ๋ฐ์ ๋ ผ๋ฌธ Top 5
๐ ์ด๋ฒ ์ฃผ Top 5
| ์์ | ๋ ผ๋ฌธ | โฌ๏ธ | Deep Dive |
|---|---|---|---|
| ๐ฅ | Utonia: Toward One Encoder for All Pointโฆ | 142 | DD-036 |
| ๐ฅ | Heterogeneous Agent Collaborative Reinfoโฆ | 140 | DD-037 |
| ๐ฅ | OmniLottie: Generating Vector Animationsโฆ | 134 | DD-038 |
| 4. | Helios: Real Real-Time Long Video Generaโฆ | 133 | DD-039 |
| 5. | From Scale to Speed: Adaptive Test-Time โฆ | 130 | DD-040 |
๐ ์ด๋ฒ ์ฃผ ํธ๋ ๋
ํต์ฌ ํค์๋
- ๋ฒ์ฉ 3D ํ์ (Universal 3D Representation): ์๋ก ๋ค๋ฅธ ๋๋ฉ์ธ(์๊ฒฉ ํ์ฌ, ์ค๋ด/์ธ ๋ฑ)์ ํฌ์ธํธ ํด๋ผ์ฐ๋๋ฅผ ์์ฐ๋ฅด๋ ๋จ์ผ ์ธ์ฝ๋ ํ์ต ์ถ๊ตฌ.
- ์ค์๊ฐ ์์ฑ ํจ์จํ (Real-time Generation Efficiency): ๋๊ท๋ชจ ๋น๋์ค ์์ฑ ๋ชจ๋ธ์ ์ค์๊ฐ ๊ตฌํ ๋ฐ ์ถ๋ก ์๋ ์ต์ ํ ๊ธฐ์ .
- ํ ์คํธ ํ์ ํ์ฅ (Test-Time Scaling): ์ถ๋ก ์๊ฐ์ ํ์ฉํด ์ด๋ฏธ์ง ํธ์ง ํ์ง์ ๋์ด๋ ์ฒด์ธ์ค๋ธ์ํธ(Image-CoT) ๊ธฐ๋ฒ์ ์ ์ฉ.
- ๋ฒกํฐ ์ ๋๋ฉ์ด์ ์์ฑ (Vector Animation): ๊ฐ๋ณ๊ณ ์ ์ด๊ฐ ์ฉ์ดํ Lottie ํ์์ ์ด์ฉํ ๊ณ ํ์ง ์ ๋๋ฉ์ด์ ์์ฑ.
- ํ๋ ฅํ ๊ฐํ ํ์ต (Collaborative RL): ์ด์ง์ ์ธ ์์ด์ ํธ๋ค์ด ํ์ต ๋ฐ์ดํฐ๋ฅผ ๊ณต์ ํ์ฌ ํจ์จ์ ๋์ด๋ ์๋ก์ด ํจ๋ฌ๋ค์.
๊ณตํต ์ฃผ์
์ด๋ฒ ์ฃผ ๋ ผ๋ฌธ๋ค์ ๋๊ท๋ชจ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ์งํ๋ฉด์๋ **ํจ์จ์ฑ(์๋, ์์)**๊ณผ **๋ฒ์ฉ์ฑ(Universality)**์ ๊ทน๋ํํ๋ ๋ฐฉํฅ์ผ๋ก ์ฐ๊ตฌ๊ฐ ์ง์ค๋๊ณ ์์์ ๋ณด์ฌ์ค๋๋ค. ํนํ ๋น๋์ค, ์ด๋ฏธ์ง, 3D ๋ฐ์ดํฐ ๋ฑ ๋ค์ํ ๋ฏธ๋์ด ์์ฑ ๋ฐ ํธ์ง ์์ ์์ ๋จ์ผ ๋ชจ๋ธ๋ก ์ฌ๋ฌ ๋๋ฉ์ธ์ ์ฒ๋ฆฌํ๊ฑฐ๋, ์ถ๋ก ๊ณผ์ ์ ์ต์ ํํ์ฌ ์ค์๊ฐ ์ฑ๋ฅ์ ๋ด๋ ๊ธฐ์ ์ ๋ํ๊ตฌ๊ฐ ์ฃผ๋ฅผ ์ด๋ฃน๋๋ค.
์ฃผ๋ชฉํ ์
Utonia๋ ์์ GPT๊ฐ ํ ์คํธ์์ ํ๋ ๊ฒ์ฒ๋ผ, 3D ํฌ์ธํธ ํด๋ผ์ฐ๋ ์์ญ์์๋ ํ๋์ ์ธ์ฝ๋๋ก ๋ชจ๋ ๋๋ฉ์ธ์ ํตํฉํ๋ ค๋ ์ผ์ฌ ์ฐฌ ์๋๋ฅผ ๋ณด์ฌ์ค๋๋ค. Helios๋ 140์ต ํ๋ผ๋ฏธํฐ์ ๊ฑฐ๋ ๋น๋์ค ๋ชจ๋ธ์ ๋จ์ผ H100 GPU์์ ์ด๋น 19.5ํ๋ ์์ผ๋ก ์ค์๊ฐ ์์ฑํ๋ ์์ง๋์ด๋ง์ ์ฑ์ทจ๋ฅผ ํตํด, ์์ฑ ๋ชจ๋ธ์ ์ค์ฉํ ๊ฐ๋ฅ์ฑ์ ํฌ๊ฒ ๋์์ต๋๋ค. ๋ํ, From Scale to Speed๋ ๋จ์ ์์ฑ์ ๋์ด โ์ด๋ฏธ์ง ํธ์งโ์ด๋ผ๋ ๋ชฉ์ ์งํฅ์ ์์ ์ ์ถ๋ก ์๊ฐ ํ์ฅ ๊ธฐ๋ฒ์ ์ ๋ชฉํ์ฌ ์ ํ๋์ ํจ์จ์ฑ์ ๋์์ ์ก์ผ๋ ค๋ ์๋๊ฐ ํฅ๋ฏธ๋กญ์ต๋๋ค.
์ค๋ฌด ์์ฌ์
๊ฐ๋ฐ์์ ์ฐ๊ตฌ์๋ ๋จ์ํ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ๊ท๋ชจ๋ฅผ ํค์ฐ๋ ๊ฒ๋ณด๋ค๋ **์ถ๋ก ์๋๋ฅผ ํ๊ธฐ์ ์ผ๋ก ๋์ด๋ ๊ธฐ์ (์: Helios์ ์ต์ ํ, Image-CoT)**์ ์ฃผ๋ชฉํด์ผ ํฉ๋๋ค. 3D ๋ฐ ์ ๋๋ฉ์ด์ ๋ถ์ผ์์๋ ๋ฐ์ดํฐ ์ข ๋ฅ์ ๊ตฌ์ ๋ฐ์ง ์๋ **๋ฒ์ฉ ๋ชจ๋ธ(์: Utonia)**์ ์ ์ฉํ์ฌ ๋ผ๋ฒจ๋ง ๋น์ฉ์ ์ ๊ฐํ๊ณ ๋ค์ํ ๋๋ฉ์ธ์ ๋์ํ ์ ์๋ ์ ๋ต์ ์๋ฆฝํด์ผ ํฉ๋๋ค. ๋ํ ๋ฒกํฐ ๊ธฐ๋ฐ์ ์ ๋๋ฉ์ด์ ์์ฑ๊ณผ ๊ฐ์ด ์น ๋ฐ ๋ชจ๋ฐ์ผ ํ๊ฒฝ์์ ๋ฐ๋ก ํ์ฉ ๊ฐ๋ฅํ ํฌ๋งท์ ์์ฑ ๋ชจ๋ธ ์์๊ฐ ์ฆ๊ฐํ๊ณ ์์์ ์ธ์งํด์ผ ํฉ๋๋ค.
๐ ๋ ผ๋ฌธ๋ณ ์์ฝ
๐ฅ 1. Utonia: Toward One Encoder for All Point Clouds
arXiv: 2603.03283 | โฌ๏ธ 142 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
point-cloud3d-visionself-supervised-learningtransformerunified-modelmultimodalptv3
์ค๋ด, ์ผ์ธ, ํญ๊ณต, CAD ๋ฑ ์๋ก ๋ค๋ฅธ ๋๋ฉ์ธ์ ์ ๊ตฌ๋ฆ ๋ฐ์ดํฐ๋ฅผ ํ๋์ ํตํฉ ๋ชจ๋ธ๋ก ํ์ต์์ผ, ๋๋ฉ์ธ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ๊ณ ๋ฒ์ฉ์ ์ผ๋ก ํ์ฉ ๊ฐ๋ฅํ 3D ์ธ์ ํ์ค์ ์ ์ํ ์ฐ๊ตฌ์ ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ฅ 2. Heterogeneous Agent Collaborative Reinforcement Learning
arXiv: 2603.02604 | โฌ๏ธ 140 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
reinforcement-learningmulti-agent-systemllmcollaborative-learningoptimizationrlhfmarl
์๋ก ๋ค๋ฅธ ์ฑ๋ฅ๊ณผ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง ์์ด์ ํธ๋ค์ด ํ์ต ๋จ๊ณ์์ ๊ฒ์ฆ๋ ๋กค์์(์๋ฎฌ๋ ์ด์ ๊ฒฝํ)์ ๊ณต์ ํ์ฌ ์ํธ ๋ณด์์ ์ผ๋ก ํ์ตํจ์ผ๋ก์จ, ์ถ๋ก ์๊ฐ์๋ ๋ ๋ฆฝ์ ์ผ๋ก ์๋ํ๋ฉด์๋ ํจ์จ์ฑ์ ๊ทน๋ํํ๋ ์๋ก์ด ํ์ ๊ฐํ ํ์ต ํจ๋ฌ๋ค์์ ์ ์ํ๊ธฐ ๋๋ฌธ์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ฅ 3. OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens
arXiv: 2603.02138 | โฌ๏ธ 134 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
ai-paperml
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
4. 4. Helios: Real Real-Time Long Video Generation Model
arXiv: 2603.04379 | โฌ๏ธ 133 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
video-generationreal-timelong-videoefficiencytransformermultimodalheliosai-research
๋จ์ผ GPU์์ ์ค์๊ฐ์ผ๋ก ๋ถ ๋จ์ ๊ธด ์์์ ์์ฑํ๋ฉด์๋ ํ๋ฉด์ ์ผ๊ด์ฑ์ ์ ์งํ๋ ์ต์ด์ 140์ต ํ๋ผ๋ฏธํฐ ๋ชจ๋ธ์ ์ ์ํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
5. 5. From Scale to Speed: Adaptive Test-Time Scaling for Image Editing
arXiv: 2603.00141 | โฌ๏ธ 130 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
image-editingtest-time-scalingdiffusion-modelefficiencyadaptive-computationcot-chain-of-thoughtai-research
์ด๋ฏธ์ง ํธ์ง ์์ ์ ๋์ด๋์ ๋ฐ๋ผ ์ถ๋ก ์์์ ๋์ ์ผ๋ก ํ ๋นํ์ฌ ๊ณ์ฐ ํจ์จ์ฑ์ 2๋ฐฐ ์ด์ ๋์ด๋ฉด์๋ ํธ์ง ํ์ง์ ์ ์งํ๋ ์๋ก์ด ํ ์คํธ ์๊ฐ ํ์ฅ(Test-Time Scaling) ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ ์์ฑ์ผ: 2026-03-08 | ๐ค GLM-4.7 Weekly Digest