← πŸ“š 이번 μ£Ό Weekly Digest둜 λŒμ•„κ°€κΈ°

DD-018 Kimi K2.5: Visual Agentic Intelligence

arXiv: 2602.02276 κΈ°κ΄€: Moonshot AI Upvotes: 206 | Comments: 3 μˆœμœ„: 이번 μ£Ό Top 3

Figure 1


λ…Όλ¬Έ 리뷰: Kimi K2.5 (Visual Agentic Intelligence)

μš”μ•½: Kimi K2.5λŠ” β€˜ν…μŠ€νŠΈβ€™μ™€ β€˜λΉ„μ „(μ‹œκ°)’ λŠ₯λ ₯을 ν•˜λ‚˜λ‘œ ν†΅ν•©ν•˜μ—¬ μ„œλ‘œλ₯Ό λ°œμ „μ‹œν‚¨ λ©€ν‹°λͺ¨λ‹¬ μ—μ΄μ „νŠΈ λͺ¨λΈμž…λ‹ˆλ‹€. 여기에 **Agent Swarm(μ—μ΄μ „νŠΈ κ΅°μ§‘)**μ΄λΌλŠ” κΈ°μˆ μ„ λ„μž…ν•˜μ—¬, λ³΅μž‘ν•œ μž‘μ—…μ„ μ—¬λŸ¬ 개의 μž‘μ€ μ—μ΄μ „νŠΈμ—κ²Œ λ‚˜λˆ„μ–΄ λ³‘λ ¬λ‘œ μ²˜λ¦¬ν•¨μœΌλ‘œμ¨ 속도와 μ„±λŠ₯을 λ™μ‹œμ— 획기적으둜 κ°œμ„ ν–ˆμŠ΅λ‹ˆλ‹€.


1. μ™œ 이 논문이 μ€‘μš”ν•œκ°€?

기쑴의 λ©€ν‹°λͺ¨λ‹¬ λͺ¨λΈλ“€μ€ ν…μŠ€νŠΈλ₯Ό λ¨Όμ € ν•™μŠ΅ν•˜κ³  λΉ„μ „ κΈ°λŠ₯을 λ‚˜μ€‘μ— β€˜λΆ™μ΄λŠ”β€™ 방식을 주둜 μ‚¬μš©ν•˜μ—¬, 두 λŠ₯λ ₯이 μΆ©λŒν•˜κ±°λ‚˜ μ„œλ‘œλ₯Ό 돕지 λͺ»ν•˜λŠ” ν•œκ³„κ°€ μžˆμ—ˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, λ³΅μž‘ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•  λ•Œ ν•˜λ‚˜μ˜ μ—μ΄μ „νŠΈκ°€ μˆœμ„œλŒ€λ‘œ(직렬) μ²˜λ¦¬ν•˜λ‹€ λ³΄λ‹ˆ 속도가 느리고 ν•œκ³„μ— λΆ€λ”ͺν˜”μŠ΅λ‹ˆλ‹€.

이 논문은 ν…μŠ€νŠΈμ™€ 비전을 μ²˜μŒλΆ€ν„° ν•¨κ»˜(Joint Optimization) ν•™μŠ΅μ‹œμΌœ μƒν˜Έ λ³΄μ™„μ μœΌλ‘œ λ°œμ „ν•˜κ²Œ λ§Œλ“€μ—ˆκ³ , Agent Swarm κΈ°μˆ μ„ 톡해 μ—¬λŸ¬ μ—μ΄μ „νŠΈκ°€ 일을 λ™μ‹œμ—(병렬) μ²˜λ¦¬ν•˜μ—¬ μ΅œλŒ€ 4.5λ°° λΉ λ₯Έ μ†λ„λ‘œ SOTA(State-of-the-art) μ„±λŠ₯을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.


2. 핡심 아이디어 μ‰½κ²Œ μ΄ν•΄ν•˜κΈ°

🧠 μΌμƒμƒν™œ λΉ„μœ : β€œν˜Όμž ν•˜λŠ” 천재 vs νŒ€μ›Œν¬κ°€ 쒋은 λ“œλ¦ΌνŒ€β€

  • κΈ°μ‘΄ λͺ¨λΈ (Sequential Agent): 마치 μŠ€μœ„μŠ€ μ•„λ―Έ λ‚˜μ΄ν”„ κ°™μŠ΅λ‹ˆλ‹€. ν˜Όμžμ„œ 자λ₯΄κΈ°, 뜯기, 쑰이기 λ‹€ ν•˜μ§€λ§Œ, λ³΅μž‘ν•œ μ§‘μ§“κΈ°λ₯Ό μ‹œν‚€λ©΄ ν•œ λ²ˆμ— ν•˜λ‚˜μ”© 밖에 λͺ» ν•©λ‹ˆλ‹€. (벽을 μ„Έμš°κ³  β†’ 문을 달고 β†’ 페인트λ₯Ό 칠함) 일이 λŠ¦μ–΄μ§ˆ μˆ˜λ°–μ— μ—†μŠ΅λ‹ˆλ‹€.
  • Kimi K2.5 (Agent Swarm): **건섀 ν˜„μž₯의 총괄 감독관(Orchestrator)**이 μžˆμŠ΅λ‹ˆλ‹€. 감독관은 일을 보자마자 β€œλͺ©μˆ˜λŠ” λ¬Έ 달아!”, β€œμ „κΈ°κ³΅μ€ λ°°μ„ ν•΄!”, β€œλ„μž₯곡은 페인트 μ€€λΉ„ν•΄!”라고 μ™ΈμΉ©λ‹ˆλ‹€. 이듀은 μ„œλ‘œ λ‹€λ₯Έ 일을 ν•˜μ§€λ§Œ λ™μ‹œμ— μ§„ν–‰ν•©λ‹ˆλ‹€. 덕뢄에 집이 훨씬 빨리 μ§€μ–΄μ§‘λ‹ˆλ‹€.

πŸ“ 단계별 λ™μž‘ 원리

  1. ν…μŠ€νŠΈμ™€ λΉ„μ „μ˜ 톡합 (Joint Optimization):

    • 이전 λͺ¨λΈλ“€μ€ 글을 λ‹€ 읽고 λ‚˜μ€‘μ— 그림을 λ³΄μ—¬μ£ΌλŠ” μ‹μ΄μ—ˆμŠ΅λ‹ˆλ‹€. K2.5λŠ” μ•„κΈ°κ°€ 말을 배울 λ•Œ 눈으둜 보고 κ·€λ‘œ λ“£λŠ” κ²ƒμ²˜λŸΌ, ν…μŠ€νŠΈμ™€ 이미지 데이터λ₯Ό μΌμ •ν•œ λΉ„μœ¨λ‘œ μ„žμ–΄μ„œ μ²˜μŒλΆ€ν„° ν•¨κ»˜ ν•™μŠ΅μ‹œμΌ°μŠ΅λ‹ˆλ‹€.
    • MoonViT-3D (λΉ„μ „ 인코더): 이미지와 λΉ„λ””μ˜€λ₯Ό λ³΄λŠ” λˆˆμž…λ‹ˆλ‹€. 특히 λΉ„λ””μ˜€λ₯Ό μ²˜λ¦¬ν•  λ•Œ 4μž₯의 ν”„λ ˆμž„μ„ ν•œκΊΌλ²ˆμ— λ­‰μ³μ„œ 보기 λ•Œλ¬Έμ— κΈ΄ μ˜μƒλ„ 더 적은 μžμ›μœΌλ‘œ 이해할 수 μžˆμŠ΅λ‹ˆλ‹€.
    • Zero-Vision SFT (λ§ˆλ²• 같은 ν›ˆλ ¨λ²•): ν›ˆλ ¨ κ³Όμ •μ—μ„œ λ†€λΌμš΄ λ°œκ²¬μ„ ν–ˆμŠ΅λ‹ˆλ‹€. μ‹œκ°μ μΈ 문제λ₯Ό ν’€κ²Œ ν•  λ•Œ, ꡳ이 이미지λ₯Ό 보여주지 μ•Šκ³  ν…μŠ€νŠΈλ‘œλ§Œ μ„€λͺ…해도 μ‹œκ°μ  μΆ”λ‘  λŠ₯λ ₯이 ν–₯μƒλ˜μ—ˆμŠ΅λ‹ˆλ‹€. 마치 μ•ˆ 보고도 μƒμƒν•΄μ„œ ν‘ΈλŠ” ν›ˆλ ¨μ΄ 머릿속을 더 μ’‹κ²Œ λ§Œλ“œλŠ” 것과 λΉ„μŠ·ν•©λ‹ˆλ‹€.
  2. Agent Swarm (μ—μ΄μ „νŠΈ κ΅°μ§‘) μ‹€ν–‰:

    • 단계 1 (μ—­ν•  λΆ„λ‹΄): λ³΅μž‘ν•œ μ˜λ’°κ°€ λ“€μ–΄μ˜€λ©΄ 메인 μ—μ΄μ „νŠΈ(Orchestrator)λŠ” 이λ₯Ό μ—¬λŸ¬ 개의 μž‘μ€ 일(Sub-tasks)둜 μͺΌκ°­λ‹ˆλ‹€.
    • 단계 2 (병렬 μ‹€ν–‰): μͺΌκ°œμ§„ 일듀은 각각 μ „λ¬Έν™”λœ μ„œλΈŒ μ—μ΄μ „νŠΈλ“€(Frozen Sub-agents)μ—κ²Œ λ™μ‹œμ— λ°°μ •λ©λ‹ˆλ‹€.
    • 단계 3 (ν•™μŠ΅): μ–Έμ œ λ³‘λ ¬λ‘œ μ²˜λ¦¬ν•˜κ³ , μ–Έμ œ μˆœμ„œλŒ€λ‘œ μ²˜λ¦¬ν•΄μ•Ό νš¨μœ¨μ μΈμ§€ κ°•ν™” ν•™μŠ΅(Reinforcement Learning)을 톡해 슀슀둜 ν•™μŠ΅ν•©λ‹ˆλ‹€.

βš™οΈ 핡심 μ•Œκ³ λ¦¬μ¦˜ 및 기술

  • PARL (Parallel Agent Reinforcement Learning): μ—μ΄μ „νŠΈ ꡰ집이 μ–Έμ œ 일을 λ‚˜λˆ μ„œ λ§‘κΈΈμ§€λ₯Ό ν•™μŠ΅ν•˜λŠ” μ•Œκ³ λ¦¬μ¦˜μž…λ‹ˆλ‹€. λ‹¨μˆœνžˆ λ³‘λ ¬λ‘œ μ²˜λ¦¬ν•œλ‹€κ³  무쑰건 쒋은 것이 μ•„λ‹™λ‹ˆλ‹€. μ„œλ‘œ μ˜μ‘΄ε…³η³»κ°€ μžˆλŠ” 일을 μ–΅μ§€λ‘œ λ‚˜λˆ„λ©΄ 엉망이 λ˜λ‹ˆκΉŒ, ν™˜κ²½μœΌλ‘œλΆ€ν„° ν”Όλ“œλ°±μ„ λ°›μ•„ 졜적의 μ „λž΅μ„ μ°Ύμ•„λƒ…λ‹ˆλ‹€.
  • MoE (Mixture of Experts): Kimi K2 기반 λͺ¨λΈμ€ 1μ‘° 개의 νŒŒλΌλ―Έν„°λ₯Ό κ°€μ§€κ³  μžˆμ§€λ§Œ, μ‹€μ œλ‘œ μΆ”λ‘ ν•  λ•ŒλŠ” 그쀑 320μ–΅ 개만 ν™œμ„±ν™”ν•©λ‹ˆλ‹€. ν•„μš”ν•œ μ „λ¬Έκ°€(Expert)만 λΆˆλŸ¬μ˜€λŠ” ꡬ쑰라 νš¨μœ¨μ μž…λ‹ˆλ‹€.

3. μ‹€ν—˜ κ²°κ³Ό 뢄석

이 논문은 Kimi K2.5κ°€ λ‹¨μˆœνžˆ μž˜ν•˜λŠ” 것을 λ„˜μ–΄, **β€œμ–Όλ§ˆλ‚˜ λΉ λ₯΄κ³  νš¨μœ¨μ μΈκ°€β€**에 μ§‘μ€‘ν–ˆμŠ΅λ‹ˆλ‹€.

  • ν…ŒμŠ€νŠΈ 벀치마크: μ½”λ”©, λΉ„μ „, μΆ”λ‘ , 그리고 μ‹€μ œ μ—μ΄μ „νŠΈκ°€ 도ꡬλ₯Ό μ¨μ„œ 문제λ₯Ό ν‘ΈλŠ” μ—μ΄μ „νŠΈ μž‘μ—…(Agentic tasks) λ“± λ‹€μ–‘ν•œ λ„λ©”μΈμ—μ„œ ν‰κ°€ν–ˆμŠ΅λ‹ˆλ‹€.
  • κΈ°μ‘΄ SOTA(State-of-the-art) λŒ€λΉ„ μ„±λŠ₯:
    • 정확도 λ©΄μ—μ„œ GPT-5.2, Claude Opus 4.5 λ“±μ˜ μ–ΈκΈ‰λœ μ΅œμ‹  λͺ¨λΈλ“€κ³Ό λΉ„κ΅ν•˜μ—¬ 경쟁λ ₯ μžˆκ±°λ‚˜ 이λ₯Ό λŠ₯κ°€ν•˜λŠ” μ„±λŠ₯(SOTA)을 κΈ°λ‘ν–ˆμŠ΅λ‹ˆλ‹€.
  • μ£Όλͺ©ν•  λ§Œν•œ μ„±κ³Ό (속도):
    • μ§€μ—° μ‹œκ°„(Latency) μ΅œλŒ€ 4.5λ°° κ°μ†Œ: 단일 μ—μ΄μ „νŠΈκ°€ 순차적으둜 μ²˜λ¦¬ν•˜λŠ” 방식 λŒ€λΉ„, Agent Swarm을 톡해 λ³΅μž‘ν•œ μž‘μ—…μ„ μ²˜λ¦¬ν•˜λŠ” 속도가 μ΅œλŒ€ 4.5λ°° λΉ¨λΌμ‘ŒμŠ΅λ‹ˆλ‹€. μ΄λŠ” μ‹€μ œ μ„œλΉ„μŠ€ ν™˜κ²½μ—μ„œ 맀우 μ€‘μš”ν•œ 체감 속도 ν–₯μƒμž…λ‹ˆλ‹€.
  • Zero-Vision SFT의 효과: ν…μŠ€νŠΈλ§ŒμœΌλ‘œ λ―Έμ„Έ μ‘°μ •(SFT)ν–ˆμŒμ—λ„ λΆˆκ΅¬ν•˜κ³  μ‹œκ°μ  μΆ”λ‘  λŠ₯λ ₯이 μ €ν•˜λ˜μ§€ μ•Šκ³  였히렀 ν–₯μƒλ˜λŠ” κ²°κ³Όλ₯Ό λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€. (μ΄λŠ” μ‹œκ°κ³Ό μ–Έμ–΄κ°€ λ‚΄λΆ€μ μœΌλ‘œ 깊게 μ—°κ²°λ˜μ–΄ μžˆμŒμ„ 증λͺ…)

4. ν•œκ³„μ κ³Ό ν–₯ν›„ 연ꡬ λ°©ν–₯

ν•œκ³„μ 

  • ν¬λ ˆλ”§ ν• λ‹Ή(Credit Assignment)의 λ³΅μž‘μ„±: μ—¬λŸ¬ μ—μ΄μ „νŠΈκ°€ λ™μ‹œμ— 일을 ν–ˆμ„ λ•Œ, μ„±κ³΅ν–ˆλ‹€λ©΄ λˆ„κ΅¬ 덕뢄인지, μ‹€νŒ¨ν–ˆλ‹€λ©΄ λˆ„κ΅¬ 탓인지λ₯Ό λͺ…ν™•νžˆ 가리기 μ–΄λ ΅μŠ΅λ‹ˆλ‹€. λ…Όλ¬Έμ—μ„œλŠ” 이 문제λ₯Ό ν”Όν•˜κΈ° μœ„ν•΄ μ„œλΈŒ μ—μ΄μ „νŠΈλŠ” κ³ μ •(Frozen)μ‹œν‚€κ³  μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°λ§Œ ν•™μŠ΅μ‹œν‚€λŠ” 우회 방식을 μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€.
  • μžμ› μ†Œλͺ¨: 전체 νŒŒλΌλ―Έν„°κ°€ 1μ‘° κ°œμ— λ‹¬ν•˜λŠ” κ±°λŒ€ λͺ¨λΈμ΄λ―€λ‘œ, ν•™μŠ΅κ³Ό 배포에 λ“€μ–΄κ°€λŠ” μ»΄ν“¨νŒ… μžμ›(GPU λ“±)이 μ—„μ²­λ‚©λ‹ˆλ‹€. κ°œμΈμ΄λ‚˜ μ†Œκ·œλͺ¨ μŠ€νƒ€νŠΈμ—…μ΄ λͺ¨λ“  κΈ°λŠ₯을 100% ν™œμš©ν•˜κΈ°λŠ” μ–΄λ €μšΈ 수 μžˆμŠ΅λ‹ˆλ‹€.

ν–₯ν›„ 연ꡬ λ°©ν–₯

  • General Agentic Intelligence (AGI)둜의 ν™•μž₯: 이 논문은 AGI(λ²”μš© 인곡지λŠ₯)λ₯Ό ν–₯ν•œ μ€‘μš”ν•œ 발걸음으둜 κ°„μ£Όλ©λ‹ˆλ‹€. 더 λ³΅μž‘ν•œ ν˜„μ‹€ μ„Έκ³„μ˜ 문제λ₯Ό 자율적으둜 ν•΄κ²°ν•˜λŠ” μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμœΌλ‘œ λ°œμ „μ‹œν‚¬ κ²ƒμž…λ‹ˆλ‹€.
  • End-to-End μ΅œμ ν™”: ν˜„μž¬λŠ” μ„œλΈŒ μ—μ΄μ „νŠΈλ₯Ό κ³ μ •ν•΄λ‘μ—ˆμ§€λ§Œ, ν–₯ν›„μ—λŠ” μ—μ΄μ „νŠΈ κ΅°μ§‘ 전체λ₯Ό ν†΅μ§Έλ‘œ ν•™μŠ΅μ‹œν‚€λŠ” 방법을 연ꡬ할 κ²ƒμž…λ‹ˆλ‹€.

5. 싀무 적용 κ°€λŠ₯μ„±

어디에 λ°”λ‘œ 적용 κ°€λŠ₯ν•œκ°€?

  • κ³ μ„±λŠ₯ μ½”λ”© μ–΄μ‹œμŠ€ν„΄νŠΈ: μ½”λ“œλ₯Ό μ§œλ©΄μ„œ, λ¬Έμ„œλ₯Ό μ°Ύκ³ , ν…ŒμŠ€νŠΈλ₯Ό 돌리고, λ¦¬νŒ©ν† λ§ ν•˜λŠ” 과정을 λ™μ‹œμ— λ³‘λ ¬λ‘œ μˆ˜ν–‰ν•˜μ—¬ 개발 속도λ₯Ό 획기적으둜 높일 수 μžˆμŠ΅λ‹ˆλ‹€.
  • λ³΅μž‘ν•œ 데이터 뢄석 및 μ‹œκ°ν™”: μˆ˜μ‹­ μž₯의 PDF λ³΄κ³ μ„œμ™€ μ—‘μ…€ 차트λ₯Ό λ™μ‹œμ— λΆ„μ„ν•˜μ—¬ 톡합 μΈμ‚¬μ΄νŠΈλ₯Ό μ œκ³΅ν•˜λŠ” λΉ„μ„œ 역할에 μ ν•©ν•©λ‹ˆλ‹€.
  • μ‹€μ‹œκ°„ λΉ„λ””μ˜€ λͺ¨λ‹ˆν„°λ§: κΈ΄ λΉ„λ””μ˜€ μŠ€νŠΈλ¦Όμ„ MoonViT-3Dλ₯Ό 톡해 효율적으둜 μ²˜λ¦¬ν•˜μ—¬, 이상 μ§•ν›„λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ κ°μ§€ν•˜λŠ” λ³΄μ•ˆ μ‹œμŠ€ν…œ 등에 ν™œμš© κ°€λŠ₯ν•©λ‹ˆλ‹€.

ν•„μš”ν•œ λ¦¬μ†ŒμŠ€

  • GPU: μΆ”λ‘ (Inference)을 μœ„ν•΄ MoE ꡬ쑰λ₯Ό μ˜¨μ „νžˆ ν™œμš©ν•˜λ €λ©΄ 고사양 GPU ν΄λŸ¬μŠ€ν„°(예: H100 λ“±)κ°€ ν•„μš”ν•˜λ©°, λ©”λͺ¨λ¦¬ μš©λŸ‰λ„ μƒλ‹Ήνžˆ ν½λ‹ˆλ‹€.
  • 데이터: λ©€ν‹°λͺ¨λ‹¬ ν•™μŠ΅μ΄ λ˜μ–΄ μžˆμœΌλ―€λ‘œ ν…μŠ€νŠΈλΏλ§Œ μ•„λ‹ˆλΌ 이미지/λΉ„λ””μ˜€ μ²˜λ¦¬κ°€ κ°€λŠ₯ν•œ 인프라가 μ€€λΉ„λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.

6. 이 논문을 μ΄ν•΄ν•˜κΈ° μœ„ν•œ 사전 지식

  1. LLM (Large Language Model): λ°©λŒ€ν•œ ν…μŠ€νŠΈ λ°μ΄ν„°λ‘œ ν•™μŠ΅ν•˜μ—¬ μΈκ°„μ²˜λŸΌ 글을 μ΄ν•΄ν•˜κ³  μƒμ„±ν•˜λŠ” κ±°λŒ€μ–Έμ–΄λͺ¨λΈμž…λ‹ˆλ‹€.
  2. Multimodal Model (λ©€ν‹°λͺ¨λ‹¬ λͺ¨λΈ): ν…μŠ€νŠΈλΏλ§Œ μ•„λ‹ˆλΌ 이미지, μ˜€λ””μ˜€, λΉ„λ””μ˜€ λ“± μ—¬λŸ¬ κ°€μ§€ ν˜•νƒœμ˜ 정보λ₯Ό λ™μ‹œμ— μ²˜λ¦¬ν•˜κ³  μ΄ν•΄ν•˜λŠ” AI λͺ¨λΈμž…λ‹ˆλ‹€.
  3. Reinforcement Learning (κ°•ν™” ν•™μŠ΅, RL): μ—μ΄μ „νŠΈκ°€ μ‹œν–‰μ°©μ˜€λ₯Ό 톡해 보상을 μ΅œλŒ€ν™”ν•˜λŠ” 행동을 ν•™μŠ΅ν•˜λŠ” 기계 ν•™μŠ΅μ˜ ν•œ λΆ„μ•Όμž…λ‹ˆλ‹€.
  4. MoE (Mixture of Experts): μ‹ κ²½λ§μ˜ νŠΉμ • λ ˆμ΄μ–΄μ— μ—¬λŸ¬ μ „λ¬Έκ°€(Expert) λͺ¨λΈμ„ 두고, μž…λ ₯에 따라 ν•„μš”ν•œ μ „λ¬Έκ°€λ§Œ μ„ νƒν•˜μ—¬ ν™œμ„±ν™”ν•˜λŠ” κΈ°μˆ μž…λ‹ˆλ‹€.
  5. SFT (Supervised Fine-Tuning): 이미 ν•™μŠ΅λœ λͺ¨λΈμ„ νŠΉμ • 데이터와 정닡을 μ‚¬μš©ν•˜μ—¬ λ―Έμ„Έν•˜κ²Œ μ‘°μ •(Fine-tuning)ν•˜μ—¬ μ„±λŠ₯을 λ†’μ΄λŠ” κ³Όμ •μž…λ‹ˆλ‹€.
  6. Latency (μ§€μ—° μ‹œκ°„): μ‚¬μš©μžκ°€ μš”μ²­μ„ 보낸 μ‹œμ λΆ€ν„° AIκ°€ 응닡을 μ™„λ£Œν•  λ•ŒκΉŒμ§€ κ±Έλ¦¬λŠ” μ‹œκ°„μž…λ‹ˆλ‹€. μ§§μ„μˆ˜λ‘ 체감 속도가 λΉ λ¦…λ‹ˆλ‹€.
  7. In-context Learning / Reasoning Chain: λͺ¨λΈμ΄ μƒˆλ‘œμš΄ μ˜ˆμ‹œλ₯Ό μž…λ ₯으둜 μ£Όμ—ˆμ„ λ•Œ λ§₯락을 νŒŒμ•…ν•΄ 문제λ₯Ό ν•΄κ²°ν•˜κ±°λ‚˜, λ‹¨κ³„λ³„λ‘œ μΆ”λ‘  과정을 거쳐 닡을 λ„μΆœν•˜λŠ” λŠ₯λ ₯μž…λ‹ˆλ‹€.

πŸ“š 이번 μ£Ό κ΄€λ ¨ Deep Dive

μˆœμœ„λ…Όλ¬ΈDeep Dive
πŸ₯‡Green-VLA: Staged Vision-Language-A…DD-017
πŸ₯ˆERNIE 5.0 Technical ReportDD-016
πŸ₯‰Kimi K2.5: Visual Agentic Intelligeβ€¦πŸ“ ν˜„μž¬ λ¬Έμ„œ
4.Vision-DeepResearch: Incentivizing …DD-019
5.PaperBanana: Automating Academic Il…DD-020

πŸ“… 생성일: 2026-02-08 | πŸ€– GLM-4.7 Deep Dive