โ ๐ ์ด๋ฒ ์ฃผ Weekly Digest๋ก ๋์๊ฐ๊ธฐ
DD-028 GLM-5: from Vibe Coding to Agentic Engineering
arXiv: 2602.15763 Upvotes: 71 | Comments: 3 ์์: ์ด๋ฒ ์ฃผ Top 3

๋ ผ๋ฌธ ๋ฆฌ๋ทฐ: GLM-5 - From Vibe Coding to Agentic Engineering
1. ์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ?
๊ธฐ์กด์ ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ฌ๋์ด ๊ตฌ์ฒด์ ์ธ ์ง์๋ฅผ ๋ด๋ ค์ผ๋ง ์ฝ๋๋ฅผ ์์ฑํ๋ ์๋์ ์ธ โ๋ฐ์ด๋ธ ์ฝ๋ฉ(Vibe Coding)โ ๋ฐฉ์์ ์์กดํ์ผ๋ฉฐ, ๋ณต์กํ ์ค๋ฌด ํ๊ฒฝ์์์ ๋น์ฉ ํจ์จ์ฑ๊ณผ ์์จ์ฑ์ด ๋ถ์กฑํ์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ AI๊ฐ ์ค์ค๋ก ๊ณํ์ ์ธ์ฐ๊ณ ์ฝ๋๋ฅผ ๊ตฌํ ๋ฐ ์์ ํ๋ โ์์ด์ ํธ ์์ง๋์ด๋ง(Agentic Engineering)โ์ผ๋ก์ ํจ๋ฌ๋ค์ ์ ํ์ ์ ์ํ๋ฉฐ, ๋น๋๊ธฐ ๊ฐํ ํ์ต(Asynchronous RL)์ ํตํด ํ์ต ๋ฐ ์ถ๋ก ๋น์ฉ์ ํ๊ธฐ์ ์ผ๋ก ์ ๊ฐํ์ต๋๋ค. GLM-5๋ ๋จ์ํ ๋ฒค์น๋งํฌ ์ ์๋ฅผ ๋์ด, ์ค์ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์ ๋ฌด๋ฅผ ์๋ฒฝํ๊ฒ ์ํํ ์ ์๋ ์์จ์ฑ์ ์ฆ๋ช ํ์ฌ ์คํ ์จ์ดํธ ๋ชจ๋ธ์ ์๋ก์ด ๊ธฐ์ค์ ํ๋ฆฝํ์ต๋๋ค.
2. ํต์ฌ ์์ด๋์ด ์ฝ๊ฒ ์ดํดํ๊ธฐ
์ผ์์ํ ์์ โ์ธํ ๋ฆฌ์ด ๊ณต์ฌโ๋ฅผ ๋น์ ๋ก ๋ค์ด๋ณด๊ฒ ์ต๋๋ค. ๊ธฐ์กด์ AI ๋ชจ๋ธ์ โ์ฌ๊ธฐ ๋ฒฝ์ ๋ชป ์ข ๋ฐ์์คโ๋ผ๊ณ ์ฃผ์ธ์ด ์ผ์ผ์ด ์ง์ํด์ผ๋ง ์์ง์ด๋ ์กฐ์์์ต๋๋ค. ํ์ง๋ง GLM-5๋ โ๊ฑฐ์ค์ ํ๋์ ์ผ๋ก ๋ฐ๊ฟ์คโ๋ผ๋ ๋ชฉํ๋ง ์ฃผ๋ฉด, ์ค์ค๋ก ๋์์ธ์ ๊ณํํ๊ณ , ์์ฌ๋ฅผ ์ฌ๊ณ , ์๊ณตํ๋ฉฐ, ๋ฌธ์ ๊ฐ ์๊ธฐ๋ฉด ์ค์ค๋ก ์์ ํ๋ โ์๊ณต ์ฑ ์์โ์ ๊ฐ์ต๋๋ค.
์ด๋ฌํ ์์จ์ฑ์ ๊ตฌํํ๊ธฐ ์ํด GLM-5๋ ํ์ต ๋ฐฉ์์ ์์ ํ ๋ฐ๊ฟจ์ต๋๋ค. ๊ธฐ์กด์๋ AI๊ฐ ํ ํ๋์ ํ๊ณ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ค๋ฆฌ๋ ๋์ ํ์ต ์ฅ๋น(GPU)๊ฐ ๋๊ฒ ๋๋ ๋๊ธฐ์ ํ์ต์ ์ฌ์ฉํ์ต๋๋ค. ์ด๋ ์๋ฆฌ์ฌ๊ฐ ์๋์ด ์์ฌ๋ฅผ ๋ค ๋ง์น ๋๊น์ง ์ฃผ๋ฐฉ์์ ์๋ฌด๊ฒ๋ ํ์ง ์๊ณ ๊ธฐ๋ค๋ฆฌ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. GLM-5๋ โ๋น๋๊ธฐ ๊ฐํ ํ์ต(Asynchronous RL)โ์ ๋์ ํ์ฌ, AI๊ฐ ์ฌ๋ฌ ์์ ์ ์ํํ๋ ํ๊ฒฝ๊ณผ ํ์ต ๊ณผ์ ์ ๋ถ๋ฆฌํ์ต๋๋ค. ์๋ฆฌ์ฌ๋ ์๋๋ค์ด ์์ฌํ๋ ๋์์๋ ๋ฉ์ถ์ง ์๊ณ ๊ณ์ ์๋ฆฌ๋ฅผ ํ๊ณ , ์๋๋ค์ ํ๊ฐ(ํผ๋๋ฐฑ)๊ฐ ๋ค์ด์ค๋ฉด ๊ทธ๋๋ง๋ค ๋ ์ํผ๋ฅผ ์์ ํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
์ด ๊ณผ์ ์์ GLM-5๋ ํน๋ณํ ๋ชฉ์ ํจ์(Objective Function)๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ์ต์ ํํฉ๋๋ค. ์์์ผ๋ก ๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$L(\theta) = \mathbb{E}{x\sim\mathcal{D}}!\left[\frac{1}{K}\sum{i=1}^{K}\left(r(x,y_{i})-\bar{r}(x)\right)\right]$
์ด ์์์ ๋จ์ํ ์ ์๋ฅผ ๋์ด๋ ๊ฒ๋ฟ๋ง ์๋๋ผ, ์ฌ๋ฌ ์๋(K) ์ค์์ ํ๊ท ์ ์($\bar{r}(x)$)๋ณด๋ค ์ผ๋ง๋ ๋ ์ํ๋์ง๋ฅผ ์ค์ ์ ์ผ๋ก ํ์ตํ๊ฒ ๋ค๋ ์๋ฏธ์ ๋๋ค. ์ฆ, โ๋ณดํต ์์คโ์ ๋ต์๋ณด๋ค ๋ ๋์ ๋ต์์ ๋ด๋์์ ๋๋ง ๊ทธ ํจํด์ ๊ฐํํด์ ํ์ตํ๊ฒ ๋ค๋ ์ ๋ต์ ๋๋ค. ์ด๋ฅผ ํตํด GLM-5๋ ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ํจ์จ์ ์ผ๋ก ๋์ด์ฌ๋ฆฝ๋๋ค.
3. ์คํ ๊ฒฐ๊ณผ ๋ถ์
GLM-5๋ ๋ค์ํ ๋ฒค์น๋งํฌ์์ ์๋์ ์ธ ์ฑ๋ฅ์ ์ ์ฆํ์ต๋๋ค. ํ ์คํธ๋ ๋๊ท๋ชจ ๋ฉํฐ๋ชจ๋ฌ ์ธํ ๋ฆฌ์ ์ค ํ๊ฐ์ธ โ์ธํ ๋ฆฌ์ ์ค ์ธ๋ฑ์ค v4.0(Intelligence Index v4.0)โ์ ํฌํจํ์ฌ, ์ฝ๋ ์์ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ โSWE-bench Verified/Multilingualโ, ํฐ๋ฏธ๋ ํ๊ฒฝ์์์ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ๋ณด๋ โTerminal-Bench 2.0โ, ๊ทธ๋ฆฌ๊ณ ๊ฒ์ ๋ฐ ๋๊ตฌ ์ฌ์ฉ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ โBrowseCompโ์ โMCP-Atlasโ ๋ฑ 8๊ฐ์ ์ฃผ์ ์์ด์ ํธ, ์ถ๋ก , ์ฝ๋ฉ ๊ด๋ จ ๋ฒค์น๋งํฌ์์ ์งํ๋์์ต๋๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก GLM-5๋ ์ด์ ๋ฒ์ ์ธ GLM-4.7 ๋๋น ํ๊ท ์ฝ 20%์ ์ฑ๋ฅ ํฅ์์ ๋ณด์์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก ์ธํ ๋ฆฌ์ ์ค ์ธ๋ฑ์ค ์ ์๋ 42์ ์์ 50์ ์ผ๋ก 8์ ์์นํ์ฌ ์คํ ์จ์ดํธ ๋ชจ๋ธ ์ค ์๋ก์ด 1์๋ฅผ ์ฐจ์งํ์ต๋๋ค. ๋ํ, Claude Opus 4.5 ๋ฐ GPT-5.2์ ์ ์ฌํ ์์ค์ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ Gemini 3 Pro๋ฅผ ๋ฅ๊ฐํ๋ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋กํ์ต๋๋ค.
๋ฌด์๋ณด๋ค ์ฃผ๋ชฉํ ๋งํ ์ฑ๊ณผ๋ ์ ์ ์ธ ๋ฒค์น๋งํฌ๋ฅผ ๋์ด์ ์ค์ ์ฝ๋ฉ ์ ๋ฌด ์ํ ๋ฅ๋ ฅ์ ๋๋ค. GLM-5๋ ์ํํธ์จ์ด ์์ง๋์ด๋ง์ ์ ์ฒด ๊ณผ์ ์ ์์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๋ ๋ฅ๋ ฅ์์ ๊ธฐ์กด ๋ชจ๋ธ๋ค์ ์ํํจ์ผ๋ก์จ, ๋จ์ํ ์ฝ๋๋ฅผ ์์ฑํ๋ ๊ฒ์ ๋์ด ์ค์ ์์ง๋์ด ์ญํ ์ ์ํํ ์ ์์์ ์ ์ฆํ์ต๋๋ค.
4. ํ๊ณ์ ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
์ ์๋ค์ GLM-5๊ฐ ์คํ ์์ค ์ปค๋ฎค๋ํฐ์ ํฐ ๊ธฐ์ฌ๋ฅผ ํ์ง๋ง, ์์ง์ ์ ์ ๋ฒค์น๋งํฌ๋ฅผ ๋์ด์ ๋ณต์กํ ์ค์ ์ํฌํ๋ก์ฐ์์์ ์๋ฒฝ์ฑ์ ์ ์ฆํ๋ ๊ฒ์ด ์์ ๋จ๊ณ์ ๋ถ๊ณผํ๋ค๊ณ ์ธ๊ธํ์ต๋๋ค. ์ฆ, GLM-5๊ฐ ๋ณด์ฌ์ค โ์์ด์ ํธ ์์ง๋์ด๋งโ์ ํจ์จ์ฑ์ ๋ ๋ค์ํ ๋ถ์ผ๋ก ํ์ฅํ๊ณ , ๋ ๊ธด ํธ๋ผ์ด์ฆ(Long-horizon)์ ์์ ์์์ ์์ ์ฑ์ ๋์ด๋ ๊ฒ์ด ํฅํ ๊ณผ์ ์ ๋๋ค.
๋ํ, ๋น๋๊ธฐ ๊ฐํ ํ์ต(Asynchronous RL) ์ธํ๋ผ์ ๊ตฌ์ถ์ด ํ์์ ์ด๋ฏ๋ก, ๊ฐ๋ฐ ํ๊ฒฝ์ ์ธํ ํ๋ ๋ฐ ์์ด ์๋นํ ๊ธฐ์ ์ ๋์ด๋์ ๋ฆฌ์์ค๊ฐ ํ์ํ ์ ์์ต๋๋ค. ํฅํ ์ฐ๊ตฌ์์๋ ์ด๋ฌํ ๋ณต์กํ ํ์ต ํ์ดํ๋ผ์ธ์ ๋ ๊ฒฝ๋ํํ๊ณ , ์ค์ ์ฐ์ ํ์ฅ์์ ๋ฐ์ํ๋ ์๊ธฐ์น ๋ชปํ ์์ง ์ผ์ด์ค(Edge Case)๋ค์ ์ด๋ป๊ฒ ์ฒ๋ฆฌํ ์ง์ ๋ํ ์ฐ๊ตฌ๊ฐ ์ด์ด์ง ๊ฒ์ ๋๋ค.
5. ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ
GLM-5๋ ์ํํธ์จ์ด ๊ฐ๋ฐ ๋ถ์ผ์ ์ฆ์ ์ ์ฉํ ์ ์์ต๋๋ค. ๋จ์ํ ์ฝ๋ ์๋ ์์ฑ์ ๋์ด, ๊ฐ๋ฐ์๊ฐ ์๊ตฌํ ๊ธฐ๋ฅ์ ์ค์ค๋ก ์ดํดํ๊ณ ๊ณํํ๋ฉฐ, ๊ด๋ จ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ฒ์ํ๊ณ ์ฝ๋๋ฅผ ์์ฑํ ๋ค ํ ์คํธ๊น์ง ์ํํ๋ ์๋ํ๋ ์ฝ๋ฉ ์์ด์ ํธ๋ก ํ์ฉํ ์ ์์ต๋๋ค. ๋ํ ๋ณต์กํ ๋ฐ์ดํฐ ๋ถ์์ด๋ ๋ฆฌ์์น ์ ๋ฌด ๋ฑ์์๋ ๊ธด ๋ฌธ๋งฅ์ ์ดํดํ๊ณ ์ฌ๋ฌ ๋๊ตฌ๋ฅผ ๋น๋๊ธฐ์ ์ผ๋ก ํธ์ถํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ์ธํ ๋ฆฌ์ ํธ ์์ด์ ํธ๋ก ์ฌ์ฉ๋ ๊ฒ์ ๋๋ค.
ํ์ง๋ง ์ด๋ฅผ ์ค๋ฌด์ ๋์ ํ๊ธฐ ์ํด์๋ ๊ณ ์ฌ์ GPU ํด๋ฌ์คํฐ๊ฐ ํ์์ ์ ๋๋ค. ํนํ ๋ ผ๋ฌธ์์ ์ ์ํ ๋น๋๊ธฐ ๊ฐํ ํ์ต ํ๊ฒฝ์ ๊ตฌ์ถํ๋ ค๋ฉด ๋จ์ผ GPU๊ฐ ์๋ ๋๊ท๋ชจ ์ฐ์ฐ ์์์ด ํ์ํฉ๋๋ค. ๋ํ, GLM-5๊ฐ ํ์ต๋ 10,000๊ฐ ์ด์์ ๊ฒ์ฆ ๊ฐ๋ฅํ ์๋๋ฆฌ์ค์ ์ ์ฌํ ํํ์ ์ค๋ฌด ๋ฐ์ดํฐ๋ฅผ ํ๋ณดํ์ฌ ํ์ธ ํ๋ํ๊ฑฐ๋ ํ๊ฒฝ์ ๊ตฌ์ถํด์ผ ์ต์์ ์ฑ๋ฅ์ ๊ธฐ๋ํ ์ ์์ต๋๋ค.
6. ์ด ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํ ์ฌ์ ์ง์
- ๋ฐ์ด๋ธ ์ฝ๋ฉ(Vibe Coding): ์ฌ์ฉ์๊ฐ ๊ตฌ์ฒด์ ์ธ ๋ช ๋ น์ด ๋์ ๋๋์ด๋ ๋๋ต์ ์ธ ์๋๋ฅผ ์ ๋ฌํ๋ฉด AI๊ฐ ์ด๋ฅผ ํด์ํ์ฌ ์ฝ๋๋ฅผ ์์ฑํ๋ ์ต์ ์ฝ๋ฉ ํธ๋ ๋๋ก, GLM-5๋ ์ด๋ฅผ ๋์ด์ ๋จ๊ณ๋ฅผ ์งํฅํฉ๋๋ค.
- ์์ด์ ํธ(Agent): ๋จ์ํ ์ง๋ฌธ์ ๋ตํ๋ ๊ฒ์ ๋์ด, ์ค์ค๋ก ๋ชฉํ๋ฅผ ์ค์ ํ๊ณ ๋๊ตฌ๋ฅผ ์ฌ์ฉํ์ฌ ํ๊ฒฝ๊ณผ ์ํธ์์ฉํ๋ฉฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ์์จ์ ์ธ AI ์์คํ ์ ์๋ฏธํฉ๋๋ค.
- ๊ฐํ ํ์ต(Reinforcement Learning): AI๊ฐ ์ํ์ฐฉ์ค๋ฅผ ํตํด ๋ณด์์ ์ต๋ํํ๋ ๋ฐฉํฅ์ผ๋ก ์ค์ค๋ก ํ์ตํ๋ ๊ธฐ๊ณ ํ์ต์ ํ ๋ฐฉ๋ฒ์ผ๋ก, ์์ด์ ํธ์ ์์จ์ฑ์ ํค์ฐ๋ ๋ฐ ํ์์ ์ ๋๋ค.
- ๋น๋๊ธฐ ํ์ต(Asynchronous Learning): ํ์ต ๊ณผ์ ๊ณผ ๋ฐ์ดํฐ ์์ฑ(ํน์ ํ๊ฒฝ๊ณผ์ ์ํธ์์ฉ) ๊ณผ์ ์ ๋ถ๋ฆฌํ์ฌ ๋์์ ์ํํจ์ผ๋ก์จ, ๋๊ธฐ ์๊ฐ์ ์ค์ด๊ณ ํ์ต ์๋๋ฅผ ๋์ด๋ ํจ์จ์ ์ธ ํ์ต ๋ฐฉ์์ ๋๋ค.
- ๋ชจ๋ธ ์ค๋ธ ์์คํผํธ(Mixture of Experts, MoE): ๊ฑฐ๋ํ ์ ๊ฒฝ๋ง ํ๋๋ฅผ ์ฌ์ฉํ๋ ๋์ ์ฌ๋ฌ ๊ฐ์ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ์ ๋๊ณ ์ํฉ์ ๋ง๋ ๋ชจ๋ธ๋ง ํ์ฑํํ์ฌ ์ฐ์ฐ ํจ์จ์ ๋์ด๋ ์ํคํ ์ฒ์ ๋๋ค.
- ๋กค์์(Rollout): ๊ฐํ ํ์ต์์ ์์ด์ ํธ๊ฐ ํ์ฌ ์ํ์์ ์ ์ฑ ์ ๋ฐ๋ผ ์ผ๋ จ์ ํ๋์ ์ทจํ๊ณ ํ๊ฒฝ์ผ๋ก๋ถํฐ ํผ๋๋ฐฑ์ ๋ฐ๋ ๊ณผ์ ์ ์๋ฏธํฉ๋๋ค.
- SFT(Supervised Fine-Tuning): ์ฌ๋์ด ์์ฑํ ์ ๋ต์ด ํฌํจ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ์ถ๊ฐ๋ก ํ์ต์ํค๋ ์ง๋ ํ์ต ๋ฐฉ์์ผ๋ก, ๋ชจ๋ธ์ ๊ธฐ๋ณธ์ ์ธ ์ญ๋์ ๋ค๋ฌ๋ ๊ณผ์ ์ ๋๋ค.
๐ ์ด๋ฒ ์ฃผ ๊ด๋ จ Deep Dive
| ์์ | ๋ ผ๋ฌธ | Deep Dive |
|---|---|---|
| ๐ฅ | Less is Enough: Synthesizing Diversโฆ | DD-026 |
| ๐ฅ | SQuTR: A Robustness Benchmark for Sโฆ | DD-027 |
| ๐ฅ | GLM-5: from Vibe Coding to Agentic โฆ | ๐ ํ์ฌ ๋ฌธ์ |
| 4. | Experiential Reinforcement Learning | DD-029 |
| 5. | MedXIAOHE: A Comprehensive Recipe fโฆ | DD-030 |
๐ ์์ฑ์ผ: 2026-02-22 | ๐ค GLM-4.7 Deep Dive