SkillOpt – 에이전트 스킬을 “학습 가능한 외부 상태”로 다루는 혁신적 프레임워크

출처: newsletter · 2026. 6. 5.

마이크로소프트가 공개한 SkillOpt는 에이전트가 스킬 문서를 정적인 텍스트가 아닌, 실행 결과와 로그를 기반으로 **add / delete / replace** 방식으로 지속적으로 수정·업데이트하는 시스템이다. 모델 가중치는 고정하고, 검증 세트에서 실제 성능이 개선될 때만 변경을 반영한다. 논문에 따르면 GPT‑5.5에서는 채팅 환경에서 평균 **+23.5점**, Codex 루프에서 **+24.8점**, Claude Code 루프에서 **+19.1점** 향상이 기록되었다. 또한 최적화된 스킬은 다른 모델·환경에도 일정 부분 전이될 수 있다. 쉬운 설명: 에이전트가 “스킬 매뉴얼”을 읽고 쓰는 대신, 실제 행동을 보고 배운 내용을 바로 매뉴얼에 적용한다는 뜻이다. 마치 사람이 실수 후 메모를 적어 두는 것처럼, 에이전트도 자동으로 매뉴얼을 고쳐 나간다. 관련분야: 강화학습, 자동프롬프트 엔지니어링, 에이전트 설계, AI 안전·신뢰성 원문 보기 →