SoftSkill：32개 토큰으로 스킬 압축, LiveMath +42.1점

SoftSkill은 arXiv:2606.20333 논문에 기술된 방법으로, 스킬 문서(Markdown SKILL.md 파일 등)를 기초 모델을 변경하지 않고 모델 행동을 안내하는 소형 연속 잠재 객체로 변환합니다. 32개의 가상 토큰을 사용하여 LiveMath 작업에서 스킬 없는 프롬프팅 대비 42.1 퍼센트 포인트 향상을 달성합니다.

논문 arXiv:2606.20333은 스킬 문서를 소형 잠재 제어 객체로 변환하는 방법인 SoftSkill을 제안합니다. 스킬 문서는 모델에게 특정 작업을 수행하는 방법을 설명하는 텍스트 지시사항으로, 예를 들어 Markdown 파일 SKILL.md와 같은 것입니다. 이러한 지시사항은 수백 또는 수천 개의 컨텍스트 토큰을 차지하여 창을 소비하고 실행을 느리게 합니다.

행동 압축의 작동 방식

SoftSkill은 행동 압축을 적용합니다——자연어 지시사항을 32개의 가상(잠재) 토큰으로 압축하여 모델 행동을 안내하되, 기초 모델의 가중치는 변경하지 않습니다. 모델 자체를 조정하는 파인튜닝과 달리, SoftSkill은 추가된 제어 토큰만을 통해 작동하므로 재학습 없이 스킬을 필요에 따라 켜고 끌 수 있습니다.

수치로 본 결과

LiveMath 작업에서 SoftSkill은 스킬 없는 방식 대비 +42.1 퍼센트 포인트, 경쟁 방법 대비 +12.5점 향상을 달성했습니다. SearchQA에서는 기준선 프롬프팅 대비 +8.3점, SkillOpt 방법 대비 +5.2점 앞섰습니다. 비교 결과는 압축된 잠재 표현이 토큰을 절약할 뿐만 아니라 정확도에서도 원본 텍스트 지시사항을 능가함을 보여줍니다.

무엇이 달라지는가

토큰이 적다는 것은 비용 절감과 더 빠른 실행을 의미하며, 특히 여러 스킬을 동시에 다루는 에이전트에게 중요합니다. 기초 모델이 변경되지 않으므로 SoftSkill은 기존 모델과 호환되며 능력을 모듈식으로 추가하는 실용적인 방법을 제공합니다. 이 접근 방식은 긴 시스템 지시사항을 컴팩트하게 학습된 제어 신호로 대체하는 더 넓은 추세에 부합합니다.

자주 묻는 질문

SoftSkill은 무엇을 합니까?

SoftSkill은 스킬 문서를 32개의 연속 잠재 토큰으로 변환하여 모델 가중치를 변경하지 않고 모델 행동을 안내합니다.

성능 향상은 얼마나 됩니까?

LiveMath 작업에서 스킬 없는 방식 대비 +42.1 퍼센트 포인트, 경쟁 방법 대비 +12.5점 향상. SearchQA에서는 기준선 프롬프팅 대비 +8.3점 향상.

기초 모델이 수정됩니까?

아니요, 기초 모델은 변경되지 않습니다. SoftSkill은 잠재 제어 토큰만을 통해 작동합니다.

arXiv:2606.20333：SoftSkill이 스킬 문서를 32개 잠재 토큰으로 압축, LiveMath 42.1점 향상

행동 압축의 작동 방식

수치로 본 결과

무엇이 달라지는가

자주 묻는 질문

출처

관련 뉴스