Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward


Information

일자 2026년 05월 11일
발표자 김영돈

Video


Overview

이 발표는 대형 언어 모델(LLM)이 모든 기능을 내부에 포함하는 기존 구조에서 벗어나, 필요한 절차와 전문 지식을 동적으로 불러와 사용하는 ‘스킬 기반 에이전트(Skill-based Agent)’ 패러다임과 그 핵심 구조 및 향후 과제를 체계적으로 소개합니다.

스킬(Skill)의 핵심 개념 및 구조

  • 스킬의 정의: 특정 도구의 사용 순서, 지침, 리소스를 하나의 단위로 묶은 재사용 가능한 문제 해결 절차 패키지
  • 툴(Tool)과의 차이점: 단순한 단일 기능(검색 등)을 뜻하는 툴과 달리, 워크플로우와 로직을 포함한 실행 전략
  • 온디맨드(On-demand) 로드: 필요한 순간에만 스킬을 로드하여 대규모 스킬 환경에서도 컨텍스트 부담 최소화
  • 기존 에이전트의 한계 극복: 모든 도구 설명을 프롬프트에 포함하여 발생하는 토큰 낭비 및 성능 저하(Context Wall) 문제 해결

프로그레시브 디스클로저(Progressive Disclosure) 아키텍처

  • L1 메타데이터: 스킬 검색과 라우팅을 위해 시스템 프롬프트에 상시 유지되는 최소 정보(이름, 요약)
  • L2 지침(Instructions): 스킬 선택 시에만 동적으로 로드되는 구체적인 워크플로우 및 사용 매뉴얼
  • L3 리소스(Resources): 실행 시점에만 참조되는 실제 코드, 문서, 데이터셋 등의 실행 자원
  • 아키텍처 의의: 필요한 정보만 단계적으로 노출하여 LLM의 연산 효율성과 확장성 동시 확보

스킬 생태계 및 보안(Security) 문제

  • 스킬 획득 방법: 도메인 전문가의 직접 작성(가장 보편적), 강화학습 기반 생성, 자유 탐색 기반 습득
  • 보안 취약점 대두: 커뮤니티 공유 스킬 중 약 26.1%에서 민감 정보 탈취(Data Theft) 및 에이전트 하이재킹 위험 발견
  • 보안 대응 전략: 단계별 검증 게이트 및 신뢰 계층 구조를 통한 제한적 권한 부여 인프라 필수

하네스(Harness) 인프라 및 도메인 활용

  • 하네스의 중요성: 에이전트 성능은 모델 크기보다 메모리, 스킬, 연결 프로토콜을 조율하는 전체 실행 구조에 의해 결정
  • MCP와의 상호 보완: 스킬이 구체적인 작업 절차와 논리를 정의한다면, MCP는 외부 시스템과의 표준 연결 인터페이스 기능 수행
  • 의료 도메인 적용 예시: 병원마다 다른 PSG(수면다원검사) 채널 및 샘플링 전처리 과정을 표준화된 스킬로 패키징하여 연구 일관성 제고

향후 주요 과제 (Open Challenges)

  • 검증 및 테스트 표준화: 스킬이 보안 위협 없이 의도한 동작만을 정확히 수행하는지 확인하는 체계 구축
  • 연속 학습(Continual Learning) 안정성: 모델 및 생태계 업데이트 이후에도 기존 스킬의 동작 무결성 유지
  • 다각적 평가 지표 도입: 단순 작업 성공률을 넘어 스킬의 재사용성, 조합성, 유지보수성을 포괄하는 성능 평가 루프 마련

첨부 파일