Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward
Information
| 일자 | 2026년 05월 11일 |
|---|---|
| 발표자 | 김영돈 |
Video
Overview
이 발표는 대형 언어 모델(LLM)이 모든 기능을 내부에 포함하는 기존 구조에서 벗어나, 필요한 절차와 전문 지식을 동적으로 불러와 사용하는 ‘스킬 기반 에이전트(Skill-based Agent)’ 패러다임과 그 핵심 구조 및 향후 과제를 체계적으로 소개합니다.
스킬(Skill)의 핵심 개념 및 구조
- 스킬의 정의: 특정 도구의 사용 순서, 지침, 리소스를 하나의 단위로 묶은 재사용 가능한 문제 해결 절차 패키지
- 툴(Tool)과의 차이점: 단순한 단일 기능(검색 등)을 뜻하는 툴과 달리, 워크플로우와 로직을 포함한 실행 전략
- 온디맨드(On-demand) 로드: 필요한 순간에만 스킬을 로드하여 대규모 스킬 환경에서도 컨텍스트 부담 최소화
- 기존 에이전트의 한계 극복: 모든 도구 설명을 프롬프트에 포함하여 발생하는 토큰 낭비 및 성능 저하(Context Wall) 문제 해결
프로그레시브 디스클로저(Progressive Disclosure) 아키텍처
- L1 메타데이터: 스킬 검색과 라우팅을 위해 시스템 프롬프트에 상시 유지되는 최소 정보(이름, 요약)
- L2 지침(Instructions): 스킬 선택 시에만 동적으로 로드되는 구체적인 워크플로우 및 사용 매뉴얼
- L3 리소스(Resources): 실행 시점에만 참조되는 실제 코드, 문서, 데이터셋 등의 실행 자원
- 아키텍처 의의: 필요한 정보만 단계적으로 노출하여 LLM의 연산 효율성과 확장성 동시 확보
스킬 생태계 및 보안(Security) 문제
- 스킬 획득 방법: 도메인 전문가의 직접 작성(가장 보편적), 강화학습 기반 생성, 자유 탐색 기반 습득
- 보안 취약점 대두: 커뮤니티 공유 스킬 중 약 26.1%에서 민감 정보 탈취(Data Theft) 및 에이전트 하이재킹 위험 발견
- 보안 대응 전략: 단계별 검증 게이트 및 신뢰 계층 구조를 통한 제한적 권한 부여 인프라 필수
하네스(Harness) 인프라 및 도메인 활용
- 하네스의 중요성: 에이전트 성능은 모델 크기보다 메모리, 스킬, 연결 프로토콜을 조율하는 전체 실행 구조에 의해 결정
- MCP와의 상호 보완: 스킬이 구체적인 작업 절차와 논리를 정의한다면, MCP는 외부 시스템과의 표준 연결 인터페이스 기능 수행
- 의료 도메인 적용 예시: 병원마다 다른 PSG(수면다원검사) 채널 및 샘플링 전처리 과정을 표준화된 스킬로 패키징하여 연구 일관성 제고
향후 주요 과제 (Open Challenges)
- 검증 및 테스트 표준화: 스킬이 보안 위협 없이 의도한 동작만을 정확히 수행하는지 확인하는 체계 구축
- 연속 학습(Continual Learning) 안정성: 모델 및 생태계 업데이트 이후에도 기존 스킬의 동작 무결성 유지
- 다각적 평가 지표 도입: 단순 작업 성공률을 넘어 스킬의 재사용성, 조합성, 유지보수성을 포괄하는 성능 평가 루프 마련