SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering

2026-06-22 | Views:

일자	2026년 06월 22일
발표자	김영돈

이 발표는 LLM 에이전트가 소프트웨어 엔지니어링 환경과 상호작용할 때 모델의 가중치뿐만 아니라 에이전트-컴퓨터 인터페이스(ACI) 설계가 성능에 결정적인 영향을 미친다는 것을 증명하고, 이를 적용한 SWE-agent 시스템의 구현 및 실험 결과를 제시합니다.

SWE-agent 및 ACI 도입 배경

기존 GUI 및 표준 쉘(Shell) 명령어는 인간을 기준으로 설계되어 LLM 에이전트의 컨텍스트 낭비 및 실행 오류 유발
모델 고정 상태에서도 에이전트와 컴퓨터 간 상호작용 계층인 ACI(Agent-Computer Interface) 설계에 따른 성능 차이 발생
GPT-4 Turbo 기반 SWE-agent는 SWE-bench Lite에서 18% 해결률 달성 (기존 RAG 및 쉘 단독 에이전트 대비 대폭 향상)

ACI 설계 4대 원칙

SWE-agent 핵심 기능 구현

실험 결과 및 실패 요인 분석

의료 AI 및 에이전트 시스템 시사점

임상 에이전트 시스템(EHR, 가이드라인 검색 등) 도입 시 로우 데이터(Raw data) 직접 제공을 지양하고 명확히 구조화된 ACI 설계 필수
단위 오류, 금기 약물, 비정상 수치 범위를 사전에 차단하는 임상 환경 맞춤형 가드레일 및 검증 훅(Hook) 적용 필요
최종 성능 수치뿐만 아니라 도구 호출, 입력 구조화, 오류 로그 등 에이전트 하네스(Harness) 인프라 전반에 대한 평가 요구