앤트로픽, 신형 AI 모델 ‘클로드 오퍼스 4.5’ 출시

조인영 기자 (ciy8100@dailian.co.kr)

입력 2025.11.25 13:47  수정 2025.11.25 13:47

코딩·에이전트·컴퓨터 활용에서 업계 최고 성능

비전·추론·수학 등 전 분야에서 전작 대비 성능 업그레이드

SWE-bench Verified에서 오퍼스 4.5가 주요 AI 모델 대비 가장 높은 정확도를 기록했다.ⓒ앤트로픽

인공지능(AI) 모델 클로드(Claude)를 개발한 미국 AI 연구개발 기업 앤트로픽(Anthropic)은 25일 차세대 AI 모델 ‘클로드 오퍼스 4.5(Claude Opus 4.5)’를 공개했다고 밝혔다.


오퍼스 4.5는 일부 평가 지표보다도 앞서는 성능을 보였다. 에이전트 역량을 측정하는 대표 벤치마크인 ‘타우2 벤치(τ2-bench)’는 실제 환경에서 여러 단계의 상호작용이 필요한 과제를 수행하는 능력을 평가한다.


이 테스트에는 항공사 상담원 역할을 맡아 이코노미 좌석 티켓 소지자의 일정 변경 요청을 거부해야 하는 시나리오가 포함돼 있다. 오퍼스 4.5는 해당 시나리오에서 규정을 벗어나지 않으면서도 문제를 해결할 수 있는 경로를 스스로 찾아냈다. 먼저 객실을 상위 클래스로 업그레이드한 뒤, 상위 클래스 규정에 따라 일정 변경을 진행하는 방식이다.


벤치마크는 이런 접근을 사전에 예측하지 못했다는 이유로 ‘실패’로 판정했다. 그러나 앤트로픽은 내부 테스트와 초기 고객사 평가에서 공통적으로 확인된 특징이라며, 오퍼스 4.5의 한 단계 진화를 보여주는 사례라고 강조한다.


다만 이런 우회적 접근이 항상 긍정적으로만 평가되는 것은 아니다. 상황에 따라서는 의도된 제한이나 규칙을 비켜가는, 이른바 ‘보상 해킹(reward hacking)’으로 해석될 여지도 있다. 앤트로픽은 이러한 비정렬적 행동을 차단하는 것을 핵심 안전성 검증 목표 중 하나로 삼고 있다고 밝혔다.


앤트로픽은 오퍼스 4.5 기술 문서인 시스템 카드를 통해 “오퍼스 4.5는 지금까지 선보인 모델 중 가장 견고하게 정렬된(Aligned) 모델이며, 업계 최고 수준의 안전성을 갖춘 프런티어 모델”이라고 밝혔다.


앤트로픽은 고객들이 클로드를 주요 업무에 활용하고 있는 만큼, 해커나 사이버 범죄자 등 외부의 악의적 공격에도 대응할 수 있는 충분한 학습과 대응 능력이 필수적이라고 설명했다.


오퍼스 4.5는 모델을 속여 유해한 행동을 유도하는 프롬프트 인젝션 공격에 대한 강인성을 크게 높였으며, 업계 프런티어 모델 중에서도 가장 속기 어려운 수준에 도달했다고 밝혔다.


오퍼스 4.5의 역량 및 안전성 평가 결과는 ‘클로드 오퍼스 4.5 시스템 카드(Claude Opus 4.5 System Card)’에서 자세히 확인할 수 있다.


앤트로픽은 클로드 개발자 플랫폼에 새롭게 도입된 기능을 통해 모델 활용 효율이 크게 향상됐다고 설명했다. 오퍼스 4.5는 문제 해결 과정에서 불필요한 탐색이나 중복 추론을 줄이며, 이전 모델 대비 적은 토큰으로 더 나은 결과를 도출하는 것이 특징이다.


이번 업데이트에서는 작업 유형에 따라 개발자가 원하는 균형점을 직접 선택할 수 있도록 ‘에포트(effort)’ 파라미터를 API에 새롭게 도입했다. 이를 통해 처리 속도·비용 최소화 또는 모델 역량 극대화 중 상황에 맞는 최적의 옵션을 선택할 수 있다.


중간 수준의 에포트 설정만으로도 오퍼스 4.5는 ‘SWE-벤치 베리파이드(SWE-bench Verified)’ 벤치마크에서 소네트 4.5와 동일한 최고 성능을 기록하면서, 출력 토큰은 76% 감소했다. 최고 에포트 수준에서는 소네트 4.5 대비 성능이 4.3% 포인트 향상되면서 토큰 사용량은 48% 줄었다.


여기에 에포트 컨트롤(effort control), 컨텍스트 압축(context compaction), 고도화된 도구 활용 기능(advanced tool use)이 결합되며 오퍼스 4.5는 더 오래 실행되고 더 많은 작업을 수행하며, 개발자의 개입을 최소화할 수 있도록 개선됐다.


강화된 컨텍스트 관리(context management) 및 메모리(memory capabilities) 기능을 통해 에이전트 기반 작업 성능이 크게 향상됐으며, 다수의 서브에이전트를 정교하게 조율해 복잡한 멀티에이전트 시스템을 구성하는 데에도 높은 성능을 보였다. 이러한 기술 조합은 심층 연구 평가에서 약 15%포인트의 성능 향상으로 이어졌다.


앤트로픽은 앞으로도 개발자 플랫폼을 더욱 모듈화하고 확장성 있게 발전시켜, 효율성·도구 활용·컨텍스트 관리 등 다양한 요소를 개발자가 직접 조합해 필요한 시스템을 구축할 수 있도록 지원할 계획이라고 밝혔다.


이동재 뤼튼테크놀로지스(Wrtn Technologies) 최고제품책임자(CPO)는 “클로드 오퍼스 4.5는 장문의 스토리텔링에서 탁월한 성능을 보여주며, 10~15페이지 분량의 챕터를 체계적이고 일관되게 생성한다”며 “이전에는 안정적으로 구현하기 어려웠던 활용 사례 개발까지 가능해졌다”고 밝혔다.


노션(Notion) AI 리드 엔지니어 사라 삭스(Sarah Sachs)는 “오퍼스 4.5는 사용자의 의도를 정확히 파악해 첫 시도에서 바로 공유 가능한 결과물을 만든다”며 “속도·효율성·비용 경쟁력까지 갖춰 처음으로 노션 에이전트에 도입했다”고 말했다.

0

0

기사 공유

댓글 쓰기

조인영 기자 (ciy8100@dailian.co.kr)
기사 모아 보기 >
관련기사

댓글

0 / 150
  • 최신순
  • 찬성순
  • 반대순
0 개의 댓글 전체보기