이 글은 Claude Opus 4.7의 추론 제어에 대한 두 가지 주요 변경 사항과 AIHubmix 네이티브 API 및 Chat 통합 인터페이스에 대한 완전한 사용 지침을 다룹니다. 또한 참조: Anthropic 공식 발표 및 모델 변경 로그.

1. 새로운 추론 제어 기능
✦ 새로운 xhigh 추론 노력 수준
새로운 xhigh 수준은 high와 max 사이에 있으며, 코딩 및 에이전트 작업을 위해 특별히 설계되어, 기능과 효율성 간의 더 나은 균형을 제공합니다.
✦ Thinking 콘텐츠 기본 숨김
스트리밍 응답에서 사고 과정은 더 이상 기본적으로 표시되지 않습니다. 추론 요약을 받으려면 요청에display 필드를 명시적으로 전달하세요:
| display 값 | Opus 4.7 | Opus 4.6 | 동작 |
|---|---|---|---|
| ”omitted” | 기본값 | 기본 아님 | Thinking 블록 콘텐츠가 비어 있음 |
| ”summarized” | 수동 설정 필요 | 기본값 | Thinking 요약 텍스트 반환 |
그림: Opus 4.7 새 xhigh 수준 — 에이전트 코딩 성능 비교 (출처: Anthropic 공식)

2. Claude 네이티브 API 참조
Anthropic 네이티브 API의 effort 값은 공식 사양과 일치합니다:
| effort 값 | 지원되는 모델 | 설명 | 권장 사용 사례 |
|---|---|---|---|
| low | 모든 지원 모델 | 적당한 기능 절충으로 상당한 토큰 절약 | 간단한 작업, 고동시성 요청, 서브에이전트 |
| medium | 모든 지원 모델 | 적당한 토큰 절약의 균형 잡힌 모드 | 일반 에이전트 작업 |
| high | 모든 지원 모델 | 기본값; 높은 기능 성능 | 복잡한 추론, 코딩, 에이전트 작업 |
| xhigh (새로움) | Opus 4.7 전용 | high와 max 사이의 확장 기능; 장기 작업에 뛰어남 | 코딩 및 에이전트 작업을 위한 권장 시작점 |
| max | Opus 시리즈 | 최대 기능 | 최첨단 연구 문제 |
AIHubmix Claude Native API — Opus 4.7 예시
3. AIHubmix Chat 통합 인터페이스의 추론 노력 지원
AIHubMix Chat 통합 인터페이스는 OpenAI 사양과 일치하며reasoning.effort를 통해 추론 강도를 제어합니다. 다른 Claude 모델은 자동으로 해당 effort 수준에 매핑됩니다:
Claude 모델용 reasoning_effort (추론 강도 제어)
| effort 값 | Opus >=4.7 (새로움) | Opus 4.6 / 4.5 | Sonnet 4.6 |
|---|---|---|---|
| minimal | low | low | low |
| medium | medium | medium | medium |
| high | high | high | high |
| xhigh | xhigh | max | high |
| max | max | max | high |
xhigh는 Opus 4.7에서만 네이티브로 지원됩니다. 다른 Opus 모델은 자동으로 max로 대체되며, Sonnet 시리즈는 high로 대체됩니다.
Chat 통합 인터페이스 — Opus 4.7 예시
4. Chat 통합 인터페이스에서 Thinking 콘텐츠 제어
OpenAI 호환 인터페이스에서reasoning은 thinking 요약 반환 여부를 제어하기 위한 display 필드를 지원합니다.
Claude Opus 4.7은 기본적으로 thinking 콘텐츠를 반환하지 않습니다. "display": "summarized" 를 설정하여 활성화하세요.
| 필드 | 값 | 설명 |
|---|---|---|
display | (생략됨) | Thinking 콘텐츠를 반환하지 않음 (기본값) |
display | "summarized" | Thinking 요약 반환 |