Documentation Index
Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
Use this file to discover all available pages before exploring further.
이 글은 Claude Opus 4.7의 추론 제어에 대한 두 가지 주요 변경 사항과 AIHubmix 네이티브 API 및 Chat 통합 인터페이스에 대한 완전한 사용 지침을 다룹니다. 또한 참조: Anthropic 공식 발표 및 모델 변경 로그.
1. 새로운 추론 제어 기능
✦ 새로운 xhigh 추론 노력 수준
새로운 xhigh 수준은 high와 max 사이에 있으며, 코딩 및 에이전트 작업을 위해 특별히 설계되어, 기능과 효율성 간의 더 나은 균형을 제공합니다.
low ── medium ── high ── xhigh ★NEW ── max
✦ Thinking 콘텐츠 기본 숨김
스트리밍 응답에서 사고 과정은 더 이상 기본적으로 표시되지 않습니다. 추론 요약을 받으려면 요청에 display 필드를 명시적으로 전달하세요:
| display 값 | Opus 4.7 | Opus 4.6 | 동작 |
|---|
| ”omitted” | 기본값 | 기본 아님 | Thinking 블록 콘텐츠가 비어 있음 |
| ”summarized” | 수동 설정 필요 | 기본값 | Thinking 요약 텍스트 반환 |
"reasoning": {
"effort": "xhigh",
"display": "summarized"
}
그림: Opus 4.7 새 xhigh 수준 — 에이전트 코딩 성능 비교 (출처: Anthropic 공식)
2. Claude 네이티브 API 참조
Anthropic 네이티브 API의 effort 값은 공식 사양과 일치합니다:
| effort 값 | 지원되는 모델 | 설명 | 권장 사용 사례 |
|---|
| low | 모든 지원 모델 | 적당한 기능 절충으로 상당한 토큰 절약 | 간단한 작업, 고동시성 요청, 서브에이전트 |
| medium | 모든 지원 모델 | 적당한 토큰 절약의 균형 잡힌 모드 | 일반 에이전트 작업 |
| high | 모든 지원 모델 | 기본값; 높은 기능 성능 | 복잡한 추론, 코딩, 에이전트 작업 |
| xhigh (새로움) | Opus 4.7 전용 | high와 max 사이의 확장 기능; 장기 작업에 뛰어남 | 코딩 및 에이전트 작업을 위한 권장 시작점 |
| max | Opus 시리즈 | 최대 기능 | 최첨단 연구 문제 |
AIHubmix Claude Native API — Opus 4.7 예시
from anthropic import Anthropic
client = Anthropic(
api_key="<AIHUBMIX_API_KEY>",
base_url="https://aihubmix.com"
)
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "xhigh"}, # Options: low / medium / high / xhigh / max
messages=[
{
"role": "user",
"content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
}
]
)
print(response.content[-1].text)
3. AIHubmix Chat 통합 인터페이스의 추론 노력 지원
AIHubMix Chat 통합 인터페이스는 OpenAI 사양과 일치하며 reasoning.effort를 통해 추론 강도를 제어합니다. 다른 Claude 모델은 자동으로 해당 effort 수준에 매핑됩니다:
Claude 모델용 reasoning_effort (추론 강도 제어)
| effort 값 | Opus >=4.7 (새로움) | Opus 4.6 / 4.5 | Sonnet 4.6 |
|---|
| minimal | low | low | low |
| medium | medium | medium | medium |
| high | high | high | high |
| xhigh | xhigh | max | high |
| max | max | max | high |
참고: xhigh는 Opus 4.7에서만 네이티브로 지원됩니다. 다른 Opus 모델은 자동으로 max로 대체되며, Sonnet 시리즈는 high로 대체됩니다.
Chat 통합 인터페이스 — Opus 4.7 예시
from openai import OpenAI
client = OpenAI(
base_url="https://aihubmix.com/v1",
api_key="<AIHUBMIX_API_KEY>",
)
completion = client.chat.completions.create(
model="claude-opus-4-7",
# max_tokens=10000, # Default is 4096; enable for longer outputs
messages=[
{
"role": "user",
"content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
}
],
extra_body={
"reasoning": {"effort": "xhigh"}
}
)
print(completion.choices[0].message.content)
4. Chat 통합 인터페이스에서 Thinking 콘텐츠 제어
OpenAI 호환 인터페이스에서 reasoning은 thinking 요약 반환 여부를 제어하기 위한 display 필드를 지원합니다.
Claude Opus 4.7은 기본적으로 thinking 콘텐츠를 반환하지 않습니다. "display": "summarized" 를 설정하여 활성화하세요.
| 필드 | 값 | 설명 |
|---|
display | (생략됨) | Thinking 콘텐츠를 반환하지 않음 (기본값) |
display | "summarized" | Thinking 요약 반환 |
Opus 4.7 — Thinking 요약 예시
from openai import OpenAI
client = OpenAI(
base_url="https://aihubmix.com/v1",
api_key="<AIHUBMIX_API_KEY>",
)
completion = client.chat.completions.create(
model="claude-opus-4-7",
messages=[
{
"role": "user",
"content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
}
],
extra_body={
"reasoning": {"effort": "xhigh", "display": "summarized"}
}
)
print(completion.choices[0].message.content)
마지막 업데이트: 2026-06-01