AiHubMix Documentation Hub

이 글은 Claude Opus 4.7의 추론 제어에 대한 두 가지 주요 변경 사항과 AIHubmix 네이티브 API 및 Chat 통합 인터페이스에 대한 완전한 사용 지침을 다룹니다. 또한 참조: Anthropic 공식 발표 및 모델 변경 로그.

1. 새로운 추론 제어 기능

✦ 새로운 `xhigh` 추론 노력 수준

새로운 xhigh 수준은 high와 max 사이에 있으며, 코딩 및 에이전트 작업을 위해 특별히 설계되어, 기능과 효율성 간의 더 나은 균형을 제공합니다.

low  ──  medium  ──  high  ──  xhigh ★NEW  ──  max

✦ Thinking 콘텐츠 기본 숨김

스트리밍 응답에서 사고 과정은 더 이상 기본적으로 표시되지 않습니다. 추론 요약을 받으려면 요청에 display 필드를 명시적으로 전달하세요:

display 값	Opus 4.7	Opus 4.6	동작
”omitted”	기본값	기본 아님	Thinking 블록 콘텐츠가 비어 있음
”summarized”	수동 설정 필요	기본값	Thinking 요약 텍스트 반환

"reasoning": {
  "effort": "xhigh",
  "display": "summarized"
}

그림: Opus 4.7 새 xhigh 수준 — 에이전트 코딩 성능 비교 (출처: Anthropic 공식)

2. Claude 네이티브 API 참조

Anthropic 네이티브 API의 `effort` 값은 공식 사양과 일치합니다:

effort 값	지원되는 모델	설명	권장 사용 사례
low	모든 지원 모델	적당한 기능 절충으로 상당한 토큰 절약	간단한 작업, 고동시성 요청, 서브에이전트
medium	모든 지원 모델	적당한 토큰 절약의 균형 잡힌 모드	일반 에이전트 작업
high	모든 지원 모델	기본값; 높은 기능 성능	복잡한 추론, 코딩, 에이전트 작업
xhigh (새로움)	Opus 4.7 전용	high와 max 사이의 확장 기능; 장기 작업에 뛰어남	코딩 및 에이전트 작업을 위한 권장 시작점
max	Opus 시리즈	최대 기능	최첨단 연구 문제

AIHubmix Claude Native API — Opus 4.7 예시

from anthropic import Anthropic

client = Anthropic(
    api_key="<AIHUBMIX_API_KEY>",
    base_url="https://aihubmix.com"
)

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "xhigh"},  # Options: low / medium / high / xhigh / max
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ]
)

print(response.content[-1].text)

3. AIHubmix Chat 통합 인터페이스의 추론 노력 지원

AIHubMix Chat 통합 인터페이스는 OpenAI 사양과 일치하며 reasoning.effort를 통해 추론 강도를 제어합니다. 다른 Claude 모델은 자동으로 해당 effort 수준에 매핑됩니다:

Claude 모델용 `reasoning_effort` (추론 강도 제어)

effort 값	Opus >=4.7 (새로움)	Opus 4.6 / 4.5	Sonnet 4.6
minimal	low	low	low
medium	medium	medium	medium
high	high	high	high
xhigh	xhigh	max	high
max	max	max	high

참고: xhigh는 Opus 4.7에서만 네이티브로 지원됩니다. 다른 Opus 모델은 자동으로 max로 대체되며, Sonnet 시리즈는 high로 대체됩니다.

Chat 통합 인터페이스 — Opus 4.7 예시

from openai import OpenAI

client = OpenAI(
    base_url="https://aihubmix.com/v1",
    api_key="<AIHUBMIX_API_KEY>",
)

completion = client.chat.completions.create(
    model="claude-opus-4-7",
    # max_tokens=10000,  # Default is 4096; enable for longer outputs
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ],
    extra_body={
        "reasoning": {"effort": "xhigh"}
    }
)

print(completion.choices[0].message.content)

4. Chat 통합 인터페이스에서 Thinking 콘텐츠 제어

OpenAI 호환 인터페이스에서 reasoning은 thinking 요약 반환 여부를 제어하기 위한 display 필드를 지원합니다. Claude Opus 4.7은 기본적으로 thinking 콘텐츠를 반환하지 않습니다. "display": "summarized" 를 설정하여 활성화하세요.

필드	값	설명
`display`	(생략됨)	Thinking 콘텐츠를 반환하지 않음 (기본값)
`display`	`"summarized"`	Thinking 요약 반환

Opus 4.7 — Thinking 요약 예시

from openai import OpenAI

client = OpenAI(
    base_url="https://aihubmix.com/v1",
    api_key="<AIHUBMIX_API_KEY>",
)

completion = client.chat.completions.create(
    model="claude-opus-4-7",
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ],
    extra_body={
        "reasoning": {"effort": "xhigh", "display": "summarized"}
    }
)

print(completion.choices[0].message.content)

자세한 내용은 AIHubmix 문서 또는 Anthropic 공식 문서를 참조하세요.

마지막 업데이트: 2026-06-01

Documentation Index

​1. 새로운 추론 제어 기능

​✦ 새로운 xhigh 추론 노력 수준

​✦ Thinking 콘텐츠 기본 숨김

​2. Claude 네이티브 API 참조

​Anthropic 네이티브 API의 effort 값은 공식 사양과 일치합니다:

​AIHubmix Claude Native API — Opus 4.7 예시

​3. AIHubmix Chat 통합 인터페이스의 추론 노력 지원

​Claude 모델용 reasoning_effort (추론 강도 제어)

​Chat 통합 인터페이스 — Opus 4.7 예시

​4. Chat 통합 인터페이스에서 Thinking 콘텐츠 제어

​Opus 4.7 — Thinking 요약 예시

​자세한 내용은 AIHubmix 문서 또는 Anthropic 공식 문서를 참조하세요.