AiHubMix Documentation Hub

Dieser Artikel behandelt zwei zentrale Änderungen der Reasoning-Steuerung in Claude Opus 4.7 sowie eine vollständige Anleitung für die Verwendung sowohl über die native AIHubmix-API als auch über die einheitliche Chat-Schnittstelle. Siehe auch: Offizielle Anthropic-Ankündigung und Modell-Changelog.

1. Neue Funktionen zur Reasoning-Steuerung

✦ Neue `xhigh`-Reasoning-Effort-Stufe

Die neue xhigh-Stufe liegt zwischen high und max und wurde speziell für Coding- und Agentic-Aufgaben entwickelt, um Leistung und Effizienz besser auszubalancieren.

low  ──  medium  ──  high  ──  xhigh ★NEU  ──  max

✦ Thinking-Inhalte standardmäßig ausgeblendet

In Streaming-Antworten wird der Denkprozess standardmäßig nicht mehr angezeigt. Um eine Reasoning-Zusammenfassung zu erhalten, übergeben Sie das Feld display explizit in Ihrem Request:

display-Wert	Opus 4.7	Opus 4.6	Verhalten
”omitted”	Standard	Nicht Standard	Thinking-Block-Inhalt ist leer
”summarized”	Muss manuell gesetzt werden	Standard	Gibt Thinking-Zusammenfassungstext zurück

"reasoning": {
  "effort": "xhigh",
  "display": "summarized"
}

Abbildung: Neue xhigh-Stufe in Opus 4.7 – Vergleich der Agentic-Coding-Leistung (Quelle: Anthropic offiziell)

2. Referenz für die native Claude-API

Die `effort`-Werte für die native Anthropic-API entsprechen der offiziellen Spezifikation:

effort-Wert	Unterstützte Modelle	Beschreibung	Empfohlener Anwendungsfall
low	Alle unterstützten Modelle	Deutliche Token-Einsparung bei moderatem Leistungsverlust	Einfache Aufgaben, Hochlast-Requests, Sub-Agenten
medium	Alle unterstützten Modelle	Ausgewogener Modus mit moderater Token-Einsparung	Allgemeine Agentic-Aufgaben
high	Alle unterstützten Modelle	Standard; hohe Leistung	Komplexes Reasoning, Coding, Agentic-Aufgaben
xhigh (neu)	Nur Opus 4.7	Erweiterte Leistung zwischen high und max; brilliert bei Long-Horizon-Tasks	Empfohlener Einstieg für Coding- und Agentic-Aufgaben
max	Opus-Serie	Maximale Leistung	Frontier-Research-Probleme

AIHubmix Claude Native API – Opus 4.7 Beispiel

from anthropic import Anthropic

client = Anthropic(
    api_key="<AIHUBMIX_API_KEY>",
    base_url="https://aihubmix.com"
)

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "xhigh"},  # Options: low / medium / high / xhigh / max
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ]
)

print(response.content[-1].text)

3. Reasoning-Effort-Unterstützung in der AIHubmix-Chat-Unified-Schnittstelle

Die einheitliche AIHubMix-Chat-Schnittstelle orientiert sich an der OpenAI-Spezifikation und steuert die Reasoning-Intensität über reasoning.effort. Verschiedene Claude-Modelle werden automatisch der entsprechenden Effort-Stufe zugeordnet:

`reasoning_effort` (Reasoning-Intensitätssteuerung) für Claude-Modelle

effort-Wert	Opus >=4.7 (neu)	Opus 4.6 / 4.5	Sonnet 4.6
minimal	low	low	low
medium	medium	medium	medium
high	high	high	high
xhigh	xhigh	max	high
max	max	max	high

Hinweis: xhigh wird nativ nur in Opus 4.7 unterstützt. Andere Opus-Modelle fallen automatisch auf max zurück, die Sonnet-Serie auf high.

Chat-Unified-Schnittstelle – Opus 4.7 Beispiel

from openai import OpenAI

client = OpenAI(
    base_url="https://aihubmix.com/v1",
    api_key="<AIHUBMIX_API_KEY>",
)

completion = client.chat.completions.create(
    model="claude-opus-4-7",
    # max_tokens=10000,  # Default is 4096; enable for longer outputs
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ],
    extra_body={
        "reasoning": {"effort": "xhigh"}
    }
)

print(completion.choices[0].message.content)

4. Steuerung der Thinking-Inhalte in der Chat-Unified-Schnittstelle

In der OpenAI-kompatiblen Schnittstelle unterstützt reasoning ein display-Feld, mit dem gesteuert wird, ob Thinking-Zusammenfassungen zurückgegeben werden. Claude Opus 4.7 gibt standardmäßig keine Thinking-Inhalte zurück. Setzen Sie "display": "summarized", um sie zu aktivieren.

Feld	Wert	Beschreibung
`display`	(weggelassen)	Thinking-Inhalte nicht zurückgegeben (Standard)
`display`	`"summarized"`	Gibt eine Thinking-Zusammenfassung zurück

Opus 4.7 – Beispiel für Thinking-Zusammenfassung

from openai import OpenAI

client = OpenAI(
    base_url="https://aihubmix.com/v1",
    api_key="<AIHUBMIX_API_KEY>",
)

completion = client.chat.completions.create(
    model="claude-opus-4-7",
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ],
    extra_body={
        "reasoning": {"effort": "xhigh", "display": "summarized"}
    }
)

print(completion.choices[0].message.content)

Weitere Details finden Sie in der AIHubmix-Dokumentation oder den offiziellen Anthropic-Dokumenten.

Zuletzt aktualisiert: 2026-06-01

Documentation Index

​1. Neue Funktionen zur Reasoning-Steuerung

​✦ Neue xhigh-Reasoning-Effort-Stufe

​✦ Thinking-Inhalte standardmäßig ausgeblendet

​2. Referenz für die native Claude-API

​Die effort-Werte für die native Anthropic-API entsprechen der offiziellen Spezifikation:

​AIHubmix Claude Native API – Opus 4.7 Beispiel

​3. Reasoning-Effort-Unterstützung in der AIHubmix-Chat-Unified-Schnittstelle

​reasoning_effort (Reasoning-Intensitätssteuerung) für Claude-Modelle

​Chat-Unified-Schnittstelle – Opus 4.7 Beispiel

​4. Steuerung der Thinking-Inhalte in der Chat-Unified-Schnittstelle

​Opus 4.7 – Beispiel für Thinking-Zusammenfassung

​Weitere Details finden Sie in der AIHubmix-Dokumentation oder den offiziellen Anthropic-Dokumenten.