Documentation Index
Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
Use this file to discover all available pages before exploring further.
Dieser Artikel behandelt zwei zentrale Änderungen der Reasoning-Steuerung in Claude Opus 4.7 sowie eine vollständige Anleitung für die Verwendung sowohl über die native AIHubmix-API als auch über die einheitliche Chat-Schnittstelle. Siehe auch: Offizielle Anthropic-Ankündigung und Modell-Changelog.
1. Neue Funktionen zur Reasoning-Steuerung
✦ Neue xhigh-Reasoning-Effort-Stufe
Die neue xhigh-Stufe liegt zwischen high und max und wurde speziell für Coding- und Agentic-Aufgaben entwickelt, um Leistung und Effizienz besser auszubalancieren.
low ── medium ── high ── xhigh ★NEU ── max
✦ Thinking-Inhalte standardmäßig ausgeblendet
In Streaming-Antworten wird der Denkprozess standardmäßig nicht mehr angezeigt. Um eine Reasoning-Zusammenfassung zu erhalten, übergeben Sie das Feld display explizit in Ihrem Request:
| display-Wert | Opus 4.7 | Opus 4.6 | Verhalten |
|---|
| ”omitted” | Standard | Nicht Standard | Thinking-Block-Inhalt ist leer |
| ”summarized” | Muss manuell gesetzt werden | Standard | Gibt Thinking-Zusammenfassungstext zurück |
"reasoning": {
"effort": "xhigh",
"display": "summarized"
}
Abbildung: Neue xhigh-Stufe in Opus 4.7 – Vergleich der Agentic-Coding-Leistung (Quelle: Anthropic offiziell)
2. Referenz für die native Claude-API
Die effort-Werte für die native Anthropic-API entsprechen der offiziellen Spezifikation:
| effort-Wert | Unterstützte Modelle | Beschreibung | Empfohlener Anwendungsfall |
|---|
| low | Alle unterstützten Modelle | Deutliche Token-Einsparung bei moderatem Leistungsverlust | Einfache Aufgaben, Hochlast-Requests, Sub-Agenten |
| medium | Alle unterstützten Modelle | Ausgewogener Modus mit moderater Token-Einsparung | Allgemeine Agentic-Aufgaben |
| high | Alle unterstützten Modelle | Standard; hohe Leistung | Komplexes Reasoning, Coding, Agentic-Aufgaben |
| xhigh (neu) | Nur Opus 4.7 | Erweiterte Leistung zwischen high und max; brilliert bei Long-Horizon-Tasks | Empfohlener Einstieg für Coding- und Agentic-Aufgaben |
| max | Opus-Serie | Maximale Leistung | Frontier-Research-Probleme |
AIHubmix Claude Native API – Opus 4.7 Beispiel
from anthropic import Anthropic
client = Anthropic(
api_key="<AIHUBMIX_API_KEY>",
base_url="https://aihubmix.com"
)
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "xhigh"}, # Options: low / medium / high / xhigh / max
messages=[
{
"role": "user",
"content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
}
]
)
print(response.content[-1].text)
3. Reasoning-Effort-Unterstützung in der AIHubmix-Chat-Unified-Schnittstelle
Die einheitliche AIHubMix-Chat-Schnittstelle orientiert sich an der OpenAI-Spezifikation und steuert die Reasoning-Intensität über reasoning.effort. Verschiedene Claude-Modelle werden automatisch der entsprechenden Effort-Stufe zugeordnet:
reasoning_effort (Reasoning-Intensitätssteuerung) für Claude-Modelle
| effort-Wert | Opus >=4.7 (neu) | Opus 4.6 / 4.5 | Sonnet 4.6 |
|---|
| minimal | low | low | low |
| medium | medium | medium | medium |
| high | high | high | high |
| xhigh | xhigh | max | high |
| max | max | max | high |
Hinweis: xhigh wird nativ nur in Opus 4.7 unterstützt. Andere Opus-Modelle fallen automatisch auf max zurück, die Sonnet-Serie auf high.
Chat-Unified-Schnittstelle – Opus 4.7 Beispiel
from openai import OpenAI
client = OpenAI(
base_url="https://aihubmix.com/v1",
api_key="<AIHUBMIX_API_KEY>",
)
completion = client.chat.completions.create(
model="claude-opus-4-7",
# max_tokens=10000, # Default is 4096; enable for longer outputs
messages=[
{
"role": "user",
"content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
}
],
extra_body={
"reasoning": {"effort": "xhigh"}
}
)
print(completion.choices[0].message.content)
4. Steuerung der Thinking-Inhalte in der Chat-Unified-Schnittstelle
In der OpenAI-kompatiblen Schnittstelle unterstützt reasoning ein display-Feld, mit dem gesteuert wird, ob Thinking-Zusammenfassungen zurückgegeben werden.
Claude Opus 4.7 gibt standardmäßig keine Thinking-Inhalte zurück. Setzen Sie "display": "summarized", um sie zu aktivieren.
| Feld | Wert | Beschreibung |
|---|
display | (weggelassen) | Thinking-Inhalte nicht zurückgegeben (Standard) |
display | "summarized" | Gibt eine Thinking-Zusammenfassung zurück |
Opus 4.7 – Beispiel für Thinking-Zusammenfassung
from openai import OpenAI
client = OpenAI(
base_url="https://aihubmix.com/v1",
api_key="<AIHUBMIX_API_KEY>",
)
completion = client.chat.completions.create(
model="claude-opus-4-7",
messages=[
{
"role": "user",
"content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
}
],
extra_body={
"reasoning": {"effort": "xhigh", "display": "summarized"}
}
)
print(completion.choices[0].message.content)
Zuletzt aktualisiert: 2026-06-01