Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

Dieser Artikel behandelt zwei zentrale Änderungen der Reasoning-Steuerung in Claude Opus 4.7 sowie eine vollständige Anleitung für die Verwendung sowohl über die native AIHubmix-API als auch über die einheitliche Chat-Schnittstelle. Siehe auch: Offizielle Anthropic-Ankündigung und Modell-Changelog.
Image

1. Neue Funktionen zur Reasoning-Steuerung

✦ Neue xhigh-Reasoning-Effort-Stufe

Die neue xhigh-Stufe liegt zwischen high und max und wurde speziell für Coding- und Agentic-Aufgaben entwickelt, um Leistung und Effizienz besser auszubalancieren.
low  ──  medium  ──  high  ──  xhigh ★NEU  ──  max

✦ Thinking-Inhalte standardmäßig ausgeblendet

In Streaming-Antworten wird der Denkprozess standardmäßig nicht mehr angezeigt. Um eine Reasoning-Zusammenfassung zu erhalten, übergeben Sie das Feld display explizit in Ihrem Request:
display-WertOpus 4.7Opus 4.6Verhalten
”omitted”StandardNicht StandardThinking-Block-Inhalt ist leer
”summarized”Muss manuell gesetzt werdenStandardGibt Thinking-Zusammenfassungstext zurück
"reasoning": {
  "effort": "xhigh",
  "display": "summarized"
}
Abbildung: Neue xhigh-Stufe in Opus 4.7 – Vergleich der Agentic-Coding-Leistung (Quelle: Anthropic offiziell)
Image

2. Referenz für die native Claude-API

Die effort-Werte für die native Anthropic-API entsprechen der offiziellen Spezifikation:

effort-WertUnterstützte ModelleBeschreibungEmpfohlener Anwendungsfall
lowAlle unterstützten ModelleDeutliche Token-Einsparung bei moderatem LeistungsverlustEinfache Aufgaben, Hochlast-Requests, Sub-Agenten
mediumAlle unterstützten ModelleAusgewogener Modus mit moderater Token-EinsparungAllgemeine Agentic-Aufgaben
highAlle unterstützten ModelleStandard; hohe LeistungKomplexes Reasoning, Coding, Agentic-Aufgaben
xhigh (neu)Nur Opus 4.7Erweiterte Leistung zwischen high und max; brilliert bei Long-Horizon-TasksEmpfohlener Einstieg für Coding- und Agentic-Aufgaben
maxOpus-SerieMaximale LeistungFrontier-Research-Probleme

AIHubmix Claude Native API – Opus 4.7 Beispiel

from anthropic import Anthropic

client = Anthropic(
    api_key="<AIHUBMIX_API_KEY>",
    base_url="https://aihubmix.com"
)

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "xhigh"},  # Options: low / medium / high / xhigh / max
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ]
)

print(response.content[-1].text)

3. Reasoning-Effort-Unterstützung in der AIHubmix-Chat-Unified-Schnittstelle

Die einheitliche AIHubMix-Chat-Schnittstelle orientiert sich an der OpenAI-Spezifikation und steuert die Reasoning-Intensität über reasoning.effort. Verschiedene Claude-Modelle werden automatisch der entsprechenden Effort-Stufe zugeordnet:

reasoning_effort (Reasoning-Intensitätssteuerung) für Claude-Modelle

effort-WertOpus >=4.7 (neu)Opus 4.6 / 4.5Sonnet 4.6
minimallowlowlow
mediummediummediummedium
highhighhighhigh
xhighxhighmaxhigh
maxmaxmaxhigh
Hinweis: xhigh wird nativ nur in Opus 4.7 unterstützt. Andere Opus-Modelle fallen automatisch auf max zurück, die Sonnet-Serie auf high.

Chat-Unified-Schnittstelle – Opus 4.7 Beispiel

from openai import OpenAI

client = OpenAI(
    base_url="https://aihubmix.com/v1",
    api_key="<AIHUBMIX_API_KEY>",
)

completion = client.chat.completions.create(
    model="claude-opus-4-7",
    # max_tokens=10000,  # Default is 4096; enable for longer outputs
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ],
    extra_body={
        "reasoning": {"effort": "xhigh"}
    }
)

print(completion.choices[0].message.content)

4. Steuerung der Thinking-Inhalte in der Chat-Unified-Schnittstelle

In der OpenAI-kompatiblen Schnittstelle unterstützt reasoning ein display-Feld, mit dem gesteuert wird, ob Thinking-Zusammenfassungen zurückgegeben werden. Claude Opus 4.7 gibt standardmäßig keine Thinking-Inhalte zurück. Setzen Sie "display": "summarized", um sie zu aktivieren.
FeldWertBeschreibung
display(weggelassen)Thinking-Inhalte nicht zurückgegeben (Standard)
display"summarized"Gibt eine Thinking-Zusammenfassung zurück

Opus 4.7 – Beispiel für Thinking-Zusammenfassung

from openai import OpenAI

client = OpenAI(
    base_url="https://aihubmix.com/v1",
    api_key="<AIHUBMIX_API_KEY>",
)

completion = client.chat.completions.create(
    model="claude-opus-4-7",
    messages=[
        {
            "role": "user",
            "content": "A snail is at the bottom of a 10-meter well. Each day it climbs 3 meters, but each night it slides back 2 meters. How many days does it take to reach the top?"
        }
    ],
    extra_body={
        "reasoning": {"effort": "xhigh", "display": "summarized"}
    }
)

print(completion.choices[0].message.content)

Weitere Details finden Sie in der AIHubmix-Dokumentation oder den offiziellen Anthropic-Dokumenten.

Zuletzt aktualisiert: 2026-06-01