AiHubMix Documentation Hub

AIHubMix June 2026 Release Spotlight: new models and platform capabilities

이번 달 AIHubMix는 채팅, 코드, 비디오, 이미지 전반에 걸쳐 약 20개의 신규 모델을 추가했으며, 여러 플랫폼 기능을 출시했습니다. 동일한 API 키로 이제 더 많은 모델에 접근할 수 있습니다. 주요 내용을 소개합니다.

Auto Router

모델 이름을 auto로 설정하면, 게이트웨이가 요청에 따라 플랫폼의 수백 개 모델 중 최적의 모델을 선택합니다 — 비용 우선, 품질 우선, 저지연 전략을 지원하며, 실제로 사용된 모델 기준으로 과금됩니다. 수동 비교나 모델 전환이 필요 없고, 클라이언트 코드 변경도 필요 없습니다. Auto Router를 참고하세요.

Responses 프로토콜에서 모든 모델 사용

/v1/responses 엔드포인트는 더 이상 GPT 계열에 국한되지 않습니다 — 이제 플랫폼의 모든 모델을 호출할 수 있습니다. 따라서 Responses 프로토콜 기반으로 구축된 도구(예: Codex CLI)는 OpenAI 공식 모델에 제한되지 않고, 로컬 모델 카탈로그를 통해 GLM, Gemini, DeepSeek, Kimi, Qwen 등을 사용할 수 있습니다. Codex CLI · Custom Models를 참고하세요.

Model Mapping & Fallback

콘솔에서 API 키별로 별칭 매핑과 실패 시 fallback을 설정할 수 있습니다: 클라이언트는 임의의 모델 이름을 사용할 수 있으며, 게이트웨이가 이를 실제 업스트림 모델로 재작성합니다. 주 모델이 실패하면 자동으로 백업으로 전환되고, 최종적으로 응답한 모델 기준으로 과금됩니다. 한 번의 일시적 장애로 프로덕션 트래픽이 끊기지 않으며, 클라이언트 코드는 그대로 유지됩니다. Model Mapping & Fallback을 참고하세요.

AIHubMix CLI

의존성이 전혀 없는 단일 바이너리 — Python, Node, Go가 필요 없습니다. 터미널에서 바로 잔액을 조회하고, API 키를 관리하고, 사용 가능한 모델을 나열할 수 있으며, 스크립트와 Claude Code 같은 AI 에이전트를 일급으로 지원합니다. AIHubMix CLI를 참고하세요.

AIHubMix Skill (AI 코딩 에이전트용 확장)

Skill을 지원하는 AI 에이전트 — Codex, Claude Code, Cursor, Cline 등 — 를 위한 로컬 확장입니다. 자연어로 AIHubMix를 통합하고, 모델을 조회하고, 능력별로 선택하고, 예제를 생성하고, 오류를 진단할 수 있습니다. 고정된 모델 목록을 번들로 포함하는 대신, Skill은 필요할 때마다 AIHubMix 공식 API에서 실시간 모델, 가격, 프로토콜 정보를 읽어오므로 에이전트가 오래된 기억에 의존하지 않습니다. Skills를 참고하세요.

백업 도메인: api.inferera.com

메인 도메인 aihubmix.com에 접근할 수 없거나 타임아웃이 발생할 때는 요청을 https://api.inferera.com으로 보내세요. 엔드포인트와 기능은 동일하며 — API 키, 모델, 요청 본문은 변경할 필요가 없습니다.

그 외 출시 내용

Gemini 오디오 입력: OpenAI 호환 엔드포인트(/v1/chat/completions)가 이제 input_audio를 받아들이고 usage에 audio_tokens를 반환합니다.
GLM 5.2 reasoning effort: 네이티브 Zhipu 채널이 reasoning_effort를 지원하여 사고 깊이를 조정할 수 있습니다.
Open Design 통합: AIHubMix가 이제 Open Design의 내장 BYOK 게이트웨이입니다.
OpenClaw 플러그인 수정: aihubmix-auth가 수정되어 안정적으로 사용할 수 있습니다.

안정성 및 수정 사항

과금 정밀도와 캐시 측정 정확도를 개선했습니다.
/v1/models에서 누락된 모델을 수정했습니다.
여러 비디오 생성 및 채널 테스트 문제를 수정했습니다.

이번 달 신규 모델 (약 20개)

채팅 / 범용

claude-fable-5【지원 종료】: Claude의 최신 세대로, 더 강력한 안전 가드레일을 갖췄습니다(Changelog · Fable 5 notes 참고).
minimax-m3, qwen3.7-plus, glm-5.2, 그리고 Doubao doubao-seed-2-1-pro / doubao-seed-2-1-turbo.

코드

kimi-k2.7-code와 kimi-k2.7-code-highspeed: 고속 변형을 포함한 Kimi의 코드 시리즈.
coding-glm-5.2와 무료 coding-glm-5.2-free.

비디오

Kling: 텍스트-비디오, 이미지-비디오, 다중 이미지 참조, 옴니 멀티모달 생성.
happyhorse-1.1: 텍스트-비디오(t2v), 참조(r2v), 이미지-비디오(i2v).

이미지

이미지 생성을 위한 Baidu musesteamer-air-image.

그 외 신규

grok-build-0.1, hy3-preview, 그리고 무료 step-3.7-flash-free.

가격 및 공지

step-3.7-flash, 90% 할인 (한정 기간): 입력 토큰 $0.022 / M, 출력 토큰$ 0.132 / M.
지원 중단 및 자동 라우팅: claude-opus-4-20250514와 claude-sonnet-4-20250514는 6월 15일에 업스트림에서 퇴역했으며, 플랫폼이 이를 동일 계열의 4-5 버전으로 자동 라우팅합니다.

FAQ

이번 달에 추가된 모델은 무엇인가요? 약 20개로, 채팅(claude-fable-5【지원 종료】, minimax-m3, qwen3.7-plus, glm-5.2, doubao-seed-2-1 시리즈), 코드(kimi-k2.7-code 시리즈, coding-glm-5.2), 비디오(Kling, happyhorse-1.1), 이미지(musesteamer-air-image)에 걸쳐 있습니다. Auto Router는 어떻게 사용하나요? 요청의 모델 이름을 auto로 설정하세요. 게이트웨이가 요청에 따라 최적의 모델을 선택하고 실제로 사용된 모델 기준으로 과금하며, 클라이언트 코드 변경은 필요 없습니다. Auto Router를 참고하세요. 메인 도메인에 접근할 수 없으면 어떻게 하나요? 요청 주소를 백업 도메인 https://api.inferera.com으로 교체하세요. 엔드포인트와 기능은 동일하며, 변경해야 할 파라미터는 없습니다. step-3.7-flash의 한정 기간 가격은 얼마인가요? 입력 토큰

0.022 / M, 출력 토큰

0.132 / M. 모든 모델은 모델 카탈로그에서 둘러볼 수 있으며, 통합 세부 정보는 문서에서 확인할 수 있습니다.

업데이트: 2026-06-30

​Auto Router

​Responses 프로토콜에서 모든 모델 사용

​Model Mapping & Fallback

​AIHubMix CLI

​AIHubMix Skill (AI 코딩 에이전트용 확장)

​백업 도메인: api.inferera.com

​그 외 출시 내용

​안정성 및 수정 사항

​이번 달 신규 모델 (약 20개)

​가격 및 공지

​FAQ