> ## Documentation Index
> Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
> Use this file to discover all available pages before exploring further.

# 2026년 6월 Release Spotlight: 약 20개의 신규 모델

> 2026년 6월 AIHubMix는 claude-fable-5【지원 종료】, glm-5.2, minimax-m3, qwen3.7-plus, kimi-k2.7-code, Kling 비디오 등 약 20개의 신규 모델을 추가했으며, Auto Router, 모든 모델을 지원하는 Responses 프로토콜, Mapping & Fallback, AIHubMix CLI와 Skill, 그리고 백업 도메인을 출시했습니다.

<Frame>
  <img src="https://mintcdn.com/aihubmix/KfVPdfHEI_4FVLQw/images/blogs/aihubmix-2026-06-recap.webp?fit=max&auto=format&n=KfVPdfHEI_4FVLQw&q=85&s=7af8996a5bc985f3996cf796e3299a4f" alt="AIHubMix June 2026 Release Spotlight: new models and platform capabilities" width="2400" height="1260" data-path="images/blogs/aihubmix-2026-06-recap.webp" />
</Frame>

이번 달 AIHubMix는 채팅, 코드, 비디오, 이미지 전반에 걸쳐 약 20개의 신규 모델을 추가했으며, 여러 플랫폼 기능을 출시했습니다. 동일한 API 키로 이제 더 많은 모델에 접근할 수 있습니다. 주요 내용을 소개합니다.

## Auto Router

모델 이름을 `auto`로 설정하면, 게이트웨이가 요청에 따라 플랫폼의 수백 개 모델 중 최적의 모델을 선택합니다 — 비용 우선, 품질 우선, 저지연 전략을 지원하며, 실제로 사용된 모델 기준으로 과금됩니다. 수동 비교나 모델 전환이 필요 없고, 클라이언트 코드 변경도 필요 없습니다. [Auto Router](/ko/api/auto-router)를 참고하세요.

## Responses 프로토콜에서 모든 모델 사용

`/v1/responses` 엔드포인트는 더 이상 GPT 계열에 국한되지 않습니다 — 이제 플랫폼의 모든 모델을 호출할 수 있습니다. 따라서 Responses 프로토콜 기반으로 구축된 도구(예: Codex CLI)는 OpenAI 공식 모델에 제한되지 않고, 로컬 모델 카탈로그를 통해 GLM, Gemini, DeepSeek, Kimi, Qwen 등을 사용할 수 있습니다. [Codex CLI · Custom Models](/ko/api/Codex-CLI#custom-models)를 참고하세요.

## Model Mapping & Fallback

콘솔에서 API 키별로 별칭 매핑과 실패 시 fallback을 설정할 수 있습니다: 클라이언트는 임의의 모델 이름을 사용할 수 있으며, 게이트웨이가 이를 실제 업스트림 모델로 재작성합니다. 주 모델이 실패하면 자동으로 백업으로 전환되고, 최종적으로 응답한 모델 기준으로 과금됩니다. 한 번의 일시적 장애로 프로덕션 트래픽이 끊기지 않으며, 클라이언트 코드는 그대로 유지됩니다. [Model Mapping & Fallback](/ko/api/Model-Mapping-Fallback)을 참고하세요.

## AIHubMix CLI

의존성이 전혀 없는 단일 바이너리 — Python, Node, Go가 필요 없습니다. 터미널에서 바로 잔액을 조회하고, API 키를 관리하고, 사용 가능한 모델을 나열할 수 있으며, 스크립트와 Claude Code 같은 AI 에이전트를 일급으로 지원합니다. [AIHubMix CLI](/ko/api/aihubmix-cli)를 참고하세요.

## AIHubMix Skill (AI 코딩 에이전트용 확장)

Skill을 지원하는 AI 에이전트 — Codex, Claude Code, Cursor, Cline 등 — 를 위한 로컬 확장입니다. 자연어로 AIHubMix를 통합하고, 모델을 조회하고, 능력별로 선택하고, 예제를 생성하고, 오류를 진단할 수 있습니다. 고정된 모델 목록을 번들로 포함하는 대신, Skill은 필요할 때마다 AIHubMix 공식 API에서 실시간 모델, 가격, 프로토콜 정보를 읽어오므로 에이전트가 오래된 기억에 의존하지 않습니다. [Skills](/ko/skills)를 참고하세요.

## 백업 도메인: api.inferera.com

메인 도메인 `aihubmix.com`에 접근할 수 없거나 타임아웃이 발생할 때는 요청을 `https://api.inferera.com`으로 보내세요. 엔드포인트와 기능은 동일하며 — API 키, 모델, 요청 본문은 변경할 필요가 없습니다.

## 그 외 출시 내용

* **Gemini 오디오 입력**: OpenAI 호환 엔드포인트(`/v1/chat/completions`)가 이제 `input_audio`를 받아들이고 usage에 audio\_tokens를 반환합니다.
* **GLM 5.2 reasoning effort**: 네이티브 Zhipu 채널이 `reasoning_effort`를 지원하여 사고 깊이를 조정할 수 있습니다.
* **Open Design 통합**: AIHubMix가 이제 [Open Design](/ko/clients/Open-Design)의 내장 BYOK 게이트웨이입니다.
* **OpenClaw 플러그인 수정**: [aihubmix-auth](https://github.com/akakenle/aihubmix-auth)가 수정되어 안정적으로 사용할 수 있습니다.

## 안정성 및 수정 사항

* 과금 정밀도와 캐시 측정 정확도를 개선했습니다.
* `/v1/models`에서 누락된 모델을 수정했습니다.
* 여러 비디오 생성 및 채널 테스트 문제를 수정했습니다.

## 이번 달 신규 모델 (약 20개)

**채팅 / 범용**

* **claude-fable-5**【지원 종료】: Claude의 최신 세대로, 더 강력한 안전 가드레일을 갖췄습니다([Changelog · Fable 5 notes](/ko/update/News#6월-10일) 참고).
* **minimax-m3**, **qwen3.7-plus**, **glm-5.2**, 그리고 Doubao **doubao-seed-2-1-pro / doubao-seed-2-1-turbo**.

**코드**

* **kimi-k2.7-code**와 **kimi-k2.7-code-highspeed**: 고속 변형을 포함한 Kimi의 코드 시리즈.
* **coding-glm-5.2**와 무료 **coding-glm-5.2-free**.

**비디오**

* **Kling**: 텍스트-비디오, 이미지-비디오, 다중 이미지 참조, 옴니 멀티모달 생성.
* **happyhorse-1.1**: 텍스트-비디오(t2v), 참조(r2v), 이미지-비디오(i2v).

**이미지**

* 이미지 생성을 위한 Baidu **musesteamer-air-image**.

**그 외 신규**

* **grok-build-0.1**, **hy3-preview**, 그리고 무료 **step-3.7-flash-free**.

## 가격 및 공지

* **step-3.7-flash, 90% 할인 (한정 기간)**: 입력 토큰 $0.022 / M, 출력 토큰 $0.132 / M.
* **지원 중단 및 자동 라우팅**: `claude-opus-4-20250514`와 `claude-sonnet-4-20250514`는 6월 15일에 업스트림에서 퇴역했으며, 플랫폼이 이를 동일 계열의 4-5 버전으로 자동 라우팅합니다.

## FAQ

**이번 달에 추가된 모델은 무엇인가요?**
약 20개로, 채팅(claude-fable-5【지원 종료】, minimax-m3, qwen3.7-plus, glm-5.2, doubao-seed-2-1 시리즈), 코드(kimi-k2.7-code 시리즈, coding-glm-5.2), 비디오(Kling, happyhorse-1.1), 이미지(musesteamer-air-image)에 걸쳐 있습니다.

**Auto Router는 어떻게 사용하나요?**
요청의 모델 이름을 `auto`로 설정하세요. 게이트웨이가 요청에 따라 최적의 모델을 선택하고 실제로 사용된 모델 기준으로 과금하며, 클라이언트 코드 변경은 필요 없습니다. [Auto Router](/ko/api/auto-router)를 참고하세요.

**메인 도메인에 접근할 수 없으면 어떻게 하나요?**
요청 주소를 백업 도메인 `https://api.inferera.com`으로 교체하세요. 엔드포인트와 기능은 동일하며, 변경해야 할 파라미터는 없습니다.

**step-3.7-flash의 한정 기간 가격은 얼마인가요?**
입력 토큰 $0.022 / M, 출력 토큰 $0.132 / M.

모든 모델은 [모델 카탈로그](https://aihubmix.com)에서 둘러볼 수 있으며, 통합 세부 정보는 [문서](https://docs.aihubmix.com)에서 확인할 수 있습니다.

***

업데이트: 2026-06-30