アリババ通義シリーズ
Qwen 3 シリーズ
Qwen3シリーズは、アリババがリリースした新世代のオープンソース大規模モデルで、その能力は大幅に向上しています。コード理解、数学的推論、多言語表現、複雑な推論タスクにおいて、現在の市場のトップモデル(o1、DeepSeek-R1など)に匹敵するか、それを超える性能を発揮します。その核心的なブレークスルーは、「思考モード」と「非思考モード」の切り替えメカニズムを導入したことにあり、モデルが異なる難易度のタスクに直面した際に、推論の深さを自律的に調整し、速度と精度の両方で優れたバランスを実現しました。 フラッグシップ版のQwen3-235Bは、スパースアクティベーションを採用しており、わずか22Bのパラメータで推論を行い、コストと卓越した能力を両立しています。全シリーズのモデルは完全にオープンソース化されており、軽量から超大規模なニーズまでをカバーしています。
1. 基本的な使用法: OpenAI互換形式で転送します。
2. ツール呼び出し: 通常のTools呼び出しはOpenAI互換形式をサポートします(V2.5、V3に適用)。MCP Toolsはqwen-agent
に依存するため、まずpip install -U qwen-agent mcp
コマンドを実行して依存関係をインストールする必要があります。
詳細については、アリババ公式ドキュメントを参照してください。
QvQ、Qwen 2.5、および QwQ シリーズ
OpenAI互換形式で転送するだけで、違いはストリーミング呼び出しの抽出にあり、空のchunk.choices[0].delta.content
を削除する必要があります。以下を参照してください。
1. QvQ、Qwen 2.5 VL: 画像認識
2. QwQ: テキストタスク
Qwen/QVQ-72B-Preview
は、Qwen2-VL-72B
に基づいて構築されたオープンソースのマルチモーダル推論モデルで、視覚推論とクロスモーダルタスクに特化しています。