AiHubMix Documentation Hub

説明

Jina AIの5つのコアインターフェースを統合し、強力なインテリジェントエージェントを簡単に構築できるようにしました。これらのインターフェースは主に以下のシナリオに適用されます。

ベクトル埋め込み (Embeddings)：マルチモーダルRAG質問応答シナリオに適しています。例えば、インテリジェントカスタマーサービス、インテリジェント採用、ナレッジベース質問応答など。
再ランキング (Rerank)：Embedding候補結果を最適化し、トピックの関連性に基づいて再ランキングすることで、大規模言語モデルの回答品質を大幅に向上させます。
ディープサーチ (DeepSearch)：最適な回答が見つかるまで、ディープサーチと推論を実行します。特に、課題研究や製品ソリューションの策定などの複雑なタスクに適しています。
ウェブ検索 (Search)：クエリを渡すだけで検索結果ページ (SERP) のクリーンな本文が返り、Webに接続したQ&AやRAGのためにそのままLLMに渡せます。
ウェブリーダー (Reader)：任意のURLを渡すだけで変換後のクリーンなmarkdown本文が返り、Webコンテンツを取得してLLMに渡すのに最適です。

Jina AIインターフェースをベースに機能を拡張しているため、公式のネイティブ呼び出しとは若干使用方法が異なります。

クイックガイド

API_KEYをAIHUBMIX_API_KEYとモデルエンドポイントリンクに置き換える以外は、他のパラメータと使用方法はJina AI公式と完全に同じです。 エンドポイントの置き換え：

ベクトル埋め込み (Embeddings)：https://jina.ai/embeddings -> https://aihubmix.com/v1/embeddings
再ランキング (Rerank)：https://api.jina.ai/v1/rerank -> https://aihubmix.com/v1/rerank
ディープサーチ (DeepSearch)：https://deepsearch.jina.ai/v1/chat/completions -> https://aihubmix.com/v1/chat/completions
ウェブ検索 (Search)：https://s.jina.ai/?q= -> https://aihubmix.com/v1/jina/search?q=
ウェブリーダー (Reader)：https://r.jina.ai/<url> -> https://aihubmix.com/v1/jina/reader/<url>
現在のメイン API アドレスが利用できない場合は、この設定内のドメインをバックアップアドレス https://api.inferera.com に置き換えてください。パスはそのままにします。

一、ベクトル埋め込み (Embeddings)

Jina AIのEmbeddingは、通常のテキストとマルチモーダルな画像とテキストをサポートしており、多言語タスクの処理において優れた性能を発揮します。

リクエストパラメータ

model

string

必須

モデル名。利用可能な埋め込みモデルのリストは以下の通りです。

jina-clip-v2：マルチモーダル、多言語、1024次元、8Kコンテキストウィンドウ、865Mパラメータ
jina-embeddings-v3：テキストモデル、多言語、1024次元、8Kコンテキストウィンドウ、570Mパラメータ
jina-colbert-v2：多言語ColBERTモデル、8Kトークンコンテキスト、560Mパラメータ、埋め込みと再ランキングに使用
jina-embeddings-v2-base-code：コードとドキュメント検索に最適化されたモデル、768次元、8Kコンテキストウィンドウ、137Mパラメータ

input

array

必須

入力テキストまたは画像。モデルによって異なる入力形式をサポートします。テキストの場合は文字列配列を直接提供し、マルチモーダルモデルの場合はテキストまたは画像フィールドを含むオブジェクト配列を提供できます。

embedding_format

string

デフォルト:"float"

返されるデータ型。オプション：

float：デフォルト。浮動小数点数配列を返します。最も一般的で使いやすい形式で、浮動小数点数のリストとして返されます。
binary_int8：int8でパックされたバイナリ形式を返します。より効率的なストレージ、検索、転送方法です。
binary_uint8：uint8でパックされたバイナリ形式を返します。より効率的なストレージ、検索、転送方法です。
base64：base64エンコードされた文字列を返します。より効率的な転送方法です。

dimensions

integer

デフォルト:"1024"

計算次元。オプション：

1024
768

1. マルチモーダルな使用法

curl https://aihubmix.com/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-***" \
  -d @- <<EOFEOF
  {
    "model": "jina-clip-v2",
    "input": [
        {
            "text": "A beautiful sunset over the beach"
        },
        {
            "text": "Un beau coucher de soleil sur la plage"
        },
        {
            "text": "海滩上美丽的日落"
        },
        {
            "text": "浜辺に沈む美しい夕日"
        },
        {
            "image": "https://i.ibb.co/nQNGqL0/beach1.jpg"
        },
        {
            "image": "https://i.ibb.co/r5w8hG8/beach2.jpg"
        },
        {
            "image": "R0lGODlhEAAQAMQAAORHHOVSKudfOulrSOp3WOyDZu6QdvCchPGolfO0o/XBs/fNwfjZ0frl3/zy7////wAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACH5BAkAABAALAAAAAAQABAAAAVVICSOZGlCQAosJ6mu7fiyZeKqNKToQGDsM8hBADgUXoGAiqhSvp5QAnQKGIgUhwFUYLCVDFCrKUE1lBavAViFIDlTImbKC5Gm2hB0SlBCBMQiB0UjIQA7"
        }
    ]
  }
EOFEOF

2. 純粋なテキストの使用法

テキスト文字列の配列を提供するだけで、imageフィールドを提供する必要はありません。

curl https://aihubmix.com/v1/rerank \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-***" \
  -d @- <<EOFEOF
  {
    "model": "jina-embeddings-v3",
    "input": [
        "A beautiful sunset over the beach",
        "Un beau coucher de soleil sur la plage",
        "海滩上美丽的日落",
        "浜辺に沈む美しい夕日"
    ]
  }
EOFEOF

二、再ランキング (Rerank)

再ランキングの目的は、検索関連性とRAGの精度を向上させることです。初期検索結果を詳細に分析し、クエリとドキュメントコンテンツ間の微妙な相互作用を考慮することで、検索結果を再配置し、最も関連性の高い結果を上位に表示します。

リクエストパラメータ

model

string

必須

モデル名。利用可能なモデルのリストは以下の通りです。

jina-reranker-m0：マルチモーダル多言語ドキュメント再ランキングツール、10Kコンテキスト、2.4Bパラメータ、視覚ドキュメントのソートに使用

query

string

必須

候補ドキュメントと比較するための検索クエリテキスト

top_n

integer

返される最も関連性の高いドキュメントの数。デフォルトではすべてのドキュメントが返されます。

documents

array

必須

クエリとの関連性に基づいて再ランキングされる候補ドキュメントの配列

max_chunk_per_doc

integer

デフォルト:"4096"

ドキュメントの最大チャンク長。Cohereにのみ適用され、Jinaには適用されません。デフォルト値は4096です。この長さを超える長いドキュメントは、指定されたトークン数に自動的に切り詰められます。

1. マルチモーダルな使用法

curl https://aihubmix.com/v1/rerank \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-***" \
  -d @- <<EOFEOF
  {
    "model": "jina-reranker-m0",
    "query": "small language model data extraction",
    "documents": [
        {
            "image": "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/handelsblatt-preview.png"
        },
        {
            "image": "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/paper-11.png"
        },
        {
            "image": "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/wired-preview.png"
        },
        {
            "text": "We present ReaderLM-v2, a compact 1.5 billion parameter language model designed for efficient web content extraction. Our model processes documents up to 512K tokens, transforming messy HTML into clean Markdown or JSON formats with high accuracy -- making it an ideal tool for grounding large language models. The models effectiveness results from two key innovations: (1) a three-stage data synthesis pipeline that generates high quality, diverse training data by iteratively drafting, refining, and critiquing web content extraction; and (2) a unified training framework combining continuous pre-training with multi-objective optimization. Intensive evaluation demonstrates that ReaderLM-v2 outperforms GPT-4o-2024-08-06 and other larger models by 15-20% on carefully curated benchmarks, particularly excelling at documents exceeding 100K tokens, while maintaining significantly lower computational requirements."
        },
        {
            "image": "https://jina.ai/blog-banner/using-deepseek-r1-reasoning-model-in-deepsearch.webp"
        },
        {
            "text": "データ抽出ですか？なぜ正規表現を使わないのですか？正規表現を使えばすべて解決するのではないでしょうか？"
        },
        {
            "text": "カリフォルニアのゴールドラッシュ中、一部の商人は、鉱夫が金を見つけるよりも、鉱夫に物資を売ることでより多くのお金を稼ぎました。"
        },
        {
            "text": "Die wichtigsten Beiträge unserer Arbeit sind zweifach: Erstens führen wir eine neuartige dreistufige Datensynthese-Pipeline namens Draft-Refine-Critique ein, die durch iterative Verfeinerung hochwertige Trainingsdaten generiert; und zweitens schlagen wir eine umfassende Trainingsstrategie vor, die kontinuierliches Vortraining zur Längener拡張、überwachtes Feintuning mit spezialisierten Kontrollpunkten、direkte Präferenzoptimierung (DPO) und iteratives Self-Play-Tuning kombiniert. Um die weitere Forschung und Anwendung der strukturierten Inhaltsextraktion zu erleichtern, ist das Modell auf Hugging Face öffentlich verfügbar."
        },
        {
            "image": "iVBORw0KGgoAAAANSUhEUgAAAMwAAADACAMAAAB/Pny7AAAA7VBMVEX///8AAABONC780K49Wv5gfYu8vLwiIiIAvNRHLypceJ5hfoc4Vf//1bL8/PxSbsCCgoLk5OQpKSlOQDXctpgZEA9AXv8SG0sGCRorHRocKnY4U+sKDQ7rwqISGBssOkE+Pj5fX19MY29ZdIF1YFGHcF68m4EjLTKSkpInOqIcJSndzbU9UFlcv87DyrvrzrF1wcpOTk6jo6OixsE7MCg4JSHLy8skNZLNqo4EBQ9kU0VZSj0uJh93d3cyMjKihnBvamZca3KoqbI8R5YaLI41R3omM1lNZ7EAAEEbIy46TGcwPk8jEQyIw8eZjobFTeMIAAAFHUlEQVR4nO3da0PaOhwG8CGOHqYwKqBjFKQ6sJt63Biy6Siw+/18/48zSP7FhqU5XNr04vP4igRCfmsX2jSFBw+2TTm0bN2V7ePkQooTt2SWvhGOxejHLZml3w4H0wYm5ACTWExIA0A8GNN+5c/YYn2pF7dNh7dX0YvpyP5hG8WdLdPgDdnAAANM6jD1dGMa10K2tXiYTp9HzxmBh9l6U8gxlI4JDDDAABNRyibLsFNnCRtzzZutc8x4yN8tqhG6cGDNQ4qwLV6KtGnYe1kHhagwRkif9StheAxggAEGmJRidmiyhj5vDjosoc+qa8JQ6sIWCn0CSiumCAwwwNxfzA5N+tQzgaE0gAEGGGBCU5hDFmfUYNFpCR/jjFkGWjdJVJgKb1DvJgEGGGCAiQXjzeEXpaVi6GJuUVrppRgrRnZ4cJ2TpeFhpLU5oaFYMEU5xgIGGGDuDybXEMMLB5Meyy11VKgcUSVlwkstek7oszPrYKS5bZVYurLKwduSPzVpCwnCvKuV8vMEYfJ3AQaYLGBc3uCvjTHVBGEKlXmcqWo BoxxT7bJMWry/va4kk5qIoeJRRBi6japg5IJXAMkx3RbLoqstWfJieGGtGhGGopwEDMDkS/mNUmolEbNpgAEmuxi+OoTmAKxB1Z8Jde2KR97vK1ktYSy6RUjTchNxaeWoV/OHht3z35fzvPxXannNKi/FSsIYfb5UM/Tlp3KMuOh1UBOO52lgPr/8h0WOeckrX0sxelc1/YWR9BcYYO43ZkeBGaUM482biHNB72hypZUujBcR86wlDMapx8h6CgwwwGQTQ3M12cCIVytSjskBAwww/4ORXqBMKWZo80hNSszVb9mchbIyaox3B+14bUz+6pxFPtd0LquMGkORf+2EGrN+gAEGmIRijANf2qnGlIcFf1wrVIx3gfbZSAtmKfRlbeFhhL1XN6YNDDDRY7L0f8ZZDM3B07MB/ZZmae2MXszQYStr/lNNnMstrZ4stKzRqPAMtWI8Ez8ukF/SCNihxLU+YjR9vZESI7/YFIAZAAMMMMuLGlRRYsZxYkyXzdxMxeUmyvSmdnCmcWJo6sZ0qyvHNVVJwJfRl23FrrMUOwH9Vcacro6JdU9aJcAkNaa9OsZOOqbssrvtO3T1oz4a+DKi5YJGhz3JTfoAQFM3Q9rbbsXDe7qzaUpPSjrGC52ydcXPfLqxIQk/AbJOPIx4OAZM/AEmqcniACAfmlOKkQeYGANMUgNMjFFORzjts8C0HeVLY8HYwkVnMcbJQ0VOVK/U+ysnC4xqT7pQYS5UrwQGGGASjaHfJbVz7XlokaPV9sdSj2ZLT/a3MMPo/N1Ts+KyS6fvT1iOeV/OToScqjCn4nPPuOWYP3rPGncrmn6yhdZoUn8vOOZY2X0l7ZhjaM885a1ruj7jrTeLFqP5x3SAASaS8CFzhrmZJToMa32GiXSENvk6xg8fP72Z5dNjns83rC9fvj7eMF+/sAZuPtNj3vrHD/zdotpABb4DfGresuzuz7P7/Akrfdrkj9fObvMpa+DJc2qQt978xt8t4ltOjpq7vhzeYTbMAnMolB6x0qjvnwEGGGCAAQYYYI... [truncated]"
        }
    ]
  }
EOFEOF

応答の説明

{
  "model": "jina-reranker-m0",
  "results": [
    {
      "index": 1,
      "relevance_score": 0.8814517277012487
    },
    {
      "index": 3,
      "relevance_score": 0.7756727858283531
    },
    {
      "index": 7,
      "relevance_score": 0.6128658982982312
    }
  ],
  "usage": {
    "total_tokens": 2894
  }
}

成功した応答には以下のフィールドが含まれます。

model: 使用されたモデル名
results: 関連性スコアの降順でソートされた再ランキング結果の配列。各要素には以下が含まれます。
- index: 元のドキュメント配列内のインデックス位置
- relevance_score: 0〜1の関連性スコア。高いほどクエリとの関連性が高いことを示します。
- total_tokens: このリクエストで処理された合計トークン数

2. テキストの使用法

テキストの再ランキングには多言語タスクと通常のタスクが含まれ、埋め込みの使用法と同様に配列を渡します。

curl https://aihubmix.com/v1/rerank \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-***" \
  -d @- <<EOFEOF
  {
    "model": "jina-reranker-v2-base-multilingual",
    "query": "Organic skincare products for sensitive skin",
    "top_n": 3,
    "documents": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "New makeup trends focus on bold colors and innovative techniques: Step into the world of cutting-edge beauty with this seasons makeup trends. Bold, vibrant colors and groundbreaking techniques are redefining the art of makeup. From neon eyeliners to holographic highlighters, unleash your creativity and make a statement with every look.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohる作用を持つアロエベラとカモミールを配合し、肌を自然にケアし保護します。肌の刺激にさようなら、輝く健康な肌にこんにちは。",
        "Neue Make-up-Trends setzen auf kräftige Farben und innovative Techniken: Tauchen Sie ein in die Welt der modernen Schönheit mit den neuesten Make-up-Trends. Kräftige, lebendige Farbenと革新的な技術 setzen neue Maßstäbe. Von auffälligen Eyelinern bis hin zu holografischen Highlightern – lassen Sie Ihrer Kreativität freien Lauf und setzen Sie jedes Mal ein Statement.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "Las nuevas tendencias de maquillaje se centran en colores vivos y técnicas innovadoras: Entra en el fascinante mundo del maquillaje con las tendencias más actuales. Colores vivos y técnicas innovadoras están revolucionando el arte del maquillaje. Desde delineadores neón hasta iluminadores holográficos, desata tu creatividad y destaca en cada look.",
        "针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。",
        "新しい化粧のトレンドは鮮やかな色と革新的な技術に焦点を当てています：今シーズンの化粧のトレンドは、大胆な色と革新的な技術が中心です。ネオンアイライナーからホログラフィックハイライターまで、あなたの創造性を解き放ち、あらゆるルックで主張しましょう。",
        "敏感肌のために特別に設計された天然有機スキンケア製品: アロエベラとカモミールのやさしい力で、自然の抱擁を感じてください。敏感肌用に特別に設計された私たちのスキンケア製品は、肌に優しく栄養を与え、保護します。肌トラブルにさようなら、輝く健康な肌にこんにちは。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF

三、ディープサーチ (DeepSearch)

DeepSearchは、検索、読み取り、推論の機能を組み合わせて、最適な回答が見つかるまで実行します。OpenAIのChat API形式と完全に互換性があり、api.openai.comをaihubmix.comに置き換えるだけで使用を開始できます。ストリーミング呼び出し(stream)は思考プロセスを返します。

リクエストパラメータ

model

string

必須

モデル名。利用可能なモデルのリスト：

jina-deepsearch-v1：デフォルトモデル。最適な回答が見つかるまで検索、読み取り、推論を実行します。

stream

boolean

デフォルト:"true"

ストリーミング応答を有効にするかどうか。DeepSearchリクエストは完了に時間がかかる場合があるため、このオプションを有効にしておくことを強くお勧めします。ストリーミングを無効にすると、「524タイムアウト」エラーが発生する可能性があります。

messages

array

必須

ユーザーとアシスタント間の会話メッセージのリスト。テキスト(.txt, .pdf)、画像(.png, .webp, .jpeg)など、複数のタイプ(モダリティ)のメッセージをサポートします。ファイルサイズは最大10MBまでサポートされます。

マルチモーダルメッセージ形式

DeepSearchは、純粋なテキスト(message)、ファイル(file)、画像(image)を含む複数のメッセージ形式をサポートしています。以下は異なる形式の例です。

1. 純粋なテキストメッセージ

{
  "role": "user",
  "content": "hi"
}

2. ファイル添付付きメッセージ

{
  "role": "user",
  "content": [
    {
      "type": "text",
      "text": "このファイルには何が入っていますか？"
    },
    {
      "type": "file",
      "data": "data:application/pdf;base64,JVBERi0xLjQKJfbk...", // PDFファイルのbase64エンコード
      "mimeType": "application/pdf"
    }
  ]
}

3. 画像付きメッセージ

{
  "role": "user",
  "content": [
    {
      "type": "text",
      "text": "画像には何が写っていますか？"
    },
    {
      "type": "image",
      "image": "data:image/webp;base64,UklGRoDOAAB...", // 画像のbase64エンコード
      "mimeType": "image/webp"
    }
  ]
}

すべてのファイルと画像は、データURI形式で事前にエンコードする必要があります。最大10MBまでサポートされます。

呼び出し例

Jina AI公式サイトのPythonストリーミング呼び出しは応答がないことに注意してください。当社の例を参照してください。

curl https://aihubmix.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-***" \
  -d @- <<EOFEOF
  {
    "model": "jina-deepsearch-v1",
    "messages": [
        {
            "role": "user",
            "content": "Hi!"
        },
        {
            "role": "assistant",
            "content": "Hi, how can I help you?"
        },
        {
            "role": "user",
            "content": "jina aiの最新のブログ記事は何ですか？"
        }
    ],
    "stream": true
  }
EOFEOF

応答の説明

DeepSearchの応答はデフォルトでストリーミングが有効になっており、推論ステップと最終的な回答が含まれます。最後のブロックには、最終的な回答、アクセスされたURL、およびトークンの使用状況が含まれます。ストリーミングを無効にすると、思考内容は出力されません。このオブジェクトはJina AIとは異なります。

{
  "id": "1745506101379",
  "object": "chat.completion.chunk",
  "created": 1745506101,
  "model": "jina-deepsearch-v1",
  "choices": [
    {
      "index": 0,
      "delta": {
        "role": "assistant",
        "reasoning_content": "<think>"
      }
    }
  ],
  "system_fingerprint": "fp_1745506101379"
}

// ストリーミング推論コンテンツ
{
  "id": "1745506101379",
  "object": "chat.completion.chunk",
  "created": 1745506101,
  "model": "jina-deepsearch-v1",
  "choices": [
    {
      "index": 0,
      "delta": {
        "reasoning_content": "推論内容の断片"
      }
    }
  ],
  "system_fingerprint": "fp_1745506101379"
}

// 推論終了
{
  "id": "1745506101379",
  "object": "chat.completion.chunk",
  "created": 1745506101,
  "model": "jina-deepsearch-v1",
  "choices": [
    {
      "index": 0,
      "delta": {
        "reasoning_content": "</think>\n\n"
      },
      "finish_reason": "thinking_end"
    }
  ],
  "system_fingerprint": "fp_1745506101379"
}

// 最終応答コンテンツ（コメントとURL参照を含む）
{
  "id": "1745506101379",
  "object": "chat.completion.chunk",
  "created": 1745506101,
  "model": "jina-deepsearch-v1",
  "choices": [
    {
      "index": 0,
      "delta": {
        "content": "応答内容",
        "type": "text",
        "annotations": [
          {
            "type": "url_citation",
            "url_citation": {
              "url": "https://example.com",
              "title": "ページタイトル",
              "start_index": 0,
              "end_index": 0
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "system_fingerprint": "fp_1745506101379",
  "usage": {
    "prompt_tokens": 673423,
    "completion_tokens": 109286,
    "total_tokens": 583555
  }
}

data: [DONE]

Python 戻り値の例：

Python

<think>Jina AIの最新のブログ記事について、最新の情報が必要なので確認する必要があります。Jina AIの最新のブログ記事を見つける必要があります。検索エンジンを使用してJina AIのブログを見つけ、最新の投稿を特定します。Jina AIの最新のブログ記事を検索して、さらに情報を収集します。よし、Jina AIの最新のブログ記事を見つけるためのクエリをいくつか作成しました。まず、過去1週間に更新されたJina AIブログの一般的な検索。次に、DeepSearchやニューラル検索などの特定のJina AI製品に焦点を当てたクエリで、過去1ヶ月間の更新を確認します。また、過去1ヶ月間の埋め込みモデルとAPIの更新に関するクエリも追加しました。そして、過去1年間のElasticsearch統合に関するクエリも追加しました。最後に、Jina AIの批判や制限を見つけるためのクエリを追加し、バランスの取れた視点を得るようにしました。Jina AI Elasticsearch統合、Jina AI批判制限、Jina AI DeepSearch更新、Jina AIニューラル検索、Jina AI埋め込みモデルを検索して、さらに情報を収集します。ユーザーのJina AIの最新のブログ記事に関する質問に正確に答えるには、提供されたURLにアクセスし、ブログ記事の公開日とタイトルを抽出する必要があります。これにより、最新のものを特定できます。検索アクション中に割り当てられた重みに基づいて、最も関連性の高いURLから始めます。https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch、https://jina.ai/news/auto-gpt-unmasked-hype-hard-truths-production-pitfalls、https://jinaai.cn/news/a-practical-guide-to-implementing-deepsearch-deepresearch、https://businesswire.com/news/home/20250220781575/en/Elasticsearch-Open-Inference-API-now-Supports-Jina-AI-Embeddings-and-Rerank-Model、https://gurufocus.com/news/2709507/elastic-nv-estc-enhances-elasticsearch-with-jina-ai-integrationを読んで、さらに情報を収集します。https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearchのコンテンツは... [省略]

より良い検索を絶え間なく追求することは、厳しい現実と向き合うことを要求します。つまり、サイズは重要であり、常に良い意味で重要であるとは限りません。Jina AIの最新のブログ記事「テキスト埋め込みのサイズバイアスとその検索への影響」は、2025年4月16日に公開され、この問題に正面から取り組んでいます。これは単なるコンテンツではありません。テキスト入力の長さが類似性指標をどのように歪め、検索システムが簡潔で正確な一致よりも冗長で、しばしば無関係なドキュメントを優先するようになるかを批判的に検証しています。

なぜ気にする必要があるのでしょうか？情報過多の時代において、関連性が重要だからです。私たちはデータに溺れており、検索エンジンは私たちの救命ボートです。しかし、それらの救命ボートが単なる量に簡単に騙されるアルゴリズムによって操縦されているとしたら、私たちは皆、船と一緒に沈んでしまいます。

この投稿は、テキスト埋め込みのメカニズム、つまり機械が意味を理解し比較できるようにするテキストの数値表現について掘り下げている可能性があります。Jina AIが指摘するように、核心的な問題は、これらの埋め込みが入力テキストの長さに影響される可能性があるという点であり、彼らはこの現象を「サイズバイアス」と呼んでいます。これは、たとえわずかに関連性があるだけでも、より長いドキュメントが、より短く、より焦点を絞ったドキュメントよりもクエリに類似しているように見える可能性があることを意味します。[1]

その影響を真に理解するために、以下を考慮してください。

*   **サイズバイアスとは？** サイズバイアスとは、テキスト入力の長さが意味的な関連性に関係なく類似性にどのように影響するかを指します。これは、検索システムが、クエリに対してより短く、より正確な一致ではなく、長く、ほとんど関連性のないドキュメントを返すことがある理由を説明しています。[2]
*   **誰が影響を受けるのか？** 学術論文をふるいにかける研究者から、顧客にとって最も関連性の高い情報を探し出そうとしている企業まで、セマンティック検索に依存している人は誰でも、サイズバイアスによって引き起こされる歪みに脆弱です。
*   **この問題はどこで現れるのか？** この問題は、特定の検索エンジンやプラットフォームに限定されません。多くのテキスト埋め込みモデルが設計および実装されている方法に固有のシステム的な課題です。
*   **いつからこれが喫緊の課題になったのか？** コンテキストウィンドウが拡大し、モデルがますます大きなドキュメントを取り込むにつれて、サイズバイアスの問題は増幅されます。
*   **なぜこれが起こるのか？** その理由は複雑ですが、高次元空間の数学的特性と、類似性が計算される方法に帰着します。長いベクトルは、意味的な整合性が弱くても、クエリベクトルと重なる「表面積」が単純に大きくなります。
*   **どうすればこれを修正できるのか？** Jina AIのブログ記事は、潜在的な緩和戦略を探求している可能性があります。これには、正規化技術、埋め込みモデルのアーキテクチャの変更、または長さに関連する歪みの影響を受けにくい新しい類似性指標が含まれる可能性があります。

Jina AIのここでの取り組みは、単なる学術的なものではありません。それは実践的な介入です。サイズバイアスを特定し分析することで、より正確で信頼性の高い検索技術への道を開いています。これは、情報検索からコンテンツ推奨、そしてそれ以降のすべてに影響を与える、現実世界への影響を及ぼします。

最新のブログ記事はこちらでご覧いただけます：https://jina.ai/news

最終的に、テキスト埋め込みに関する不都合な真実と向き合うというJina AIの意欲は、この分野を進歩させるという彼らのコミットメントの証です。それは、進歩とは単に大きく複雑なモデルを構築することだけではなく、それらのモデルのニュアンスと限界を理解し、何よりも精度と関連性を優先するソリューションを追求することであるということを思い出させてくれます。そして、それはサイズに依存しない真実であり、受け入れる価値があります。

[^1]: サイズバイアスとは、テキスト入力の長さが意味的な関連性に関係なく類似性にどのように影響するかを指します。これは、検索システムが、クエリに対してより短く、より正確な一致ではなく、長く、ほとんど関連性のないドキュメントを返すことがある理由を説明しています。[ニュースルーム - Jina AI](https://jina.ai/news)

[^2]: サイズバイアスとは、テキスト入力の長さが意味的な関連性に関係なく類似性にどのように影響するかを指します。これは、検索システムが、クエリに対してより短く、より正確な一致ではなく、長く、ほとんど関連性のないドキュメントを返すことがある理由を説明しています。[ニュースルーム - Jina AI](https://jina.ai/news?tag=tech-blog)
ストリーム終了。

四、ウェブ検索 (Search)

Jina AIのs.jina.aiをベースに、クエリを渡すだけで検索結果ページ (SERP) のクリーンな本文を返し、LLMのWeb接続Q&AやRAGにそのまま利用できます。エンドポイントはGETとPOSTの両方に対応しています。

レスポンス形式（デフォルトはmarkdown）：デフォルトでは連結されたmarkdownの結果リストを返し、そのままLLMに渡せます。構造化データ（各結果のtitle / url / contentとusage）が必要な場合は、リクエストヘッダーにAccept: application/jsonを追加するとJSONが返ります。

リクエストパラメータ

string

必須

クエリ文字列。コードから呼び出す際は先にURLエンコードが必要です。

num

integer

デフォルト:"5"

返す結果件数の上限。実際の件数は利用可能な結果数によります。

string

国 / 地域コード。例：US。

string

インターフェース言語。例：en。

site

string

指定サイト内に検索を限定します。複数回渡せます。例：site=jina.ai&site=github.com。

X-Respond-With

string

デフォルト:"markdown"

結果本文の形式。markdown / html / text のいずれか。

X-Retain-Images

string

画像の保持ポリシー。noneを渡すと画像を削除してトークンを節約できます。

X-No-Cache

boolean

キャッシュをスキップし、最新の結果を取得します。

さらに、検索は各ヒット結果に対してReaderを呼び出して本文を抽出するため、「五、ウェブリーダー (Reader)」に記載された本文形式を制御する各種X-*リクエストヘッダーは、検索結果にも同様に適用されます。

呼び出し例

クエリとパラメータは、URLクエリパラメータとしてGET（推奨、最も簡潔）で渡すことも、JSONリクエストボディとしてPOSTで渡すこともできます。どちらも同じエンドポイントに送られ、同じ結果を返します。以下の例はデフォルトでAccept: application/jsonを付けてJSONを返します。このヘッダーを外すとクリーンなmarkdownの結果リストが返ります（最初のCurl-markdownの例を参照）。

# Acceptヘッダーなし → 連結されたmarkdownの結果リストを返す
curl "https://aihubmix.com/v1/jina/search?q=AIHubMix&num=5&gl=US&hl=en" \
  -H "Authorization: Bearer sk-***"

応答の説明

デフォルト（Acceptなし）では連結されたmarkdownリストを返し、各エントリはタイトル、ソースリンク、説明（あれば）、本文の順に示されます：

[1] Title: AIHubMix - One Interface, Router All LLMs
[1] URL Source: https://aihubmix.com/?lang=en
[1] Description: Access every major LLM through a single, unified interface. Connect to ChatGPT, Claude, Gemini, DeepSeek and more.
[1] Content:
If requests to http://aihubmix.com fail, you can try using a VPN, or switch to the alternative baseURL: https://api.inferera.com …

[2] Title: AI Models & Pricing - AIHubMix
[2] URL Source: https://aihubmix.com/models?lang=en
[2] Content:
…

Accept: application/jsonを付けると構造化JSONを返します：

{
  "code": 200,
  "status": 200,
  "data": [
    {
      "title": "AIHubMix - One Interface, Router All LLMs",
      "url": "https://aihubmix.com/?lang=en",
      "content": "If requests to http://aihubmix.com fail, you can try using a VPN, or switch to the alternative …",
      "usage": { "tokens": 4244 }
    },
    {
      "title": "AI Models & Pricing - AIHubMix",
      "url": "https://aihubmix.com/models?lang=en",
      "content": "…",
      "usage": { "tokens": 4303 }
    }
  ]
}

data：検索結果の配列（件数はnumで制御。上記の例は5件返しますが、ここでは先頭2件のみ表示。contentは完全な本文で、例では省略）。各要素にtitle、url、content、usage.tokensを含みます。
課金：各結果のusage.tokensの合計で課金されます。Jina公式は1回の検索につき最低10000トークンから課金するため、最終的には両者の大きい方、すなわちmax(10000, トークン合計)で課金されます。

五、ウェブリーダー (Reader)

Jina AIのr.jina.aiをベースに、任意のURLを渡すだけで変換後のクリーンなmarkdown本文を返し、Webコンテンツを取得してLLMに渡すのに便利です。Webページのほか、画像（ビジョンモデルによる説明を生成）やローカルファイル（PDF、Word / Excel / PPT、HTML、画像）の解析にも対応しています。

レスポンス形式（デフォルトはmarkdown）：デフォルトではクリーンなmarkdown本文を直接返し、そのままLLMに渡せます。usage使用量やtitle / urlなどのフィールドを含む構造化JSON（本文はdata.contentにあります）が必要な場合は、リクエストヘッダーにAccept: application/jsonを追加してください。

リクエストパラメータ

対象URL

string

必須

読み取るWebアドレス。エンドポイントパスの末尾に直接連結します。例：/v1/jina/reader/https://jina.ai。

file

アップロードするローカルファイル。PDF、Word / Excel / PPT、HTML、画像に対応。POSTでmultipart/form-dataとしてfileフィールドに渡します。

url

string

HTMLファイルをアップロードする際は必須。ページ内の相対リンクを解決するための参照アドレスとして使用します。PDFのアップロード時は不要です。

X-Respond-With

string

デフォルト:"markdown"

返却形式。markdown / html / text / screenshot / pageshot のいずれか。

X-Retain-Images

string

デフォルト:"all"

画像の保持ポリシー。all / none（画像を削除してトークンを節約）/ alt のいずれか。

X-Retain-Links

string

デフォルト:"all"

リンクの保持ポリシー。all / none / text のいずれか。

X-With-Generated-Alt

boolean

altのない画像に説明テキストを自動生成します。

X-With-Links-Summary

boolean

本文の末尾にすべてのリンクをまとめます。

X-With-Images-Summary

boolean

本文の末尾にすべての画像をまとめます。

X-Engine

string

取得エンジン。browser / direct / cf-browser-rendering のいずれか。

X-Target-Selector

string

CSSセレクタ。一致するページ領域のみを抽出します。

X-Remove-Selector

string

CSSセレクタ。一致する要素を削除します（例：header, footer, nav）。

X-Timeout

integer

取得のタイムアウト（秒）。最大180。

X-No-Cache

boolean

キャッシュをスキップし、最新を取得します。

X-Md-Heading-Style

string

デフォルト:"atx"

markdown見出しスタイル。atx（#）/ setext（下線）のいずれか。

X-Md-Bullet-List-Marker

string

markdown箇条書きマーカー。- / + / * のいずれか。

X-Md-Hr

string

markdown水平線スタイル。例：***。

X-Md-Link-Style

string

markdownリンクスタイル。inlined / referenced / discarded のいずれか。

上記は一般的な項目のみです。JinaがサポートするすべてのX-*リクエストヘッダー（X-Md-*シリーズ全体を含む）およびPOSTリクエストボディフィールド（スクリプト注入injectPageScriptなど）は、ゲートウェイによってそのまま転送されます。完全なリストと値はJina公式ドキュメントを参照してください。

マルチモーダル入力形式

Readerは3種類の入力に対応しています。Webページと画像はエンドポイントパスの末尾に直接連結します（GET）。ローカルファイルはPOSTでmultipart/form-dataとしてアップロードします。

1. WebページURL

GET /v1/jina/reader/https://example.com

2. 画像URL（視覚的な説明を返す）

画像アドレスも同様にパスの末尾に連結します。Readerはビジョンモデルを使って画像の説明（キャプション、逐語的なOCRではありません）を生成し、contentに格納します。

GET /v1/jina/reader/https://www.google.com/images/branding/googlelogo/2x/googlelogo_color_272x92dp.png

3. ローカルファイルのアップロード（PDF / Word·Excel·PPT / HTML / 画像）

POST /v1/jina/reader
Content-Type: multipart/form-data

file=@./doc.pdf              # ファイルをfileフィールドに入れる
url=https://example.com/...  # HTMLアップロード時のみ必要。相対リンク解決用の参照アドレス

呼び出し例

デフォルトではmarkdown本文を直接返します。Accept: application/jsonを付けると構造化JSONを返します。オプションのパラメータはX-*リクエストヘッダーとして渡し、すべてゲートウェイによってそのままJinaへ転送されます（完全なリストは上記「リクエストパラメータ」を参照）。

1. Webページを読み取る

# Acceptなし → クリーンなmarkdown本文を直接返す
curl "https://aihubmix.com/v1/jina/reader/https://example.com" \
  -H "Authorization: Bearer sk-***"

2. 画像を読み取る

Curl

curl "https://aihubmix.com/v1/jina/reader/https://www.google.com/images/branding/googlelogo/2x/googlelogo_color_272x92dp.png" \
  -H "Authorization: Bearer sk-***" \
  -H "Accept: application/json"

3. ローカルファイルのアップロード

POST + multipart/form-dataでアップロードします。HTMLをアップロードする際は、参照アドレスとしてurlフィールドも追加する必要があります。課金はURL読み取りと同じです。

curl -X POST "https://aihubmix.com/v1/jina/reader" \
  -H "Authorization: Bearer sk-***" \
  -H "Accept: application/json" \
  -F "file=@./doc.pdf"

応答の説明

デフォルト（Acceptなし）ではmarkdown本文を直接返します（すなわち下記JSONのdata.contentの内容）。例えばhttps://example.comを読み取る場合：

This domain is for use in documentation examples without needing permission. Avoid use in operations.

[Learn more](https://iana.org/domains/example)

Accept: application/jsonを付けると構造化JSONを返します。JSONの構造は3種類の入力すべてで同じです：dataは単一のオブジェクトで、title / url / content / usage.tokensを含みます。以下は3種類の入力の実際の返却です（contentが長すぎる場合は先頭を残し、残りは…で省略）。 ① Webページを読み取る（https://example.comを読み取り）：

{
  "code": 200,
  "status": 20000,
  "data": {
    "title": "Example Domain",
    "url": "https://example.com/",
    "content": "This domain is for use in documentation examples without needing permission. Avoid use in operations.\n\n[Learn more](https://iana.org/domains/example)",
    "usage": { "tokens": 29 }
  }
}

② 画像を読み取る（contentはビジョンモデルが生成した説明）：

{
  "code": 200,
  "status": 20000,
  "data": {
    "title": "googlelogo_color_272x92dp.png",
    "url": "https://www.google.com/images/branding/googlelogo/2x/googlelogo_color_272x92dp.png",
    "content": "The logo for Google, consisting of the word Google in lowercase letters, with its colors being blue, red, yellow, and green, representing the company's innovative approach to information and computing services",
    "usage": { "tokens": 38 }
  }
}

③ ローカルファイルのアップロード（PDF論文をアップロード。contentは長いため先頭のみ表示）：

{
  "code": 200,
  "status": 20000,
  "data": {
    "title": "Unnoticeable Backdoor Attacks on Graph Neural Networks",
    "url": "blob:df586d587956e0ca72e50e9e12dc06fc44b7c4b480b8a640a6db7d6f488a7c91",
    "content": "# Unnoticeable Backdoor Attacks on Graph Neural Networks\n\n# Enyan Dai ∗\n\nemd5759@psu.edu\n\nThe Pennsylvania State University\n\nState College, USA\n\n## ABSTRACT\n\nGraph Neural Networks (GNNs) have achieved promising results in various tasks such as node classification and graph classification. …",
    "usage": { "tokens": 20535 }
  }
}

status：Jinaが上流で返すビジネスステータスコード。reader成功時は20000（外側のHTTP 200と一致）。
課金：data.usage.tokens（実際の出力トークン数）で課金され、起点価格はありません（検索の「1回あたり10000トークンから」とは異なります）。内容が極端に短い場合は最低課金単位を下限として適用するため、課金がゼロになることはありません。

最終更新日：2026-07-03

​説明

​クイックガイド

​一、ベクトル埋め込み (Embeddings)

​リクエストパラメータ

​1. マルチモーダルな使用法

​2. 純粋なテキストの使用法

​二、再ランキング (Rerank)

​リクエストパラメータ

​1. マルチモーダルな使用法

​応答の説明

​2. テキストの使用法

​三、ディープサーチ (DeepSearch)

​リクエストパラメータ

​マルチモーダルメッセージ形式

​1. 純粋なテキストメッセージ

​2. ファイル添付付きメッセージ

​3. 画像付きメッセージ

​呼び出し例

​応答の説明

​四、ウェブ検索 (Search)

​リクエストパラメータ

​呼び出し例

​応答の説明

​五、ウェブリーダー (Reader)

​リクエストパラメータ

​マルチモーダル入力形式

​1. WebページURL

​2. 画像URL（視覚的な説明を返す）

​3. ローカルファイルのアップロード（PDF / Word·Excel·PPT / HTML / 画像）

​呼び出し例

​1. Webページを読み取る

​2. 画像を読み取る

​3. ローカルファイルのアップロード

​応答の説明

説明

クイックガイド

一、ベクトル埋め込み (Embeddings)

リクエストパラメータ

1. マルチモーダルな使用法

2. 純粋なテキストの使用法

二、再ランキング (Rerank)

リクエストパラメータ

1. マルチモーダルな使用法

応答の説明

2. テキストの使用法

三、ディープサーチ (DeepSearch)

リクエストパラメータ

マルチモーダルメッセージ形式

1. 純粋なテキストメッセージ

2. ファイル添付付きメッセージ

3. 画像付きメッセージ

呼び出し例

応答の説明

四、ウェブ検索 (Search)

リクエストパラメータ

呼び出し例

応答の説明

五、ウェブリーダー (Reader)

リクエストパラメータ

マルチモーダル入力形式

1. WebページURL

2. 画像URL（視覚的な説明を返す）

3. ローカルファイルのアップロード（PDF / Word·Excel·PPT / HTML / 画像）

呼び出し例

1. Webページを読み取る

2. 画像を読み取る

3. ローカルファイルのアップロード

応答の説明