双子星漫游指南:关于本站的 Gemini 调用细节,在此汇总。
pip install google-genai
或 pip install -U google-genai
,安装(更新)原生依赖。
1️⃣ 对于原生调用,我们的 Gemini 调用支持 AI Studio 和 VertexAI 自动路由。转发方法主要是在内部传入 AiHubMix 密钥和请求链接。需要注意的是,这个链接和常规的 base_url
写法不同,请参考示例:
v1
端点:
include_thoughts=True
reasoning_effort
thinking_budget
控制推理预算来达到最佳效果。gemini-2.5-flash-preview-04-17
即可。budget
(思考预算)来控制思考的深度,范围 0-16K,目前转发采用的是默认预算 1024,最佳边际效果为 16K。inline_data
上传。upload_url
。
EDIARESOLUTION_MEDIUM
参数来约束图片的精度,从而大幅节省输入的费用以及减少大图报错的可能性。支持的媒体分辨率参数值:参数名 | 备注 |
---|---|
MEDIA_RESOLUTION_UNSPECIFIED | 媒体分辨率未指定 |
MEDIA_RESOLUTION_LOW | 媒体分辨率设为 low (64 tokens). |
MEDIA_RESOLUTION_MEDIUM | 媒体分辨率设为 medium (256 tokens). |
MEDIA_RESOLUTION_HIGH | 媒体分辨率设为 high (zoomed reframing with 256 tokens). |
generate_content
请求,系统会自动为输入内容建立缓存。当后续请求与此前内容完全一致时,将直接命中缓存,返回上一次的推理结果,大幅提升响应速度并有机会节省 token 消耗。
response.usage_metadata
中会包含 cache_tokens_details
字段,并有 cached_content_token_count
,开发者可以据此判断本次请求是否命中缓存。命中缓存时,核心结论:隐式缓存支持自动命中与命中反馈。开发者可以通过 usage_metadata 判断命中情况。成本节省非保证,实际效果因请求结构和使用场景而异。response.usage_metadata
会包含如下结构:
tool_choice="auto"
,否则会报错。
usage_metadata
来追踪使用的 token,其中的字段对应如下:.usage
来追踪,字段对应如下: