Documentation Index
Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
Use this file to discover all available pages before exploring further.
接口信息
-
Endpoint (API 地址):
https://aihubmix.com/v1/moderations -
请求方式:
POST -
认证方式:
Authorization: Bearer <AIHUBMIX_API_KEY> -
Content-Type:
application/json -
此端点可以使用两种模型:
-
omni-moderation-latest:该模型和所有快照均支持更多分类选项和多模态输入 -
text-moderation-latest: 仅支持文本输入,且输入分类较少
-
快速入门
使用示例
输出示例
以下是一个完整的输出示例,该模型能够正确预测图像中的自残和暴力元素。| 输出类别 | 描述 |
|---|---|
flagged | 如果模型将内容判定为可能存在潜在风险或违规,则该值为 true;否则为 false。 |
categories | 包含一个按类别划分的违规标记字典。对于每一个类别,如果模型认为该类别存在违规行为,则对应的值为true,否则为false |
category_scores | 包含一个按类别划分的评分字典,用于表示模型判断输入内容违反 OpenAI 相关政策的置信度。取值范围为 0 到 1,数值越高表示模型对该类别违规判断的置信度越高。 |
category_applied_input_types | 该字段用于说明在每个违规类别中,哪些输入类型被判定为违规。例如:如果模型同时判定图像输入和文本输入在 “violence/graphic(暴力/血腥)” 类别下存在问题,则 violence/graphic 对应的值将为 ["image", "text"]。⚠️ 该字段仅在 omni 系列模型中提供。 |
内容分类
下表描述了审核 API 可以检测到的内容类型,以及每个类别支持的模型和输入类型。| 类别 | 描述 | 模型 | 输入 |
|---|---|---|---|
harassment | 表达、煽动或宣扬针对任何目标的骚扰性语言的内容。 | 全部 | 纯文本 |
harassment/threatening | 包含暴力或对任何目标造成严重伤害的骚扰内容。 | 全部 | 纯文本 |
hate | 表达、煽动或宣扬基于种族、性别、民族、宗教、国籍、性取向、残疾状况或种姓的仇恨的内容。针对非受保护群体(例如,国际象棋棋手)的仇恨内容构成骚扰。 | 全部 | 纯文本 |
hate/threatening | 仇恨内容,包括基于种族、性别、民族、宗教、国籍、性取向、残疾状况或种姓而对目标群体实施的暴力或严重伤害。 | 全部 | 纯文本 |
illicit | 提供如何实施非法行为的建议或指导的内容。例如,“如何入店行窃”就属于此类。 | 仅限 Omni | 纯文本 |
illicit/violent | 与该类别标记的内容类型相同illicit,但还包括提及暴力或获取武器。 | 仅限 Omni | 纯文本 |
self-harm | 宣扬、鼓励或描绘自残行为(例如自杀、割伤和饮食失调)的内容。 | 全部 | 文字和图片 |
self-harm/intent | 内容中,说话者表达了他们正在或打算进行自残行为,例如自杀、割伤和饮食失调。 | 全部 | 文字和图片 |
self-harm/instructions | 鼓励实施自残行为(如自杀、割伤、饮食失调)的内容,或者提供如何实施此类行为的指导或建议的内容。 | 全部 | 文字和图片 |
sexual | 旨在引起性兴奋的内容,例如对性行为的描述,或宣传性服务的内容(不包括性教育和健康)。 | 全部 | 文字和图片 |
sexual/minors | 包含未满 18 岁人士的性内容。 | 全部 | 纯文本 |
violence | 包含死亡、暴力或身体伤害的内容。 | 全部 | 文字和图片 |
violence/graphic | 包含对死亡、暴力或身体伤害进行详细描述的内容。 | 全部 | 文字和图片 |