AiHubMix Documentation Hub

Información de la API

Endpoint: https://aihubmix.com/v1/moderations
Método de solicitud: POST
Autenticación: Authorization: Bearer <AIHUBMIX_API_KEY>
Content-Type: application/json
Este endpoint admite dos modelos:
1. omni-moderation-latest: Este modelo y todas sus instantáneas admiten más opciones de clasificación y entrada multimodal.
2. text-moderation-latest: Admite solo entrada de texto, con menos opciones de clasificación.

Inicio rápido

Ejemplo de uso

import openai

client = openai.OpenAI(
  api_key="AIHUBMIX_API_KEY",  
  base_url="https://aihubmix.com/v1"
)

response = client.moderations.create(
    model="text-moderation-latest",
    input="The Yangtze River rolls eastward, its waves washing away heroes. Right and wrong, success and failure, all seem empty; the green hills remain, though the sun sets many times. The white-haired fisherman and woodcutter on the riverbank, accustomed to watching the autumn moon and spring breeze. A pot of turbid wine brings joy in meeting, how many events through time are all laughed off.",
)

print(response)

import openai

client = openai.OpenAI(
  api_key="AIHUBMIX_API_KEY", 
  base_url="https://aihubmix.com/v1"
)

response = client.moderations.create(
    model="omni-moderation-latest",
    input=[
        {"type": "text", "text": "The image depicts a male, with his arms raised, body tense, head tilted back, mouth open, showing extreme agitation or anger."},
        {
            "type": "image_url",
            "image_url": {
                "url": "https://thumbs.dreamstime.com/b/violent-man-furious-straining-arms-looking-up-concept-person-35012557.jpg",
                # can also use base64 encoded image URLs
                # "url": "data:image/jpeg;base64,abcdefg..."
            }
        },
    ],
)

print(response)

Ejemplo de salida

A continuación, un ejemplo completo de salida, donde el modelo predice correctamente los elementos de autolesión y violencia en la imagen.

{
  "id": "modr-5175",
  "model": "omni-moderation-latest",
  "results": [
    {
      "flagged": true,

      "categories": {
        "harassment": false,
        "harassment_threatening": false,
        "hate": false,
        "hate_threatening": false,
        "illicit": false,
        "illicit_violent": false,

        "self_harm": true,
        "self_harm_instructions": false,
        "self_harm_intent": false,

        "sexual": false,
        "sexual_minors": false,

        "violence": true,
        "violence_graphic": true
      },

      "category_applied_input_types": {
        "harassment": ["text"],
        "harassment_threatening": ["text"],
        "hate": ["text"],
        "hate_threatening": ["text"],
        "illicit": ["text"],
        "illicit_violent": ["text"],

        "self_harm": ["text", "image"],
        "self_harm_instructions": ["text", "image"],
        "self_harm_intent": ["text", "image"],

        "sexual": ["text", "image"],
        "sexual_minors": ["text"],

        "violence": ["text", "image"],
        "violence_graphic": ["text", "image"]
      },

      "category_scores": {
        "harassment": 0.00507676338091392,
        "harassment_threatening": 0.0008967480822931635,
        "hate": 8.830458477845481e-05,
        "hate_threatening": 1.0720880092159908e-05,
        "illicit": 3.740956047302422e-05,
        "illicit_violent": 2.868540823874629e-05,

        "self_harm": 0.6967791744783793,
        "self_harm_instructions": 0.00027978227581033677,
        "self_harm_intent": 0.0003781080988395418,

        "sexual": 0.0007007652612809208,
        "sexual_minors": 2.5071593847983196e-06,

        "violence": 0.5236158587905301,
        "violence_graphic": 0.4213528687243541
      }
    }
  ]
}

El resultado de salida incluye varias categorías en la respuesta JSON, que te informan sobre los tipos de contenido presentes en la entrada (si los hay) y hasta qué punto el modelo cree que están presentes.

Categoría de salida	Descripción
`flagged`	Se establece en `true` si el modelo clasifica el contenido como potencialmente dañino; `false` en caso contrario.
`categories`	Contiene un diccionario de indicadores de infracción por categoría. Para cada categoría, el valor es `true` si el modelo marca la categoría correspondiente como infringida, `false` en caso contrario.
`category_scores`	Contiene un diccionario con las puntuaciones por categoría generadas por el modelo, que indican la confianza del modelo en que la entrada infringe la política de OpenAI para esa categoría. El valor está entre 0 y 1, donde los valores más altos indican mayor confianza.
`category_applied_input_types`	Esta propiedad contiene información sobre qué tipos de entrada se marcaron en la respuesta, para cada categoría. Por ejemplo, si tanto la entrada de imagen como la de texto se marcan por “violence/graphic”, la propiedad `violence/graphic` será `["image", "text"]`. Solo está disponible en modelos omni.

Categorías de contenido

La tabla siguiente describe los tipos de contenido que la API de moderación puede detectar, junto con los modelos y tipos de entrada admitidos para cada categoría.

Las categorías marcadas como “solo texto” no admiten entrada de imagen. Si envías solo imágenes al modelo (sin texto) usando omni-moderation-latest, el modelo devolverá una puntuación de 0 para esas categorías no admitidas.

Categoría	Descripción	Modelo	Entrada
`harassment`	Contenido que expresa, incita o promueve lenguaje de acoso hacia cualquier objetivo.	Todos	Solo texto
`harassment/threatening`	Contenido de acoso que además incluye violencia o daño grave hacia cualquier objetivo.	Todos	Solo texto
`hate`	Contenido que expresa, incita o promueve odio basado en raza, género, etnia, religión, nacionalidad, orientación sexual, discapacidad o casta. El contenido odioso dirigido a grupos no protegidos (p. ej., jugadores de ajedrez) es acoso.	Todos	Solo texto
`hate/threatening`	Contenido odioso que además incluye violencia o daño grave hacia el grupo objetivo basado en raza, género, etnia, religión, nacionalidad, orientación sexual, discapacidad o casta.	Todos	Solo texto
`illicit`	Los mismos tipos de contenido marcados por la categoría `illicit`, pero que también incluyen referencias a violencia o a conseguir un arma.	Solo Omni	Solo texto
`illicit/violent`	Similar al tipo de contenido marcado como `illicit`, pero que también incluye menciones a la violencia o a la obtención de armas.	Solo Omni	Solo texto
`self-harm`	Contenido que promueve, fomenta o representa actos de autolesión, como el suicidio, los cortes o los trastornos alimentarios.	Todos	Texto e imágenes
`self-harm/intent`	Contenido en el que el hablante expresa que participa o tiene la intención de participar en actos de autolesión, como suicidio, cortes y trastornos alimentarios.	Todos	Texto e imágenes
`self-harm/instructions`	Contenido que fomenta la realización de actos de autolesión, como el suicidio, los cortes y los trastornos alimentarios, o que da instrucciones o consejos sobre cómo cometer dichos actos.	Todos	Texto e imágenes
`sexual`	Contenido destinado a despertar excitación sexual, como la descripción de actividad sexual, o que promueve servicios sexuales (excluyendo la educación sexual y el bienestar).	Todos	Texto e imágenes
`sexual/minors`	Contenido sexual que incluye a una persona menor de 18 años.	Todos	Solo texto
`violence`	Contenido que representa muerte, violencia o lesiones físicas.	Todos	Texto e imágenes
`violence/graphic`	Contenido que representa muerte, violencia o lesiones físicas con detalles gráficos.	Todos	Texto e imágenes

Última actualización: 2026-06-01

Empezar

Funciones de gateway

Capacidades del modelo

Referencia de protocolo

Gestión de plataforma

Privacidad y términos

Moderación

Información de la API

Inicio rápido

Ejemplo de uso

Ejemplo de salida

Categorías de contenido

​Información de la API

​Inicio rápido

​Ejemplo de uso

​Ejemplo de salida

​Categorías de contenido

Información de la API

Inicio rápido

Ejemplo de uso

Ejemplo de salida

Categorías de contenido