Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

Información de la API

  • Endpoint: https://aihubmix.com/v1/moderations
  • Método de solicitud: POST
  • Autenticación: Authorization: Bearer <AIHUBMIX_API_KEY>
  • Content-Type: application/json
  • Este endpoint admite dos modelos:
    1. omni-moderation-latest: Este modelo y todas sus instantáneas admiten más opciones de clasificación y entrada multimodal.
    2. text-moderation-latest: Admite solo entrada de texto, con menos opciones de clasificación.

Inicio rápido

Ejemplo de uso

import openai

client = openai.OpenAI(
  api_key="AIHUBMIX_API_KEY",  
  base_url="https://aihubmix.com/v1"
)

response = client.moderations.create(
    model="text-moderation-latest",
    input="The Yangtze River rolls eastward, its waves washing away heroes. Right and wrong, success and failure, all seem empty; the green hills remain, though the sun sets many times. The white-haired fisherman and woodcutter on the riverbank, accustomed to watching the autumn moon and spring breeze. A pot of turbid wine brings joy in meeting, how many events through time are all laughed off.",
)

print(response)

Ejemplo de salida

A continuación, un ejemplo completo de salida, donde el modelo predice correctamente los elementos de autolesión y violencia en la imagen.
{
  "id": "modr-5175",
  "model": "omni-moderation-latest",
  "results": [
    {
      "flagged": true,

      "categories": {
        "harassment": false,
        "harassment_threatening": false,
        "hate": false,
        "hate_threatening": false,
        "illicit": false,
        "illicit_violent": false,

        "self_harm": true,
        "self_harm_instructions": false,
        "self_harm_intent": false,

        "sexual": false,
        "sexual_minors": false,

        "violence": true,
        "violence_graphic": true
      },

      "category_applied_input_types": {
        "harassment": ["text"],
        "harassment_threatening": ["text"],
        "hate": ["text"],
        "hate_threatening": ["text"],
        "illicit": ["text"],
        "illicit_violent": ["text"],

        "self_harm": ["text", "image"],
        "self_harm_instructions": ["text", "image"],
        "self_harm_intent": ["text", "image"],

        "sexual": ["text", "image"],
        "sexual_minors": ["text"],

        "violence": ["text", "image"],
        "violence_graphic": ["text", "image"]
      },

      "category_scores": {
        "harassment": 0.00507676338091392,
        "harassment_threatening": 0.0008967480822931635,
        "hate": 8.830458477845481e-05,
        "hate_threatening": 1.0720880092159908e-05,
        "illicit": 3.740956047302422e-05,
        "illicit_violent": 2.868540823874629e-05,

        "self_harm": 0.6967791744783793,
        "self_harm_instructions": 0.00027978227581033677,
        "self_harm_intent": 0.0003781080988395418,

        "sexual": 0.0007007652612809208,
        "sexual_minors": 2.5071593847983196e-06,

        "violence": 0.5236158587905301,
        "violence_graphic": 0.4213528687243541
      }
    }
  ]
}
El resultado de salida incluye varias categorías en la respuesta JSON, que te informan sobre los tipos de contenido presentes en la entrada (si los hay) y hasta qué punto el modelo cree que están presentes.
Categoría de salidaDescripción
flaggedSe establece en true si el modelo clasifica el contenido como potencialmente dañino; false en caso contrario.
categoriesContiene un diccionario de indicadores de infracción por categoría. Para cada categoría, el valor es true si el modelo marca la categoría correspondiente como infringida, false en caso contrario.
category_scoresContiene un diccionario con las puntuaciones por categoría generadas por el modelo, que indican la confianza del modelo en que la entrada infringe la política de OpenAI para esa categoría. El valor está entre 0 y 1, donde los valores más altos indican mayor confianza.
category_applied_input_typesEsta propiedad contiene información sobre qué tipos de entrada se marcaron en la respuesta, para cada categoría. Por ejemplo, si tanto la entrada de imagen como la de texto se marcan por “violence/graphic”, la propiedad violence/graphic será ["image", "text"]. Solo está disponible en modelos omni.

Categorías de contenido

La tabla siguiente describe los tipos de contenido que la API de moderación puede detectar, junto con los modelos y tipos de entrada admitidos para cada categoría.
Las categorías marcadas como “solo texto” no admiten entrada de imagen. Si envías solo imágenes al modelo (sin texto) usando omni-moderation-latest, el modelo devolverá una puntuación de 0 para esas categorías no admitidas.
CategoríaDescripciónModeloEntrada
harassmentContenido que expresa, incita o promueve lenguaje de acoso hacia cualquier objetivo.TodosSolo texto
harassment/threateningContenido de acoso que además incluye violencia o daño grave hacia cualquier objetivo.TodosSolo texto
hateContenido que expresa, incita o promueve odio basado en raza, género, etnia, religión, nacionalidad, orientación sexual, discapacidad o casta. El contenido odioso dirigido a grupos no protegidos (p. ej., jugadores de ajedrez) es acoso.TodosSolo texto
hate/threateningContenido odioso que además incluye violencia o daño grave hacia el grupo objetivo basado en raza, género, etnia, religión, nacionalidad, orientación sexual, discapacidad o casta.TodosSolo texto
illicitLos mismos tipos de contenido marcados por la categoría illicit, pero que también incluyen referencias a violencia o a conseguir un arma.Solo OmniSolo texto
illicit/violentSimilar al tipo de contenido marcado como illicit, pero que también incluye menciones a la violencia o a la obtención de armas.Solo OmniSolo texto
self-harmContenido que promueve, fomenta o representa actos de autolesión, como el suicidio, los cortes o los trastornos alimentarios.TodosTexto e imágenes
self-harm/intentContenido en el que el hablante expresa que participa o tiene la intención de participar en actos de autolesión, como suicidio, cortes y trastornos alimentarios.TodosTexto e imágenes
self-harm/instructionsContenido que fomenta la realización de actos de autolesión, como el suicidio, los cortes y los trastornos alimentarios, o que da instrucciones o consejos sobre cómo cometer dichos actos.TodosTexto e imágenes
sexualContenido destinado a despertar excitación sexual, como la descripción de actividad sexual, o que promueve servicios sexuales (excluyendo la educación sexual y el bienestar).TodosTexto e imágenes
sexual/minorsContenido sexual que incluye a una persona menor de 18 años.TodosSolo texto
violenceContenido que representa muerte, violencia o lesiones físicas.TodosTexto e imágenes
violence/graphicContenido que representa muerte, violencia o lesiones físicas con detalles gráficos.TodosTexto e imágenes

Última actualización: 2026-06-01