Idioma
Español
POST

Create a chat completion

Completado de chat. Los modelos GPT-5.4 priorizan el razonamiento: usa reasoning_effort para la profundidad (ej. none, low, medium, high, xhigh—los valores varían por modelo), verbosity para la extensión de la respuesta, y max_completion_tokens para el total de tokens generados (incluyendo razonamiento).

Autenticación

Autentíquese usando un Bearer Token en el encabezado de la solicitud. Puede generar una clave en la página de API Keys en la consola.
AuthorizationstringRequired

Formato: Bearer $HY_API_KEY.

Headers

Al enviar solicitudes POST, especifique el tipo de contenido (la mayoría de clientes HTTP y SDKs lo manejan automáticamente).
Content-TypestringOptional

Generalmente application/json.

Solicitud

Este endpoint acepta un objeto JSON como cuerpo de la solicitud.
modelstringRequired

ID del modelo, ej. gpt-5.3-chat, gpt-5.4, claude-haiku-4-5 (según la consola / vinculación de claves)

messagesarray of objectsRequired

Mensajes: role (system / user / assistant / tool) y content

streambooleanOptional

Streaming vía SSE

toolsarray of objectsOptional

Definiciones de herramientas para function calling

reasoning_effortstringOptional

Profundidad de razonamiento. Los valores oficiales incluyen none, minimal, low, medium, high, xhigh; el conjunto soportado varía por modelo (ej. gpt-5.4 por defecto none, soporta hasta xhigh). Usa none/low para baja latencia; medium/high/xhigh para tareas complejas.

temperaturenumberOptional

No soportado para GPT-5.2 / GPT-5.4 cuando reasoning_effort ≠ none (error de solicitud). Solo válido para uso compatible con versiones anteriores o cuando reasoning_effort es none.

top_pnumberOptional

Misma restricción que temperature: no permitido para modelos de razonamiento insignia cuando reasoning_effort ≠ none.

presence_penaltynumberOptional

Penalización de presencia. Los modelos de razonamiento descartan automáticamente este campo.

frequency_penaltynumberOptional

Penalización de frecuencia. Los modelos de razonamiento descartan automáticamente este campo.

max_completion_tokensintegerOptional

Máximo de tokens a generar, incluyendo salida visible y tokens de razonamiento; preferido sobre max_tokens para modelos de razonamiento.

response_formatobjectOptional

ej. { "type": "json_object" }

stopstring | arrayOptional

Detener la generación cuando se encuentren estas cadenas.

Errores

Los siguientes códigos de estado HTTP pueden devolverse en caso de fallo de la solicitud API:
POST
1import OpenAI from 'openai'
2
3const client = new OpenAI({
4 apiKey: process.env.HY_API_KEY,
5 baseURL: 'https://apiclaw.cc/v1',
6})
7
8const response = await client.chat.completions.create({
9 model: 'claude-sonnet-4-6',
10 messages: [
11 { role: 'system', content: '你是一个专业的产品助手。' },
12 { role: 'user', content: '写一个三行产品介绍' },
13 ],
14 max_completion_tokens: 256,
15})
16console.log(response.choices[0].message.content)
POST

Authorization

Obtener API Key →
🔑
REQUEST
1const response = await fetch("https://apiclaw.cc/v1/chat/completions", {
2 method: "POST",
3 headers: {
4 "Authorization": "Bearer YOUR_API_KEY",
5 "Content-Type": "application/json",
6 },
7});
8const data = await response.json();
9console.log(data);
RESPONSE

Haz clic en Send request para ver la respuesta

Response
1{
2 "id": "chatcmpl_abc123",
3 "object": "chat.completion",
4 "model": "claude-sonnet-4-6",
5 "choices": [
6 {
7 "index": 0,
8 "message": {
9 "role": "assistant",
10 "content": "这里是模型生成的内容。"
11 },
12 "finish_reason": "stop"
13 }
14 ],
15 "usage": {
16 "prompt_tokens": 18,
17 "completion_tokens": 20,
18 "total_tokens": 38
19 }
20}