Mindlogic Logo
Docs

API 레퍼런스

Chat Completions API

요약

가장 범용적인 텍스트 생성 엔드포인트입니다.
OpenAI, Anthropic, Google Gemini, xAI 등 대부분의 모델을 이 하나의 엔드포인트로 사용할 수 있으며, OpenAI SDK와 100% 호환됩니다. 기존 OpenAI 코드의 Base URL만 변경하면 바로 시작할 수 있습니다.
  • 공식 레퍼런스: OpenAI Chat Completions API

Chat Completions

POST
/v1/gateway/chat/completions/
채팅 완성을 생성합니다. 게이트웨이는 OpenAI Chat API와 동일한 요청/응답 스키마를 구현합니다.

요청 헤더

http

POST https://factchat-cloud.mindlogic.ai/v1/gateway/chat/completions/
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

파라미터

핵심

model
string
required
GET /v1/gateway/models/에서 확인 가능한 모델 이름.
messages
array
required
대화 기록 (role + content).
stream
boolean
SSE 스트리밍 활성화 (기본값: false).
stream_options
object
{"include_usage": true} — 마지막 스트림 청크에 사용량 포함.

샘플링

temperature
float
무작위성 0–2. 낮을수록 더 결정적. 기본값: 1.0.
일부 OpenAI 모델(gpt-5, gpt-5-mini, gpt-5.1-chat-latest, gpt-5.2-chat-latest)은 temperature: 1만 지원합니다. 다른 값을 설정하면 400 에러가 반환됩니다.
top_p
float
핵 샘플링 임계값. 기본값: 1.0.
top_k
integer
Top-k 샘플링 (Anthropic OpenAI 호환 전용).

출력 제한

max_tokens
integer
최대 출력 토큰. 최신 모델에서는 max_completion_tokens로 자동 변환됩니다.
추론 모델(GPT-5 시리즈, Gemini 2.5 Pro)은 내부 추론 토큰이 max_tokens 예산에 포함됩니다. 너무 낮게 설정하면(예: 4096 미만) 빈 응답이 반환될 수 있습니다. 추론이 필요한 작업에는 최소 16000 이상 사용하세요.
max_completion_tokens
integer
직접 별칭; o-시리즈 / gpt-5+ 모델에 사용.
stop
string | array
최대 4개의 중단 시퀀스.

도구 호출

tools
array
도구 정의 목록 (type: "function").
tool_choice
string | object
"auto", "none", "required", 또는 {"type":"function","function":{"name":"..."}}.

구조화된 출력

response_format
object
{"type": "json_schema", "json_schema": {"name": "...", "strict": true, "schema": {...}}}. strict: trueadditionalProperties: false가 포함된 유효한 JSON Schema가 필요합니다.

추론 / 사고

reasoning_effort
string
"low" / "medium" / "high" — OpenAI o-시리즈 및 gpt-5+.
thinking_budget
integer
최대 사고 토큰 (0–8192, 또는 동적의 경우 -1). Gemini 2.5 시리즈 전용.
thinking_level
string
Gemini 3.0 시리즈 전용. Flash: "minimal"/"low"/"medium"/"high". Pro: "low"/"high".
thinking_budgetthinking_level은 상호 배타적입니다. 두 파라미터를 동시에 사용하면 에러가 발생할 수 있으니 주의해주세요.

지원 제공업체

제공업체예시 모델
OpenAIgpt-5.2, gpt-5.1, gpt-5.2-codex
Anthropicclaude-opus-4-6, claude-sonnet-4-6, claude-haiku-4-5-20251001
Google Geminigemini-3.1-pro-preview, gemini-3-flash-preview, gemini-2.5-pro
xAIgrok-4, grok-3
Perplexitysonar-pro, sonar-reasoning-pro
Meta / 오픈소스meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8
Anthropic 네이티브 기능(확장 사고, 프롬프트 캐싱, 비전)이 필요하신가요? Messages API를 사용하시면 모든 Anthropic 전용 기능을 그대로 사용할 수 있습니다.
Codex 모델(gpt-5.2-codex, gpt-5.1-codex-max)은 이 엔드포인트에서 지원되지 않습니다. Responses API를 사용하세요.

코드 예제

기본 채팅 (Python)

python

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://factchat-cloud.mindlogic.ai/v1/gateway",
)

response = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[{"role": "user", "content": "Hello!"}],
)
print(response.choices[0].message.content)

스트리밍 (JavaScript)

javascript

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "YOUR_API_KEY",
  baseURL: "https://factchat-cloud.mindlogic.ai/v1/gateway",
});

const stream = await client.chat.completions.create({
  model: "gemini-3-flash-preview",
  messages: [{ role: "user", content: "Tell me a joke." }],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content ?? "");
}

다음 단계

마지막 수정 날짜: Feb 24, 2026

이전

OpenClaw

다음

/messages