팩트챗/API (Legacy)//models/generate-content-stream

이 페이지는 Legacy API 문서입니다. 현재 API Gateway의 새 문서로 통합·이전될 예정이며, 신규 통합에는 API Gateway 사용을 권장합니다.

구글 스트리밍 콘텐츠 생성

구글의 Generative AI API는 텍스트 기반 프롬프트에 따라 모델이 생성하는 응답을 스트리밍 방식으로 순차 전송합니다. 모델은 텍스트를 한 번에 모두 생성해 전달하는 것이 아니라, 생성되는 내용을 실시간으로 나누어 전송하므로 사용자는 전체 응답이 완료되기 전에도 결과를 빠르게 확인할 수 있습니다. 이 방식은 타이핑되는 듯한 자연스러운 출력 효과를 제공하며, 대화형 챗봇, 인터랙티브 UI, 긴 문장 생성 등 빠른 사용자 피드백이 중요한 애플리케이션에 적합합니다.

SDK: 구글 SDK 링크
공식 문서: 구글 API 공식 문서

API	지원 모델
google/models/generate-content-stream	`gemini-3-pro-preview` `gemini-2.5-flash` `gemini-2.5-pro`

콘텐츠 스트리밍 생성

POST/v1/api/google/models/generate-content-stream

이 메서드는 /models/generate-content와 동일한 요청 구조를 가지지만, 응답을 스트리밍 방식으로 분할하여 전송합니다. 즉, 모델이 응답을 생성하는 동시에 조각(chunk)별로 실시간 전달되며, 사용자는 응답 생성이 완료되기 전에 일부 결과를 확인할 수 있습니다.

보다 자세한 사용법은 텍스트 생성 가이드를 확인해주세요.

요청 헤더

파라미터

model

string

required

완성 생성에 사용할 Model의 이름입니다.

contents[]

object

required

모델과의 현재 대화 콘텐츠입니다.

싱글턴 쿼리의 경우 이는 단일 인스턴스입니다. 채팅과 같은 멀티턴 쿼리의 경우 이는 대화 기록과 최근 요청이 포함된 반복 필드입니다.

하위 속성 표시

config

object

모델 생성 및 출력에 대한 추가 구성 옵션입니다.

하위 속성 표시

tools[] (FunctionDeclaration)

object

Model이 다음 응답을 생성하는 데 사용할 수 있는 Tools 목록입니다.

Tool은 시스템이 Model의 지식과 범위를 벗어나 외부 시스템과 상호작용하여 작업 또는 작업 집합을 수행할 수 있도록 하는 코드 조각입니다. 지원되는 Tool는 Function 및 codeExecution입니다. 자세한 내용은 함수 호출 및 코드 실행 가이드를 참고하세요.

toolConfig (FunctionCallingConfig)

object

요청에 지정된 도구에 대한 구성입니다.

functionCallingConfig

object

함수 호출 동작에 대한 구성입니다.

mode

string

함수 호출 모드를 지정합니다:

AUTO: 모델이 함수 호출 시점을 결정
ANY: 모델이 제공된 함수 중 하나를 반드시 호출
NONE: 모델이 함수를 호출할 수 없음

allowedFunctionNames

array of strings

호출할 수 있는 함수 이름의 선택적 목록입니다. 비어있으면 모든 함수가 허용됩니다.

사용 예는 함수 호출 가이드를 참고하세요.

safetySettings[] (SafetySetting)

object

안전하지 않은 콘텐츠를 차단하기 위한 고유한 SafetySetting 인스턴스 목록입니다. 각 SafetyCategory 유형에 대해 두 개 이상의 설정이 있어서는 안 됩니다.

category (HarmCategory)

string

구성할 유해성 카테고리입니다. 지원되는 카테고리:

HARM_CATEGORY_HATE_SPEECH (혐오 발언)
HARM_CATEGORY_SEXUALLY_EXPLICIT (성적으로 노골적인 콘텐츠)
HARM_CATEGORY_DANGEROUS_CONTENT (위험한 콘텐츠)
HARM_CATEGORY_HARASSMENT (괴롭힘)
HARM_CATEGORY_CIVIC_INTEGRITY (시민 무결성)

threshold (HarmBlockThreshold)

string

콘텐츠를 차단하는 임계값입니다. 옵션:

BLOCK_NONE: 차단 안 함
BLOCK_LOW_AND_ABOVE: 낮은 수준 이상의 유해 콘텐츠 차단
BLOCK_MEDIUM_AND_ABOVE: 중간 수준 이상의 유해 콘텐츠 차단
BLOCK_ONLY_HIGH: 높은 수준의 유해 콘텐츠만 차단

사용 가능한 안전 설정에 관한 자세한 내용은 가이드를 참고하세요. 또한 안전 가이드에서 AI 애플리케이션에 안전 고려사항을 통합하는 방법을 알아보세요.

systemInstruction

string

개발자가 설정하는 시스템 안내 텍스트입니다.

temperature

number

출력의 무작위성을 제어합니다. 값이 낮을수록 더 결정론적인 출력을 생성합니다. 범위: 0.0-2.0

topP

number

누적 확률 질량이 topP인 토큰만 고려하는 nucleus sampling 매개변수입니다. 범위: 0.0-1.0

topK

integer

샘플링을 위해 상위 K개의 토큰만 고려합니다. topP 또는 topK 중 하나만 사용하세요.

maxOutputTokens

integer

응답에서 생성할 최대 토큰 수입니다.

stopSequences

array of strings

생성을 중지할 시퀀스입니다. 이 시퀀스가 발견되면 생성이 중단됩니다.

responseMimeType

string

응답 형식을 지정합니다. 예: application/json, text/plain

responseSchema

object

JSON 모드 사용 시 JSON 출력의 구조를 정의합니다.

candidateCount

integer

생성할 응답 후보의 수입니다.

presencePenalty

number

응답에 이미 등장한 토큰에 대한 페널티입니다. 범위: -2.0-2.0

frequencyPenalty

number

응답에서 토큰 빈도에 따른 페널티입니다. 범위: -2.0-2.0

seed

integer

결정론적 생성을 위한 시드값입니다. 동일한 시드와 구성으로 생성 시 동일한 결과를 보장합니다.

cachedContent

string

예측을 제공하기 위한 컨텍스트로 사용하기 위해 캐시된 콘텐츠의 이름입니다. 형식: cachedContents/{cachedContent}

마지막 수정 날짜: Nov 28, 2025

/models/generate-content

/models/generate-images

요청 예시

curl https://factchat-cloud.mindlogic.ai/v1/api/google/models/generate-content-stream \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $YOUR_API_KEY" \
  -d '{
    "model": "gemini-2.5-flash",
    "contents": [{
      "role": "user",
      "parts": [{"text": "Say this is a test!"}]
    }]
  }'

// https://factchat-cloud.mindlogic.ai/v1/api/google/models/generate-content-stream
{
  "model": "gemini-2.5-flash",
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Say this is a test!"
        }
      ]
    }
  ]
}

const response = await fetch("https://factchat-cloud.mindlogic.ai/v1/api/google/models/generate-content-stream", {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    "Authorization": "Bearer $YOUR_API_KEY"
  },
  body: JSON.stringify({
    model: "gemini-2.5-flash",
    contents: [
      {
        role: "user",
        parts: [{ text: "Say this is a test!" }]
      }
    ]
  })
});

const reader = response.body?.getReader();
const decoder = new TextDecoder("utf-8");

while (true) {
  const { done, value } = await reader.read();
  if (done) break;
  const chunk = decoder.decode(value);
  console.log("[chunk]", chunk);
}

응답 예시

// Streaming response example (NDJSON format - each line is a JSON chunk)
{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": "Okay"
            // ...
          }
        ],
        "role": "model"
      },
      // ...
    }
  ],
  // ...
}
{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": ", I understand"
            // ...
          }
        ],
        "role": "model"
      }
      // ...
    }
  ]
  // ...
}
{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": "! This is a test."
            // ...
          }
        ],
        "role": "model"
      }
      // ...
    }
  ]
  // ...
}