API
구글 스트리밍 콘텐츠 생성
요약
구글의 Generative AI API는 텍스트 기반 프롬프트에 따라 모델이 생성하는 응답을
스트리밍 방식으로 순차 전송합니다. 모델은 텍스트를 한 번에 모두 생성해
전달하는 것이 아니라, 생성되는 내용을 실시간으로 나누어 전송하므로 사용자는
전체 응답이 완료되기 전에도 결과를 빠르게 확인할 수 있습니다. 이 방식은
타이핑되는 듯한 자연스러운 출력 효과를 제공하며, 대화형 챗봇, 인터랙티브 UI,
긴 문장 생성 등 빠른 사용자 피드백이 중요한 애플리케이션에 적합합니다.
- SDK: 구글 SDK 링크
- 공식 문서: 구글 API 공식 문서
| API | 지원 모델 |
|---|---|
| google/models/generate-content-stream | gemini-3-pro-previewgemini-2.5-flashgemini-2.5-pro |
콘텐츠 스트리밍 생성
POST/v1/api/google/models/generate-content-stream
이 메서드는 /models/generate-content와 동일한 요청 구조를 가지지만, 응답을 스트리밍 방식으로 분할하여 전송합니다. 즉, 모델이 응답을 생성하는 동시에 조각(chunk)별로 실시간 전달되며, 사용자는 응답 생성이 완료되기 전에 일부 결과를 확인할 수 있습니다.
보다 자세한 사용법은 텍스트 생성 가이드를 확인해주세요.
요청 헤더
Authorization: Bearer {api-key}
파라미터
modelstring
required
완성 생성에 사용할
Model의 이름입니다.contents[]object
required
모델과의 현재 대화 콘텐츠입니다.
싱글턴 쿼리의 경우 이는 단일 인스턴스입니다. 채팅과 같은 멀티턴 쿼리의 경우 이는 대화 기록과 최근 요청이 포함된 반복 필드입니다.
추가 파라미터
마지막 수정 날짜: Nov 28, 2025