Anthropic Messages API
Anthropic Claude 모델의 모든 기능을 100% 활용할 수 있는 네이티브 엔드포인트입니다.
확장 사고(Extended Thinking), 프롬프트 캐싱, 비전, PDF 문서 분석 등 Anthropic 전용 기능이 필요한 경우 이 엔드포인트를 사용해주세요. 요청이 변환 없이 원시 바이트로 전달되어 모든 기능이 완벽하게 작동합니다.
- 공식 레퍼런스: Anthropic Messages API · Streaming
- Anthropic SDK용 Base URL:
https://factchat-cloud.mindlogic.ai/v1/gateway/claude
메시지 생성
POST
/v1/gateway/claude/v1/messages/Anthropic 네이티브 API 형식으로 메시지를 생성합니다.
요청 헤더
anthropic-beta 헤더
anthropic-beta 헤더| 기능 | 헤더 값 |
|---|---|
| 프롬프트 캐싱 | prompt-caching-2024-07-31 |
| 인터리브 사고 (수동 모드, Sonnet 4.6 전용) | interleaved-thinking-2025-05-14 |
| 토큰 카운팅 | token-counting-2024-11-01 |
적응형 사고 (
thinking.type: "adaptive")는 베타 헤더가 필요 없으며 인터리브 사고가 자동으로 활성화됩니다.파라미터
model
Anthropic 모델 이름 (string
required
claude-opus-4-6, claude-sonnet-4-6, claude-haiku-4-5-20251001).messages
대화 기록. 각 메시지는 array
required
role ("user" 또는 "assistant")과 content (문자열 또는 ContentBlock[])로 구성됩니다.max_tokens
최대 출력 토큰.integer
required
system
시스템 프롬프트 (문자열 또는 캐싱용 string | array
ContentBlock[]).stream
SSE 스트리밍 활성화.boolean
tools
도구 정의.array
thinking
사고 설정. 적응형 (Opus 4.6 / Sonnet 4.6 권장): object
{"type": "adaptive"}. 수동 (전체 모델): {"type": "enabled", "budget_tokens": 10000}.output_config
적응형 사고의 노력 수준: object
{"effort": "low" | "medium" | "high" | "max"}. "max"는 Opus 4.6 전용.temperature
샘플링 온도 0–1.float
응답 (비스트리밍)
Claude Code 빠른 시작
커스텀 Base URL을 설정할 때는 반드시
ANTHROPIC_API_KEY가 아닌 ANTHROPIC_AUTH_TOKEN을 사용하세요. 잘못 설정하면 401 인증 오류가 발생합니다.적응형 사고 (권장)
적응형 사고를 사용하면 Claude가 요청의 복잡성에 따라 사고의 필요 여부와 깊이를 동적으로 결정합니다. 베타 헤더가 필요 없습니다.
effort 파라미터로 사고 깊이를 조절할 수 있습니다:
| Effort | 동작 |
|---|---|
max | 항상 사고, 깊이 제한 없음 (Opus 4.6 전용) |
high (기본값) | 항상 사고, 심층 추론 |
medium | 적절한 사고, 간단한 질문은 사고 생략 가능 |
low | 최소한의 사고, 속도 우선 |
프롬프트 캐싱
기능 호환성
Gateway를 통해 Anthropic의 모든 주요 기능을 제한 없이 사용할 수 있습니다. 아래 표에서 지원되는 기능을 확인해보세요.
| 기능 | 지원 | 비고 |
|---|---|---|
| 스트리밍 | 지원 | 전체 SSE 패스스루 |
| 도구 사용 | 지원 | 변경 없이 전달 |
| 비전 (이미지) | 지원 | 변경 없이 전달 |
| PDF 문서 | 지원 | 변경 없이 전달 |
| 적응형 사고 | 지원 | Opus/Sonnet 4.6 권장. 베타 헤더 불필요 |
| 확장 사고 (수동) | 지원 | 전체 모델. Sonnet 4.6 인터리브 모드는 anthropic-beta 헤더 필요 |
| 프롬프트 캐싱 | 지원 | 캐시 토큰이 사용량에 추적됨 |
| 토큰 카운팅 | 지원 | POST .../count_tokens/ 엔드포인트 |
제한 사항
- Anthropic 모델만 허용됩니다
- 비Anthropic 모델은
/v1/gateway/chat/completions/를 사용하세요
마지막 수정 날짜: Feb 24, 2026
