배포 / 서빙
추론 엔드포인트
배포된 모델의 OpenAI 호환/내부 RPC 엔드포인트·라우팅 헬스를 한곳에서 봅니다.
전체 엔드포인트
0
Live
0
로컬 (Ollama/MLX)
0
클라우드 (vLLM/LoRAX)
0
전체 배포 엔드포인트 (0)
로컬·클라우드 배포 등록 목록
Hybrid Router 정책
라우팅 규칙은 다음 마일스톤 — 현재 직접 호출
GET
/v1/models — 등록된 모델 목록POST
/v1/chat/completions — OpenAI 호환 채팅 완성POST
/v1/completions — 텍스트 완성 (레거시)