用户指南# 推理引擎 llama.cpp transformers vLLM SGLang 客户端 API LLM Embedding 图片 Audio Rerank OAuth2 系统(实验性质) 权限 开始使用 使用 Http 状态码 注意 Metrics Supervisor Metrics Worker Metrics