Skip to main content
Ctrl+K

Xinference

  • 入门指南
  • 模型
  • 用户指南
  • 示例
  • API 指南
  • 开发指南
  • 产品官网
  • GitHub
  • WeChat
  • Zhihu
  • 入门指南
  • 模型
  • 用户指南
  • 示例
  • API 指南
  • 开发指南
  • 产品官网
  • GitHub
  • WeChat
  • Zhihu

Section Navigation

  • 推理引擎
  • 客户端 API
  • OAuth2 系统(实验性质)
  • Metrics
  • 用户指南

用户指南#

  • 推理引擎
    • llama.cpp
    • transformers
    • vLLM
    • SGLang
  • 客户端 API
    • LLM
    • Embedding
    • 图片
    • Audio
    • Rerank
  • OAuth2 系统(实验性质)
    • 权限
    • 开始使用
    • 使用
    • Http 状态码
    • 注意
  • Metrics
    • Supervisor Metrics
    • Worker Metrics

上一页

集成LoRA

下一页

推理引擎

显示源代码

© Copyright 2023, Xorbits Inc..

由 Sphinx 7.3.7创建。

Built with the PyData Sphinx Theme 0.15.2.