跳转至主要内容
Ctrl+K

Xinference

  • 入门指南
  • 模型
  • 用户指南
  • 示例
  • API 指南
  • 开发指南
  • 产品官网
  • GitHub
  • WeChat
  • Zhihu
  • 入门指南
  • 模型
  • 用户指南
  • 示例
  • API 指南
  • 开发指南
  • 产品官网
  • GitHub
  • WeChat
  • Zhihu

章节导航

  • Xinference Models Hub
  • 模型能力
    • 聊天 & 生成
    • 工具
    • 多模态
    • 嵌入
    • 重排序
    • 图像
    • 音频
    • 视频(实验性质)
    • 传统机器学习模型(实验性质)
  • 内置模型
    • 大语言模型
      • baichuan-2
      • baichuan-2-chat
      • Baichuan-M2
      • code-llama
      • code-llama-instruct
      • code-llama-python
      • codegeex4
      • codeqwen1.5
      • codeqwen1.5-chat
      • codeshell
      • codeshell-chat
      • codestral-v0.1
      • cogagent
      • deepseek
      • deepseek-chat
      • deepseek-coder
      • deepseek-coder-instruct
      • deepseek-prover-v2
      • deepseek-r1
      • deepseek-r1-0528
      • deepseek-r1-0528-qwen3
      • deepseek-r1-distill-llama
      • deepseek-r1-distill-qwen
      • deepseek-v2-chat
      • deepseek-v2-chat-0628
      • deepseek-v2.5
      • deepseek-v3
      • deepseek-v3-0324
      • Deepseek-V3.1
      • DeepSeek-V3.2
      • DeepSeek-V3.2-Exp
      • deepseek-vl2
      • DianJin-R1
      • Ernie4.5
      • fin-r1
      • gemma-3-1b-it
      • gemma-3-it
      • gemma-4
      • glm-4.1v-thinking
      • glm-4.5
      • glm-4.5v
      • GLM-4.6
      • GLM-4.7
      • GLM-4.7-Flash
      • glm-4v
      • glm-5
      • glm-5.1
      • glm-edge-chat
      • glm4-0414
      • glm4-chat
      • glm4-chat-1m
      • gorilla-openfunctions-v2
      • gpt-2
      • gpt-oss
      • HuatuoGPT-o1-LLaMA-3.1
      • HuatuoGPT-o1-Qwen2.5
      • internlm3-instruct
      • InternVL3
      • KAT-V1
      • Kimi-K2.5
      • llama-2
      • llama-2-chat
      • llama-3
      • llama-3-instruct
      • llama-3.1
      • llama-3.1-instruct
      • llama-3.2-vision
      • llama-3.2-vision-instruct
      • llama-3.3-instruct
      • marco-o1
      • MinerU2.5-2509-1.2B
      • minicpm-2b-dpo-bf16
      • minicpm-2b-dpo-fp16
      • minicpm-2b-dpo-fp32
      • minicpm-2b-sft-bf16
      • minicpm-2b-sft-fp32
      • MiniCPM-V-2.6
      • MiniCPM-V-4.5
      • minicpm3-4b
      • minicpm4
      • MiniMax-M2
      • MiniMax-M2.5
      • MiniMax-M2.7
      • mistral-instruct-v0.1
      • mistral-instruct-v0.2
      • mistral-instruct-v0.3
      • mistral-large-instruct
      • mistral-nemo-instruct
      • mistral-v0.1
      • mixtral-8x22B-instruct-v0.1
      • mixtral-instruct-v0.1
      • mixtral-v0.1
      • moonlight-16b-a3b-instruct
      • openhermes-2.5
      • opt
      • orion-chat
      • Ovis2
      • phi-2
      • phi-3-mini-128k-instruct
      • phi-3-mini-4k-instruct
      • QvQ-72B-Preview
      • qwen-chat
      • qwen1.5-chat
      • qwen1.5-moe-chat
      • qwen2-audio-instruct
      • qwen2-instruct
      • qwen2-moe-instruct
      • qwen2-vl-instruct
      • qwen2.5
      • qwen2.5-coder
      • qwen2.5-coder-instruct
      • qwen2.5-instruct
      • qwen2.5-instruct-1m
      • qwen2.5-omni
      • qwen2.5-vl-instruct
      • qwen3
      • Qwen3-Coder
      • Qwen3-Instruct
      • Qwen3-Next-Instruct
      • Qwen3-Next-Thinking
      • Qwen3-Omni-Instruct
      • Qwen3-Omni-Thinking
      • Qwen3-Thinking
      • Qwen3-VL-Instruct
      • Qwen3-VL-Thinking
      • qwen3.5
      • qwen3.6
      • qwenLong-l1
      • QwQ-32B
      • QwQ-32B-Preview
      • seallm_v2
      • seallm_v2.5
      • seallms-v3
      • seed-oss
      • Skywork
      • Skywork-Math
      • skywork-or1
      • skywork-or1-preview
      • telechat
      • tiny-llama
      • wizardcoder-python-v1.0
      • wizardmath-v1.0
      • XiYanSQL-QwenCoder-2504
      • xverse
      • xverse-chat
      • Yi
      • Yi-1.5
      • Yi-1.5-chat
      • Yi-1.5-chat-16k
      • Yi-200k
      • Yi-chat
    • 嵌入模型
      • bce-embedding-base_v1
      • bge-base-en
      • bge-base-en-v1.5
      • bge-base-zh
      • bge-base-zh-v1.5
      • bge-large-en
      • bge-large-en-v1.5
      • bge-large-zh
      • bge-large-zh-noinstruct
      • bge-large-zh-v1.5
      • bge-m3
      • bge-small-en-v1.5
      • bge-small-zh
      • bge-small-zh-v1.5
      • e5-large-v2
      • gme-Qwen2-VL-2B-Instruct
      • gme-Qwen2-VL-7B-Instruct
      • gte-base
      • gte-large
      • gte-Qwen2
      • jina-clip-v2
      • jina-embeddings-v2-base-en
      • jina-embeddings-v2-base-zh
      • jina-embeddings-v2-small-en
      • jina-embeddings-v3
      • jina-embeddings-v4
      • m3e-base
      • m3e-large
      • m3e-small
      • multilingual-e5-large
      • Qwen3-Embedding-0.6B
      • Qwen3-Embedding-4B
      • Qwen3-Embedding-8B
      • Qwen3-VL-Embedding-2B
      • Qwen3-VL-Embedding-8B
      • text2vec-base-chinese
      • text2vec-base-chinese-paraphrase
      • text2vec-base-chinese-sentence
      • text2vec-base-multilingual
      • text2vec-large-chinese
    • 图像模型
      • cogview4
      • DeepSeek-OCR
      • FLUX.1-dev
      • FLUX.1-Kontext-dev
      • FLUX.1-schnell
      • FLUX.2-dev
      • FLUX.2-klein-4B
      • FLUX.2-klein-9B
      • GOT-OCR2_0
      • HunyuanDiT-v1.2
      • HunyuanDiT-v1.2-Distilled
      • HunyuanOCR
      • kolors
      • PaddleOCR-VL
      • Qwen-Image
      • Qwen-Image-2512
      • Qwen-Image-Edit
      • Qwen-Image-Edit-2509
      • Qwen-Image-Edit-2511
      • Qwen-Image-Layered
      • sd-turbo
      • sd3-medium
      • sd3.5-large
      • sd3.5-large-turbo
      • sd3.5-medium
      • sdxl-turbo
      • stable-diffusion-2-inpainting
      • stable-diffusion-inpainting
      • stable-diffusion-v1.5
      • stable-diffusion-xl-base-1.0
      • stable-diffusion-xl-inpainting
      • Z-Image
      • Z-Image-Turbo
    • 音频模型
      • Belle-distilwhisper-large-v2-zh
      • Belle-whisper-large-v2-zh
      • Belle-whisper-large-v3-zh
      • ChatTTS
      • CosyVoice-300M
      • CosyVoice-300M-Instruct
      • CosyVoice-300M-SFT
      • CosyVoice2-0.5B
      • F5-TTS
      • F5-TTS-MLX
      • FishSpeech-1.5
      • Fun-ASR-MLT-Nano-2512
      • Fun-ASR-Nano-2512
      • IndexTTS2
      • Kokoro-82M
      • Kokoro-82M-MLX
      • Kokoro-82M-v1.1-zh
      • MegaTTS3
      • MeloTTS-Chinese
      • MeloTTS-English
      • MeloTTS-English-v2
      • MeloTTS-English-v3
      • MeloTTS-French
      • MeloTTS-Japanese
      • MeloTTS-Korean
      • MeloTTS-Spanish
      • paraformer-zh
      • paraformer-zh-hotword
      • paraformer-zh-long
      • paraformer-zh-spk
      • Qwen3-ASR-0.6B
      • Qwen3-ASR-1.7B
      • Qwen3-TTS-12Hz-0.6B-Base
      • Qwen3-TTS-12Hz-0.6B-CustomVoice
      • Qwen3-TTS-12Hz-1.7B-Base
      • Qwen3-TTS-12Hz-1.7B-CustomVoice
      • Qwen3-TTS-12Hz-1.7B-VoiceDesign
      • seaco-paraformer-zh
      • SenseVoiceSmall
      • whisper-base
      • whisper-base-mlx
      • whisper-base.en
      • whisper-base.en-mlx
      • whisper-large-v3
      • whisper-large-v3-mlx
      • whisper-large-v3-turbo
      • whisper-large-v3-turbo-mlx
      • whisper-medium
      • whisper-medium-mlx
      • whisper-medium.en
      • whisper-medium.en-mlx
      • whisper-small
      • whisper-small-mlx
      • whisper-small.en
      • whisper-small.en-mlx
      • whisper-tiny
      • whisper-tiny-mlx
      • whisper-tiny.en
      • whisper-tiny.en-mlx
    • 重排序模型
      • bce-reranker-base_v1
      • bge-reranker-base
      • bge-reranker-large
      • bge-reranker-v2-gemma
      • bge-reranker-v2-m3
      • bge-reranker-v2-minicpm-layerwise
      • jina-reranker-v2
      • jina-reranker-v3
      • minicpm-reranker
      • Qwen3-Reranker-0.6B
      • Qwen3-Reranker-4B
      • Qwen3-Reranker-8B
      • Qwen3-VL-Reranker-2B
      • Qwen3-VL-Reranker-8B
    • 视频模型
      • CogVideoX-2b
      • CogVideoX-5b
      • HunyuanVideo
      • Wan2.1-1.3B
      • Wan2.1-14B
      • Wan2.1-flf2v-14B-720p
      • Wan2.1-i2v-14B-480p
      • Wan2.1-i2v-14B-720p
      • Wan2.2-A14B
      • Wan2.2-i2v-A14B
      • Wan2.2-ti2v-5B
  • 自定义模型
  • 模型更新
  • 模型来源
  • 模型虚拟环境
  • 集成LoRA
  • 模型显存使用量计算
  • 模型
  • 模型能力

模型能力#

  • 聊天 & 生成
    • 介绍
    • 聊天模型
    • 生成模型
    • FAQ
  • 工具
    • 介绍
    • 快速入门
  • 多模态
    • 视觉
    • 音频
  • 嵌入
    • 介绍
    • 快速入门
    • FAQ
  • 重排序
    • 介绍
    • 快速入门
  • 图像
    • 介绍
    • 快速入门
  • 音频
    • 介绍
    • 快速入门
  • 视频(实验性质)
    • 介绍
    • 快速入门
    • 内存优化
  • 传统机器学习模型(实验性质)
    • 介绍
    • 内置模型支持案例
    • 编写自定义灵活模型
    • 结论

上一页

Xinference Models Hub

下一页

聊天 & 生成

显示源代码

© Copyright 2025, Xorbits Inc..

由 Sphinx 8.1.3创建。

使用 PyData Sphinx Theme 0.18.0构建.