当前位置:   article > 正文

【xinference】(12):目前最全大模型推理框架xinference,发布0.12.2版本,支持qwen2,glm4等主流大模型推理运行,可以对外提供标准的openai的API接口做服务_xinference qwen2

xinference qwen2

关于Xinference

项目地址:
https://www.oschina.net/p/xinference

Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。

觉得不错,可以加星星!!!
https://github.com/xorbitsai/inference

使用文档:
https://inference.readthedocs.io/zh-cn/latest/index.html

在这里插入图片描述

主要功能

推荐阅读
相关标签