黑洞资源笔记
14:50 · Jul 14, 2024 · Sun
在Slurm集群上使用vLLM进行高效大型语言模型(LLM)推理,简化了推理服务器的运行和管理,支持自定义配置以适应不同环境
Vector Inference | #工具
Home