黑洞资源笔记
16:29 · Aug 30, 2024 · Fri
面向大型语言模型(Large Language Models, LLMs)的高吞吐量高性能服务框架,采用设备内并行性、异步CPU调度和SSD卸载等关键技术,显著提升资源利用率和推理吞吐量
NanoFlow
| #框架
Home