面向尖端大型语言模型(LLM)推理优化的灵活框架,提供高级内核优化和放置/并行策略体验,支持本地部署和资源受限环境

KTransformers | #框架
 
 
Back to Top