利用 AI 进行实时语音绘图 | Livestory | #工具

该工具将传统的提示词输入换成了语音输入,帮你实时生成图像,做到语音控制绘图。

使用到的技术框架,如下:

- WhisperCPP(实时语音转文本)
- SDXL Turbo on Coreweave(图像生成模型)
- LCM (different versions) on Replicate(加速图像生成)

目前代码已经开源,感兴趣的可以部署使用。
 
 
Back to Top