支持十八种语言 - 中文,英语,印度英语,德语,法语,西班牙语,葡萄牙语,俄语,土耳其语,越南语,意大利语,荷兰人,加泰罗尼亚语,阿拉伯, 希腊语, 波斯语, 菲律宾语,乌克兰语;
移动设备上脱机工作-Raspberry Pi,Android,iOS;
使用简单的 pip3 install vosk 安装;
每种语言的手提式模型只有是50Mb, 但还有更大的服务器模型可用;
提供流媒体API,以提供最佳用户体验(与流行的语音识别python包不同);
还有用于不同编程语言的包装器-java / csharp / javascript等;
可以快速重新配置词汇以实现最佳准确性;
支持说话人识别