
Moshi是一款多模态大模型,具备听、说能力,未来可能展示看的能力。Kyutai实验室发布Moshi是对AI技术的大胆尝试,展现了开源精神。用户体验方面,响应速度快,语言支持有待提高,使用便捷。Moshi的拟人化语气让对话更自然流畅,未来的迭代优化将提升回答准确度。对教育行业将产生深远影响,为学生提供循环讲解。期待更多类似产品出现,支持更多地方语言,让AI技术贴近人们生活。
多模态能力:Moshi可以听取人的语音提问后进行实时推理回答,而且它的语音模式已经开放,比GPT-4o的秋天上线要快得多。
无区域限制:无论你身在何处,都能使用Moshi。
手机移动端支持:虽然对普通话支持不太好,但用英语提问完全没问题。
即将开源:Kyutai计划很快开源Moshi,届时将公布代码、模型权重和论文。
我的测试,他不会中文,英文沟通也不是很顺畅,应答不是很准确
https://kyutai.org/
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...