对标GPT-4o！开源大模型Moshi来了，但ta还是个孩子

56 0 0

Moshi是一款多模态大模型，具备听、说能力，未来可能展示看的能力。Kyutai实验室发布Moshi是对AI技术的大胆尝试，展现了开源精神。用户体验方面，响应速度快，语言支持有待提高，使用便捷。Moshi的拟人化语气让对话更自然流畅，未来的迭代优化将提升回答准确度。对教育行业将产生深远影响，为学生提供循环讲解。期待更多类似产品出现，支持更多地方语言，让AI技术贴近人们生活。

多模态能力：Moshi可以听取人的语音提问后进行实时推理回答，而且它的语音模式已经开放，比GPT-4o的秋天上线要快得多。

无区域限制：无论你身在何处，都能使用Moshi。

手机移动端支持：虽然对普通话支持不太好，但用英语提问完全没问题。

即将开源：Kyutai计划很快开源Moshi，届时将公布代码、模型权重和论文。

我的测试，他不会中文，英文沟通也不是很顺畅，应答不是很准确

https://kyutai.org/