-
【AI快讯分析】摩尔线程发布开源音频理解巨型模型 MooER:依托国产多功能 GPU 实现训练与推断
【原文大意】来源:网上搜集文章主要报道了摩尔线程公司开源了一个名为MooER的大型音频理解模型,这是业界首个基于国产全功能GPU进行训练和推理的语音模型。MooER模型在摩尔线程的夸娥智算平台上,仅用38小时就完成了5000小时音频数据和伪标签的训练。该模型支持中文和英文的语音识别,并具备中译英的语音翻译能力,在Covos...
-
【AI快讯分析】字节豆包巨型框架现已具备实时语音通讯功能
【原文大意】来源:网上搜集文章主要介绍了字节跳动旗下火山引擎推出的对话式AI实时交互解决方案。该方案通过火山引擎RTC技术实现语音数据的采集、处理和传输,并整合了豆包·语音识别模型和豆包·语音合成模型,简化了语音到文本和文本到语音的转换过程。这一解决方案提供了智能对话和自然语言处理能力,使得应用能够实现用...