欢迎访问环球CEO
当前位置:首页 > > 正文

国内首个!端到端通用语音大模型心辰Lingo在外滩大会正式发布!

发布时间:2024-10-02 11:46分类: 浏览:275评论:0


导读:国内首个端到端通用语音大模型「心辰Lingo」8月1日正式问世,8月24日开放内测预约,9月5日,在外滩大会正式发布!「心辰Lingo」实现了端到端语音技术,在处理对话时直接理解语...
国内首个端到端通用语音大模型「心辰Lingo」
8月1日正式问世,
8月24日开放内测预约,
9月5日,在外滩大会正式发布!
「心辰Lingo」实现了端到端语音技术,在处理对话时直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信息处理过程中的损失,让“机器”更懂人。这也是国内首个端到端语音大模型,开创了人机交互新方式。
全球权威咨询机构IDC分析预测,到2030年,全球智能语音服务市场的价值将达到约731.6亿美元,年复合增长率预计将高达27%。全球范围内的科技公司都敏锐地捕捉到了这一领域的潜力,纷纷投身于智能语音技术的开发,一场全新的人机交互革命正在被点燃。
“心辰Lingo能捕捉到语音中的细微变化,不仅能理解你说了什么,还能理解更想表达什么,真正做到了为AI赋予‘高情商’,使其能够精准洞察言外之意。这也是西湖心辰作为持续深耕大模型情商能力又一个重要技术突破。”西湖心辰CEO醒辰在发布会现场表示。
西湖心辰针对「心辰Lingo」端到端语音大模型的能力在多个领域和中文上进行增强,使得心辰Lingo的中文语音效果,相较GPT4o更为出色。主要有以下三个技术特征:
一是,原生的语音理解。作为端到端模型,心辰Lingo不仅能够识别语音中的文字信息,还能精确捕捉其他重要特征,如情感、语气、音调,甚至环境音,更全面地理解语音内容,从而提供更加自然和生动的交互体验。
二是,多种语音风格表达。心辰Lingo可以根据上下文和用户指令,自适应调整语音的速度、高低、噪声强度,并能够生成对话、歌唱、相声等多种风格的语音响应,有效提升了模型在不同应用场景下的灵活性和适应性。
三是,语音模态超级压缩。心辰Lingo采用具有数百倍压缩率的语音编解码器,能够将语音压缩至极短的长度,在显著降低计算和存储成本的同时帮助模型生成高质量语音内容。
日前,心辰Lingo开放内测预约不到10天,已经有超千家企业用户预约测试,包括了教育、金融、医疗健康、政府与公共服务、媒体与娱乐、零售与商业服务、制造与工程等八大行业,数十个实际使用场景。
市场层面对心辰Lingo的应用空间作出了积极反馈,其中不乏知名企业与院校递交相关使用需求。例如某头部外卖服务商,期待通过AI技术优化其外卖服务,实现智能路线规划和订单分配,提高配送效率和用户满意度,同时在内部使用AI进行语音交互类业务。
在心理健康咨询场景下,某医院拟运用心辰Lingo的语音技术提供患者心理咨询和干预,通过AI智能对话系统,为患者提供情绪支持,帮助他们应对疾病带来的心理压力;在客户服务与支持场景下,某知名产险企业,希望利用心辰Lingo的语音技术进行客户服务和外呼,针对退保挽留和续保挽留等自动外呼场景,通过智能语音系统提高服务效率和客户满意度。

此外,陪伴领域还涌现出一系列个性化需求,如游戏语音陪伴、社交辅助助手、语音母婴看护等,这些需求的多样性和创新性为「心辰Lingo」提供了广阔的应用前景。
这与西湖心辰对「心辰Lingo」的发展规划不谋而合,针对情感陪伴、智能营销等领域进行更深入的垂直模型研发,以加强「心辰Lingo」在这些专业领域的技术实力,为更多企业提供强大的技术支持和赋能。
10月西湖心辰即将发布基于「心辰Lingo」进行领域深度训练的儿童陪伴、心理疏导、 销售服务3大垂类语音模型,与更多行业领袖携手,共同推动AI技术的创新和应用,开启智能服务的新篇章。