当前位置：首页 > 外汇资讯 > 正文内容

OpenAI首次展示音频模型Voice Engine，15秒即可复制原音，生成的声音太逼真了！

激石外汇2024-03-30 11:59:25外汇资讯256

激石Pepperstone(http://www.paraat.net/)报道：

3月30日凌晨，OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。

用户只需要提供15秒左右的参考声音，通过Voice Engine就能生成几乎和原音一模一样的全新音频，在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。

除了能合成音频之外，OpenAI还展示了Voice Engine很多其他际商业用途，例如，一位失去声音表达能力的女孩，在Voice Engine帮助下能像以前一样正常发音说话。

Voice Engine功能展示

OpenAI并非展示了一些简单的demo，而是一些实际场景化用例，这也就是说Voice Engine的技术已经非常成熟。

Age of Learning 是一家儿童教育公司，他们一直在使用Voice Engine生成各种有声读物。同时还通过与GPT-4的相结合使用，创建实时、个性化的回答与学生互动。

例如，使用一段15秒的参考音频。

就可以生成几乎一模一样的语音。

除了语音合成之外，Voice Engine还能提供视频翻译功能，可以将一种视频语音无差别的翻译成多国语言。

HeyGen是一家AI视频合成平台，主要帮助企业开发商品展示的“数字人”。他们通过使用Voice Engine进行视频翻译，扩展至多国语言来扩大全球覆盖受众。

输入一段原参考语音

就能将其转化成中文语音

或者日文语音

帮助声音受损的人恢复声音：诺曼-普林斯生命科学研究所正在测试一项实验，正通过Voice Engine帮助那些因肿瘤或神经系统病因，导致语言障碍的患者恢复声音。

目前，他们已经帮助一位因血管性脑肿瘤，而失去流利语言表达能力的年轻女患者恢复了声音。

下面这段声音是女患者的，她已经无法清楚表达自己说的话。

通过提供她之前正常的语音，用Voice Engine进行转译。

现在这位女患者可以正常与其他人交流了。

OpenAI表示，其实他们在2022年底便开发了Voice Engine，并将其用于支持文本到语音 API 中的预设语音以及 ChatGPT 的语音和朗读功能。

但出于安全考虑一直没有全面公测，目前也只是小范围测试。因为相比文本、视频，音频的造假能力太强了几乎无法分辨出来。

此外，OpenAI首席技术官Mira Murati在前不久接受的采访时表示，未来Sora生成的视频会带声音的，很可能为其提供声音的就是Voice Engine。

扫描二维码推送至手机访问。

本文链接：http://www.paraat.net/news/2860.html

标签: OpenAI 音频模型Voice Engine

分享给朋友：

返回列表

上一篇：苹果新版iPad终于要来了！5月初发布，OLED屏幕，12.9英寸首现

下一篇：全球股市的一季度：五年最佳开局，AI火热、日本抢眼

“OpenAI首次展示音频模型Voice Engine，15秒即可复制原音，生成的声音太逼真了！ ” 的相关文章

刚刚，飙上热搜！涉案金额6800亿？！

激石Pepperstone(http://www.paraat.net/)报道：大家好，来看看洗米华的大消息。洗米华案涉及金额高达6800亿据澳门日报微信公众号消息，根据澳门初级法院排期，太阳城创办人周焯华案将在9月2日下午开审，控方证人超过90人。周焯华被控告不法经营赌博、相当巨额诈骗、犯...

英国首相“值多少钱”？

激石Pepperstone(http://www.paraat.net/)报道：英国首相约翰逊官宣下台，英镑只是“意思意思”地波动了一下。周四，英国现任首相鲍里斯·约翰逊宣布同意辞去首相职务，但希望能够留任至今年秋天，待英国保守党选出接替者。消息发布后，英镑兑美元汇率从前一天的2年低点——1英镑...

免税巨头Dufry大动作：收购跨国餐饮集团Autogrill，打造一个60亿美元旅游零售集团

激石Pepperstone(http://www.paraat.net/)报道：瑞士旅游免税零售巨头杜福瑞(Dufry)同意从意大利贝纳通(Benetton)家族手中收购跨国餐饮公司Autogrill SpA，从而在旅游零售市场打造一个价值60亿美元的新公司。周一公布的一份声明称，贝纳通家族将把其...

超1亿美元！小鹏拿下仿生机器人融资大单

激石Pepperstone(http://www.paraat.net/)报道：作者 | 柴旭晨去年特斯拉 AI Day ，仿生机器人“擎天柱”亮相，马斯克又带火了一个新行业。资本也很快闻风而动。跟随特斯拉的步伐，小米、小鹏分别推出了代号“铁蛋”和“小白龙”的机器人，百度也在今年6月初发布了一...

“认养一头牛”到底是不是智商税？

激石Pepperstone(http://www.paraat.net/)报道：随着认养一头牛向上交所主板上市发起冲击，这个网红乳业品牌的红与黑，完整呈现出来。这是专门为新中产打造的乳业新消费品牌，不断向用户重申“奶牛养得好，牛奶才会好”的品牌主张，宣传它们的奶牛每天伙食费80块，每天听音乐，做...

财政部：6月份全国一般公共预算收入企稳回升

激石Pepperstone(http://www.paraat.net/)报道：今天，财政部发布2022年上半年财政收支情况。数据显示，上半年，全国一般公共预算收入105221亿元，扣除留抵退税因素后增长3.3%，按自然口径计算下降10.2%。其中，中央一般公共预算收入47663亿元，扣除留抵退...

OpenAI首次展示音频模型Voice Engine，15秒即可复制原音，生成的声音太逼真了！

“OpenAI首次展示音频模型Voice Engine，15秒即可复制原音，生成的声音太逼真了！ ” 的相关文章

刚刚，飙上热搜！涉案金额6800亿？！

英国首相“值多少钱”？

免税巨头Dufry大动作：收购跨国餐饮集团Autogrill，打造一个60亿美元旅游零售集团

超1亿美元！小鹏拿下仿生机器人融资大单

“认养一头牛”到底是不是智商税？

财政部：6月份全国一般公共预算收入企稳回升

Copyright © 2017-2022 激石Pepperstone