ObEN语音研究科学家公布最新语音合成研究成果

ObEN 人工智能技术篇一

你知道ObEN拥有一支超过50名科学家和工程师组成的人工智能科研团队吗?每一天他们都在为了提高人工智能技术而不懈努力着,让个性化人工智能(PAI)形象长得像你、说话像你、行为像你,并保障你的PAI在Project PAI 区块链上的信息认证和安全性。为了让PAI发挥更大的作用,他们也在努力地开发最新的技术,比如人工智能动作捕捉,面部表情捕捉,还有双语系统等可以让你的PAI精通多种语言!

俗话说十年磨一剑,从技术开发到产品展现是需要时间打磨的。有时候作为大众的我们,很难看到工程师们背后的辛勤付出。因此就在这个夏天,ObEN将放送福利—带Project PAI的社区小伙伴们一起揭开ObEN实验室的神秘面纱—看看技术团队们都在研发什么。这些高科技对你的PAI有什么意义?尽请期待每周ObEN的科技播报时间。本周由ObEN语音研究科学家Pierre Lanchantin博士为大家公布ObEN最新的语音合成研究成果。

为方便阅读,我们也将视频内容整理为文字版,内容如下:

大家好,我是Pierre,我是ObEN的语音研究科学家。我想跟大家介绍一下我们近期在文本到语音合成方面的研究成果。

语音团队的目标实际上就是创建PAI的声音。这是具有挑战性的,因为每个人的声音都不同。人类的声音可能会因性别,年龄和语言等因素而变得非常多样化。

因此,我们一直在开发人工智能系统来从说话人大量的数据集中进行学习,如何介绍语音方面的不同可能性。当我们想要创建你的声音时,我们实际上只需要很简短地录制一段你的声音,因为系统已经知道如何生成类似于你声音的声音。

不仅仅是这个, 我们还将从数据集中获取的所有知识传递给你的PAI。这样你的PAI就不仅说话像你,还能获得你从数据集中学到的技能,例如用其他语言说话。我们这里有一个例子 – 一个Adam的声音的例子,他是只说中文的:”其他因素还有因为经济问题,人际问题,或是霸凌而有的压力而产生的冲动行为。”

我们在使用一种被训练为直接产出英语和中文声音的系统,所以即使Adam仅提供了中文样本,他的PAI却可以说中英双语:”And 你 probably do it to keep 清洁. It seems like a 健康的 thing to do.”

那这是很有用的,比如,你的PAI可以与来自不同国家的人交谈,或你想让你的PAI读有中英文的电子书或者文件。我们还有其他的例子,其中我们通过使用其他人唱歌的录音来改善Adam的歌声。那么Adam的PAI唱歌时,他是能用比Adam本人歌声好听的声音来唱的。

我们的数据集来自PAI社区用户的声音。只要有来自PAI社区的用户,我们都会提供他/她的声音样本。旧系统将根据此技能进行改善。 这项技能可以随后适用于所有人的PAI。所以每次有人提供样本时,都是有助于提升每个人的PAI的。所以每个人的PAI都将随着数据收集而改进。