合成语音技术初创公司Resemble AI首次推出了一种新工具,用于根据一些称为Resemble Clone的简短录音创建数字语音。使用“类似克隆”,可以使用某人的几分钟的声音来制作自定义语音,听起来像录音中的人或虚拟的变体。
语音克隆
酷似AI开发语音软件来复制或合成语音以用于许多潜在目的。酷似克隆(Resemble Clone)专门针对娱乐业,该公司认为这可能是其技术的主要受益者。该软件工具仅需要有人发出声音至少三分钟即可开始创建人工配置文件。根据创始人在今年早些时候的采访中对Voicebot所说,录音时间越长,听起来越自然。语音甚至不必现场直播,可以使用任何录音。
“这是[所有]声音表演范式的转变。就像视觉技术的进步,演员的工作量减少了。” Resemble AI联合创始人Zohaib Ahmed在接受采访时告诉Voicebot。“对这种技术以及对[合成]语音技术的需求只会越来越大。”
最终结果听起来确实像人,但仍可以与真实声音区分开。很难辨别出非常高端的假货。这就是为什么这家位于多伦多和旧金山的初创公司还为Resemblyzer提供开放源代码工具的原因,该工具可用于从真实音频中挑选出深造的东西。
真实市场的综合演讲
Resemble AI是一家年轻的初创公司,是今年纽约Betaworks Ventures Synthetic Camp加速器计划的一部分,该计划获得了20万美元的投资。然而,看到声音听起来像人为的人工产生语音的方式并不是唯一的。其他初创公司以及科技巨头都在追求类似的想法。
在启动方面,澳大利亚出生的语音合成启动副本影城最近关闭的一个$ 2.5万种子资金,由该企业现实基金圆形LED。同时,最初是语音假体开发人员的VocaliD现在为全球的呼叫中心和语音应用程序提供合成语音。
知名人士也没有忽略这个空间。亚马逊和谷歌都在致力于人工语音生成的变体。Google助理正在试验WaveNet技术,而Alexa使用神经文本语音转换(NTTS)是亚马逊使Alexa模仿塞缪尔·杰克逊(Samuel L. Jackson)声音的方式。中国百度公司也在发展自己的声音克隆。类似于AI的公司和其他初创公司将需要提供独特的功能,以与大型公司的产品脱颖而出。类似于克隆之类的工具至少可以帮助人们更加了解市场的发展趋势。人们将需要尽可能多的灵活性和自定义选项,Resemble AI将成为人们在制作下一个电影,视频游戏或语音应用程序时想到的名字。