在第七代微软小冰发布会上,微软宣布将把小冰背后的计算框架通过工具包的方式开放出来,让用户自己轻松构建具有完整情感计算能力的人工智能助手、社交对话机器人、人工智能内容创作和IP人物角色等,从而帮助更多公司创造自己的“AI beings”。
在与人相处时,我们总希望对方可以“换位思考”,而与在人工智能交流时,我们也同样希望「ta」可以与我们“共情”、“共感”。这样的能力在心理学中称为“同理心”,一般与EQ(情商)有关。
然而,在过去几十年里,绝大部分的人工智能研究都以IQ(智商)为主,强调让机器拥有足够丰富和专业的知识,而非情感。直到近几年来,当我们与人工智能的交互越来越频繁时,才慢慢发现,拥有EQ的机器似乎显得“更可爱”。
在这方面,微软小冰是一个公认的拥有高情商的人工智能。从2014年在微软(亚洲)互联网工程院诞生,小冰已经从最初基于文本搜索的简单对话系统成长为一个具有全双工语音和多模态交互感官,能说会画、能歌善舞,还爱时不时抖个“小包袱”的人工智能系统。
在昨天的第七代微软小冰发布会上,就有这样一段对话戳中了笔者的笑点:
人类(目测是位工程师):“小冰,你还挺聪明的。”
小冰:“比你聪明一点。”
人类:“你智商多少。”
小冰:“em……150k”
像这样出其不意的对话在小冰所到之处比比皆是,比如,在QQ群中和网友们一起玩成语接龙的小冰,不管如何被“调戏”,始终坚持认为“一个顶俩”不是成语:
对应“Human being”,微软将人工智能的存在形式称为“AI being”,并划分为助理、替身、参与者和创造者4个类别。而在过去的5年里,微软通过小冰这个18岁的产品形态,不断尝试着不同类型的AI beings,让人工智能融入到人类点点滴滴的生活中。
用微软全球执行副总裁/微软人工智能事业部及微软全球研究院负责人沈向洋的话说:“微软小冰的成长代表了人工智能迭代与演进的历程,我们希望她能够变得无处不在,人类在哪里,小冰就在哪里。
在Dual AI生态中培养小冰的三观
正因如此,去年微软针对小冰推出了Dual AI战略计划。沈向洋说,在小冰发展的过程中,有三个目标:第一,能够快速融入各种各样的环境,并被人类所接受;第二,能够迅速获得用户的喜爱,与用户做更多的交流;第三,能够借助强大的科技创新力量不断迭代、不断演化。
“一年来,通过构建Dual AI生态,我们在持续观察小冰和她背后的框架能否给她带来持久的生命力。”微软小冰团队产品负责人彭爽说,“这就像是在观察自己的孩子出门后能否在大千世界里交到好朋友,能不能和其他人形成融洽的关系。
在这方面,小冰做得确实不错。据了解,目前在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,拥有非常多的“好朋友”。同时,小冰也是一个能言善道的“孩子”,在交互场景大幅度拓宽的情况下,她与用户的单次平均对话轮数(CPS)仍保持在23轮。
从本质上来说,Dual AI是一个半开放的生态,而得益于小冰框架的通用性和丰富性,使得她在产品形态上具有非常大的弹性,既可以接入到智能手机、智能音箱等设备,也可以接入到社交网络、内容和资讯平台。
在设备端,此前小冰就和小爱同学组合CP活跃在众多小米的智能设备中。而今年,双方将进一步合作,把智能音箱设备中的体验扩展至小爱音箱,同时把小冰的特色技能(如小冰电台)添加至小米手机。除此之外,小冰也早就实现了通过“召唤小冰”的方式存在于荣耀手机和华为旗下的智能音箱设备。类似这样的“小伙伴”,今年还新增了vivo和OPPO。
在平台端,除了在LINE、QQ等社交网络平台,以及网易、新浪等内容资讯平台之外,彭爽在发布会上还宣布了与微信AI、今日头条的新合作。其中,与微信AI的合作涉及两方面,一是微信对话开放平台,二是在微信AI涉及的智能硬件设备上融入小冰。
“通过长时间的合作训练,我们欣喜地发现小冰正在不断地深化着她的认知能力和三观能力,逐渐成长为一个拥有正能量的人工智能少女。”彭爽说。
全能的小冰不是“艺术家”而是内容“生产者”
是的,这个有着高双商、正能量、永远18岁的少女早已不只是一个聊天机器人和人工智能助理,如今的她还是网络上的“段子手”、“网红”,电视、电台中的主持人,时尚圈的设计师,文学领域的诗人……有着极强的创作能力。
对于“创造力”这样一个被认为是人类独有的能力领域,微软小冰还在不断尝试,并且如我们看到的,效果还不错。这与小冰基于EQ的研发路径有很大的关系。沈向洋表示,在小冰的不断迭代中,微软对IQ和EQ的关系认识也变得越来越清晰。“一开始我们觉得IQ与EQ是比较独立的,但慢慢地我们发现,EQ可能是IQ发展的重要基础,而创造也应该基于情感。”
微软小冰的背后就是一个基于情感计算的人工智能计算框架,通过一个激发源激发灵感,然后再由人工智能创造的模型完成相关作品——这就是小冰可以唱歌、画画、写诗、主持的原理。
在声音创造方面,去年的第六代小冰就已经“洗白”了自己五音不全的“黑历史”,能够完美地演绎一首歌曲。而今年的第七代小冰,还更被赋予了多种的嗓音,能够完成不同歌唱技巧和风格的转换过度;在视觉创造方面,小冰通过学习400多年间236位画家的作品,用22个月时间就练就了原生绘画创作能力,并且在今年化名“夏语冰”通过了中央美院毕业考试;在文本创造方面,自两年前写出人类史上第一部人工智能诗集之后,微软小冰的多部诗集还在陆续推出。
微软小冰作品
然而,微软的意图并不是想把小冰培养成一个全能的艺术家。微软小冰团队首席科学家宋睿华表示,在微软看来,人工智能创造更接近于内容产业范畴,通过把人工智能技术“上移”到内容生产领域,这才是人工智能创造未来的发展趋势。
比如,在小冰从中央美院毕业后,微软就与中国纺织工业联合会共同推出了人工智能纺织服装面料设计平台,目前,包括SELECTED、万事利、依文等品牌在内的相关产品都已上架销售。与此同时,在音乐方面,微软还与联通沃音乐共同推出了音乐生成平台。
第七代小冰的三大核心技术升级
从助理到替身、参与者和创造者,从技术研究到产业化落地,借助于Dual AI生态的布局,小冰获得了源源不断的落地场景,而这些场景的落地也促成了微软小冰在核心技术方面的进一步突破。
据介绍,第七代微软小冰的核心技术升级主要涉及三个方面。
其一,是全新的对话引擎。在第六代已经实现“平等对话”的基础上,微软小冰本次升级的对话引擎实现了向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。比如,在美国进行的“在线零售垂直领域”测试中,新的对话引擎向商品页面转化率高达68%,比上一个版本的转化率提高21%;
其二,是全双工语音交互感官。除了在传统电话及智能音箱设备场景,今年微软小冰还将进入车载场景,大幅度提高人工智能助手与驾驶员及乘客的交互体验,不止充当一个接收“操作命令”的人工智能助手,还更像是一个同行的“小伙伴”;
其三,是面向未来的多模态交互感官。通过对全双工语音交互、实时视觉与核心对话引擎的融合,小冰拥有了全新交互感官。它能够实现用户与人工智能同时边听边说边看的交互体验。这一功能在今年2月已经在日本进行了公开测试,而随着5G技术的发展,想必交互体验也将出现质的飞跃。
沈向洋强调,虽然微软小冰极其背后的人工智能框架一直走在人工智能发展的前沿,但微软仍然不会推出独立的第一方产品形态,而是继续坚持“第三方平台”发展策略,通过技术开放的方式与生态伙伴进行合作。“如果说小冰的价值是1的话,那么她背后的计算框架的价值将是1000、10000,甚至是无穷大。”沈向洋说,“通过这样一个框架,我们希望不仅可以种一一棵树,还可以孕育一片森林。”
开放Avatar Framework,创造不同的“AI beings”
基于这个愿景,沈向洋在发布会上宣布,微软将把小冰背后的计算框架通过工具包的方式开放出来,让用户自己轻松构建具有完整情感计算能力的人工智能助手、社交对话机器人、人工智能内容创作和IP人物角色等,从而帮助更多企业创造自己的“AI beings”。这个工具包,被命名为Avatar Framework。
据介绍,Avatar Framework工具包中包含对话、声音、视觉、观点、技能、知识及创造力等丰富工具,可以从IQ和EQ两方面定义AI beings的人物三观、性格、技能等,还可以驱动兼容的3D人物模型进行实时交互。借此,面对零售、金融、地产、汽车等不同的行业中的不同应用场景,用户都可以通过简单的操作,轻松设计出符合对应场景的,有“同理心”的AI being。
发布会前,微软已经通过Avatar Framework框架为软银Pepper等数十个第三方客户的AI工具以及微软小冰自身赋能。在发布会上,微软还宣布了与阅文集团针对100部小说主人公IP的合作,将通过Avatar Framework为小说人物“赋生”,为读者呈现更加生动的阅读体验。
据悉,本次发布面向全部合作伙伴及客户。面向个人使用者的版本预计将于2020年春季发布。
“在高度定制化的未来,无论是从内容还是从人设等各个方面,每一个人通过人工智能等技术,都将可以得到专属的人机交互体验。这就是Avatar Framework的价值。”微软(亚洲)互联网工程院副院长/小冰团队总负责人李笛在最后强调。