订阅

如果“奇葩说”上出现一位机器人辩手

能完胜人类的机器人辩手暂时还未出现,但相比下围棋,还未完全战胜人类的它,其应用场景或许会有趣和广阔得多。

如果你想查询时间、天气、航班信息,甚至买哪支股票,向AI“求助”已经不是一件稀奇的事了,但是,如果是“现在是不是跳槽的好时候?”这种更抽象的问题呢?

这类问题一般不会有唯一的正确答案,甚至截然相反的两种回答都有各自的合理性,但就是这类涉及两难决策的问题,如今AI也能胜任,它会像“奇葩说”里的那些辩手一样,为你权衡各项选择之中的利弊。

如何培养一名AI辩手

Project Debater(以下简称Debater)是IBM研发的首个能与人类复杂辩论的AI系统,它在2011年仅仅存在于一个幻灯片中,等待项目被批准就花去了约一年的时间。2018年Debater首次与人类辩手对战,对手是曾获以色列国家辩论冠军的Noa Ovadia。今年2月11日,它又与欧洲辩论冠军Harish Natarajan展开较量。

Debator与Noa Ovadia的辩论

“辩论”这种人机沟通方式,比简单的功能性问答对逻辑性要求更高,这也意味着机器对人的“思维模拟”又上了一个台阶。

至今,IBM共发表了超过30篇论文,描述其如何设计和培训Debater。研究员将支持Debater辩论的技能分为三大能力:数据驱动的辩论文稿的生成和表达能力,口语理解能力以及模拟人类困境。

第一个能力意味着,当提供给Debater一个有争议的主题的简短描述后,它能通过阅读、理解大量的语料,根据设定的发言时间来创作辩论文稿,并清晰且有针对性地表达出来。

比如Debater和Natarajan的那场辩论的议题是“我们是否应该补贴学前教育”,Debater首先要内部检索“补贴学前教育”的词条,理解它的含义,再扩展到其他的话题。

它甚至还会适时地展现幽默感。刚见到对手Natarajan时,Debater说:“嗨,听说你是世界辩论赛的冠军,打败过很多人类辩手,但我相信你还没有与像我这样的机器对战过,欢迎来到未来!”

Debater与人类“对手”Harish Natarajan

在Project Debater团队开发的20个基准数据集中,包含19276个维基百科概念,5000个带有情感注释的习语,3000个带有注释的句子,有关55个主题的2394个标签,以及由专业辩手录制的60篇演讲。而最主要的语料库来自于一个IBM获得授权的提供商,那里有很多杂志上的文章和信息。

在最近这场辩论中,辩论双方需要先在“隔绝互联网”的环境中准备15分钟,Debater的立场是支持补贴,随后双方各有4分钟的时间表达自己对话题的看法。

在这一阶段,Debater分别从资金、贫困、学前教育的好处三方面予以陈述,期间引用了统计局1960年和2013年的统计摘要、澳大利亚总理Gough Whitlam的讲话、心理科学杂志的文章、疾病控制和预防中心报告等事实资料,并告知观众这些信息对决策的重要性。在谈到贫困时,它还打趣地说:“当然,我一个机器人,确实没法亲自体会贫困,也不会抱怨生活水平低下”。

而在最后2分钟的总结环节里,Debater引用了英国作家Benjamin Disraeli的一句名言:权力的唯一作用是造福人类(Power has only one duty ——to secure the social welfare of the people)。

口语理解能力则使得Debater可以理解对方数分钟的发言,而不是一问一答的短句,这其中包括体会对方的观点、情绪,察觉其中的事实和逻辑漏洞等。这也是对AI挑战最大的环节,其难点在于辨别语言的细微差别,以及找到对方发言的表达重点,而不是抓住一些无足轻重的小错误反驳,并且反驳的效果是巩固自己的观点。此外,Project Debater还需要确保不重复自己在早期已经声明过的观点。

第三个能力是模拟人类困境。IBM创建了独特的知识图谱以帮助Debater模拟人类的困境——毕竟你不能像讨论如何安置物品那样去思考人类世界,同时要遵循辩论的“游戏规则”。这其中包括数十种深度学习和机器学习模型,而很多基础AI模型十分复杂,它们有自己的训练计划和不同的配置方式,因此这一过程是相当耗时的。IBM在深度神经网络的训练中采用一部分“弱监督”的方式,以降低人工标记的成本。

“我们的团队有五个专业辩手,我们给他们一个题目,然后把辩论录下来,导入Debater当中,让它模仿人类困境,以及知道辩论过程中的逻辑步骤。”IBM研究院人工智能技术副总裁Aya Soffer说道。

在路上的AI辩手

由于辩论双方只有Debater和Natarajan,陈述观点后的环节,并不是双方你来我往的交锋,而只是各自在4分钟的时间里陈述自己对对方观点的“反驳”。

事实上,在“反驳”环节,Debater继续引用丰富的数据,这很像一位百科全书式的“学霸”——如果真的有一个人一口气引用那么多数据,显然会受到“掉书袋”的指责。

 “我们需要让Debater知道什么样的论点论据是比较好的,并没有教授它具体的领域,这可能也是Debater有点局限性的地方。”Soffer说道。

Debater还曾错误理解Natarajan的意思,以为后者持有“学前教育是有害的”观点,但实际是,Natarajan说的是“过早的学前教育,会让儿童的心理产生挫败感,这样反而是有害的。”

这也说明,上下文语义的理解对于机器来说并不容易,比如在一句“有些人认为如果补贴学前质量会降低教育质量,但是研究结果却表明恰恰相反”中,让机器辨别这是支持补贴还是反对补贴,就需要不断地练习。

此外,Debater还并不具备观察观众反馈的视觉和听觉能力。在现场辩论中,辩手通常会根据观众的反应调整自己的表达方式,毕竟,最终的胜负由观众决定——这场辩论的观众统计数据显示,Natarajan获胜。而在去年6月与Ovadia的“处女秀”辩论中,Debater取得了一胜一负的成绩。 

2019年2月Debater与人类辩手围绕“政府是否应该资助学前教育”展开辩论。

除了辩论,Debater还能干点啥?

值得注意的是,虽然输了最近这场辩论,但观众支持的比例从开场前的79%比13%转变为62%比30%,也就是说有17%的观众从支持Natarajan的观点转变为支持Debater。而在“谁更丰富了你的知识”统计中,有60%的现场观众将票投给Debater。此前的那场辩论,现场观众反馈同样如此:人类辩手整体的表达更好,但AI辩手传递信息量的丰富度则优于人类。

这也符合IBM研究员对Debater的期待——在海量的信息中,找到那些能帮助人们做出无偏颇决策的信息。事实上,Debater也并不以战胜人类为目的。

“人有自己的主观意见,看了一个东西后会根据自己的立场解读,但机器不会,它从大量信息中看到很多重复的意见,所以它提出来的意见不会是特别疯狂的。”Aya Soffer说道。

这样的定位或许会打消一部分人对于“AI将代替人们思考”的顾虑,毕竟,Debater更多担任信息索引和观点启发的角色(它也可以根据一个人对不同因素考虑的权重来提出意见),最终做出决策的还是人类本身。

有人将Debater形容为进入了自然语言处理的“神秘山谷”。这个说法的含义是,当机器人更准确地描绘人类的外表和生理时,它可以穿过“不可思议”的山谷被误认为是人类。

相比会下棋的机器人,还未完胜人类的Debater的应用场景其实要有趣得多,比如虽然还代替不了律师来说,但Debater可以帮助他们寻找相关案件和主张,模拟法庭辩论;它还可以担任金融分析师的顾问,寻找金融事实以支持或反对某个投资选择;Debater也能帮助政府或企业决策拓展思路,提供基于事实、没有人为偏见的观点;而对于学生来说,Debater可以锻炼他们的批判性思维和沟通技巧,甚至帮他们改论文。

“我们与金融机构也有一个概念验证的项目,它们本身有很多术语和专业词汇,和传统争议性话题的辩论是不一样的,所以我们让Debater了解更多的金融领域的情况,比如录入金融分析师报告,教它理解数据表格。”Aya Soffer说道。现在,Debater还有一个“Project Debater speech by Crowd”功能,可以根据网友对一个话题提出的观点关键词,来发表一个演讲。不过Debater目前只有英文版。

同时,Debater也在媒体界寻找自己的角色。它可以根据文章下的读者评论,总结出不同的观点,再根据这些观点生成一篇新的文章。

而在消费和营销领域,它似乎也能发挥作用。比如如果一位商家持有一台懂逻辑的AI机器人,你可能会发现自己更无法抗拒买买买的冲动了——我们因此会丧失掉部分决策的独立性?才怪,AI只是帮我们想出了更多“剁手”的理由罢了!

 

 

本文版权归第一财经杂志所有
未经许可不得转载或翻译
未登录用户
全部评论0
到底啦