有些emoji表情人类都不能完全理解,算法或许做的到

emoji或许有助于鉴别讽刺,因为它们大多数含义清晰,要么正面,要么负面。

emoji,即表情符号,已经诞生了二十年,如今广泛应用于社交网络中,它的内容每年不停增加,已经超过2000种。它甚至塑造着人们的表达方式。

emoji的丰富程度,足以表达现实中人们的喜好和习惯,甚至偏见与歧视。2015年的新版emoji中,增加了应用“菲茨帕特里克度量”对人类肤色的6种分类,不能不说是现实中各种平等诉求在虚拟世界中的折射。

最近,麻省理工学院(MIT)的几位研究人员开发出了一套基于深度神经网络的系统DeepMoji,并声称这套系统可以理解人们发送的emoji表情背后的复杂情绪。

来自MIT媒介实验室的教授和学生,最初的研究目的是分析虚拟网络中人们的观点。他们希望能在Twitter中鉴别出种族主义者发的推文,但他们很快意识到,假如不能理解讽刺,就没法正确地理解很多推文的含义。

从文本出发研究人类的情绪,已经有相当广泛的应用了。情感分析(Sentiment Analysis)领域已经诞生了众多创业公司。它们帮助快消品公司通过用户发来的对话、邮件等,分析用户是否真的愤怒。

但是仅从文本上有时很难看出要表达的相反的含义。而这时,emoji或许有助于鉴别讽刺,因为它们大多数含义清晰,要么正面,要么负面。

要知道,BBC曾通过Twitter中的emoji来观察不同国家的网民怎么看待特朗普当选,结果在6种语言的推文中,最多人用“笑中带泪”的表情来回应川普的当选,这个表情虽然带有某些正面意义,同时也象征着歇斯底里或者充满了讽刺意味。“笑中带泪”也是2015年牛津词典的年度词语。

然而,MIT的研究者更进一步,尝试用基于神经网络的算法,找出特定言语和表情符号之间的关联,来学习推文中emoji表达的复杂情绪,特别是讽刺的语气。

为了训练DeepMoji的算法,他们从50亿条推文中筛选中带有64种常见emoji的12亿条推文,经过使用标签化了的推文训练后,DeepMoji的表现好于此前任何一种算法。

随后,研究者又将它和人类比较,结果DeepMoji识别讽刺的准确度为82%,高出实验志愿者6个百分点。这引发了一种疑问,连人类自己都不能区分出的差别细小的讽刺,即便被算法认定了,又有什么意义?

不过,研究者还是为DeepMoji建立了一个实验网站,能够自动为一条文本生成相应的合适文字,“它看上去表现得还行,”研究者说,“但是当我输入一条唐纳德·特朗普创造的推文词汇‘covfefe’时,它也困惑了——像每个人一样。”

在你的社交生活中曾遇到过哪些“emoji难题”,并希望这套系统帮你解读呢?

本文版权归第一财经周刊所有
未经许可不得转载或翻译
未登录用户
全部评论3
关东之东
8月13日
问问它这个是什么意思→😃
易欣
8月11日
机器如果有情感,那就太恐怖了
易欣
8月11日
机器如果有情感,那就太恐怖了
到底啦