您当前的位置 :浙江在线 > 人文频道 > 科技视野 正文

浙大本科生用AI告诉你:如何成为聊天终结者

发布时间: 2018-04-04 06:37:13 来源: 浙江在线 浙江在线记者 曾福泉 通讯员 周炜

businesswoman-smartphone-messaging-woman-in-the-office-chatting-and-sending-messages-with-her-smart-phone-clerk-on-mobile-whatsapp-conversation-female-phone-conversation-at-work_ejhybmtb__F0000.png

  浙江在线4月4日讯(浙江在线记者 曾福泉 通讯员 周炜)在社交媒体上聊天时,一言不合就“拉黑”的状况时有发生。浙江大学计算机科学与技术学院大四学生焦云皓,就因一次出言不慎被一位同窗了16年的好友拉黑了。他由此想到两个问题:什么是聊天杀手?以及,怎样的对话又更长久?工科男解决问题的方式是:让人工智能去想。

  焦云皓开发出一套名为ConverNet的AI系统,它分析一段对话后能作出判断:聊天是否会继续。AI还通过机器学习和深度学习告诉人类:什么样的语言更有 “聊天杀手”的风险。

  研究成果论文《找到对话终结者:一个对终结回复的预测研究》(Find the Conversation Killers: A Predictive Study of Thread-ending Posts)被互联网领域的高水平国际会议——国际万维网大会(The International Conference of World Wide Web,简称WWW会议)选中。4月22日,焦云皓将赴法国里昂向学界分享他的研究成果。

  学习10万组对话

  ConverNet系统是一个深度学习神经网络系统,能不厌其烦地“自学”一组一组对话,学得越多,它就越智能。问题是:让ConverNet去哪学呢? 

  在合作导师美国密歇根大学计算机学院终身教授梅俏竹老师的指点下,焦云皓找到了两个公开的海量数据库:Reddit-Treads 和康奈尔大学的Movie Dialogs,供ConverNet“刷题”。

  “两个人聊着聊着没话说了是一种情况;群聊中,某人发言之后出现冷场是另一种状况。”焦云皓说,人工智能对这两种场景都进行了分析。Reddit-Treads类似于中国的“知乎”,很多人围绕一个话题讨论并且能够相互点评,接近于社交媒体中的群聊模式;而Movie Dialogs提供的是海量电影的对白,接近于单聊。

  ConverNet一共自学了Reddit-Treads上的83097组对话和Movie Dialogs中的10万组对话,涉及到的不同单词分别达到29797和107354个。“通过深度学习,ConverNet自行掌握了一些聊天杀手的特征,接下来,它就可以随机对一组新的对话进行预判。”焦云皓说。,

  虽然ConverNet起初是不懂人类语言的“小白”,但经过海量数据“自学”之后,它的预测准确率达到80%左右,各项指标也优于传统方法。焦云皓解释了其中的关键步骤:第一步,将对话进行信息加密,形成计算机能够理解的自然语言 ;第二步,用LSTM神经网络单元,对“消化”后的对话信息进行特征提取;第三步,输出聊天可能终结的概率。

  5个特征杀死对话

  计算机用自己的方式研究人类的对话获得较高的预判准确度,这促使焦云皓进一步思考:到底怎么说话才不出错,不会成为聊天杀手呢?“我们需要‘绕’到人工智能的后台,看看它‘自学’之后有哪些‘心得’,或许可以指导我们聊天更加持久。”焦云皓说,通过深度学习和机器学习等一系列方法,对海量数据库进行再次学习之后,他发现了5个与聊天是否会终结的特征。

  1)分享。当对话中出现Mr,Mrs,talked,heard,seen,care等词语时,聊天比较容易长久,这些词汇体现了尊重与分享的愿望;而当出现YOU,THE,Christ,but,ass等词语时,聊天终结的概率会明显增大。

  2)回合。在单聊场合,聊天的回合越多,越可能终止对话;而在群聊过程中,回合越多代表话题约热烈,越有可能持续。

  3)长短。在单聊场合,聊天的句子越长,谈话越可能持续,可能双方在进行深度的交谈;而在群聊场合,剪短的句子更受欢迎,如果某人突然说了很长一大段发言,后面会出现冷场的状况。

  4)时间。如果你发起对话的时间在深夜等休息时间,容易引起对方方案,也有可能成为聊天终结者。

  5)情绪。在群聊当中,负面情绪有可能会引发新一轮的共鸣与探讨,但是在单聊中,负面情绪可能会倾向于终结对话。

  未来的聊天“顾问”  

  “这下我知道我为什么是‘聊天终结者’了。”焦云皓的老爸是这项研究的受益者之一,在微信的各种聊天群中,他的话都是大段大段的,在一堆短句当中,显得特别“格格不入”,这便是人工智能“悟”出来的聊天杀手的特征。焦云皓说,老爸读了这项研究之后,长篇大论比以前少了许多,“改发表情包,改发短句子,不像以前那么容易冷场了。”

  浙大计算机学院吴飞教授认为,焦云皓的研究关注到之前从来没有人关注到的有趣的现象,并尝试用人工智能的方式去解答,很有价值。“将这项研究发表,希望将来有人能够进一步改进我提出的方法,也有可能这个系统给将学习到更海量的数据,变得越来越聪明。”

  可以期待的是,将来的某一天,我们聊天时会有一个智能聊天助手,当你出语不妥,它会立即识别叫停,这样,你的对话质量就能大大提升。

  如果这个聊天助手早点出现,说不定,焦云皓被同学拉黑的经历就不会发生了。因为那次焦云皓带着同学玩过“王者荣耀”之后说:“你这样的水平如果是其他人,我才不带他玩呢。”后来,焦云皓发现这个同窗了16年的同学拉黑了他,再后来,他们虽然又加回了好友,但是再也没一起玩过王者荣耀。

标签: 编辑: 曾福泉
Copyright © 1999-2016 Zjol. All Rights Reserved浙江在线版权所有