沭阳网首页   |   手机沭阳网   |   网站地图  
您的位置:沭阳网首页 > 科技频道 > 滚动新闻>正文

看看计算机如何“思考”如何帮助人类将机器堆起来并揭示AI的弱点

2020-03-10 15:06:01    来源:    我来说两句()
字号:TT

 人工智能的最终目标之一是真正理解人类语言并从复杂细微的段落中解释含义的机器。当IBM的Watson计算机击败著名的“ Jeopardy!”时 2011年冠军肯·詹宁斯(Ken Jennings),似乎已经达到了这个里程碑。但是,任何尝试与虚拟助手Siri进行对话的人都知道,计算机要真正理解人类语言还有很长的路要走。为了更好地理解语言,计算机系统必须使用挑战性的问题进行训练,并反映出人类语言的全部复杂性。

马里兰大学的研究人员已经弄清楚了如何通过人机协作来可靠地创建此类问题,开发了一个包含1200多个问题的数据集,这些数据集虽然易于回答,但却构成了当今最好的计算机回答系统。学习掌握这些问题的系统比目前存在的任何系统都对语言有更好的理解。这项工作在2019年《计算语言学协会》期刊上发表的一篇文章中进行了描述。

UMD计算机科学副教授,该论文的高级作者约旦·博伊德·格拉伯说:“大多数回答问题的计算机系统都无法解释它们为什么回答其工作方式,但是我们的工作可以帮助我们了解计算机真正理解了什么。” 。“此外,我们已经产生了一个数据集以在计算机上进行测试,这将揭示计算机语言系统是否实际上正在阅读并进行人类能够进行的相同类型的处理。”

当前用于改进问答程序的大多数工作都是使用人工作者或计算机来生成问题。这些方法所固有的挑战是,当人们编写问题时,他们不知道问题的哪些具体元素会使计算机感到困惑。当计算机写问题时,他们要么写公式化的空白问题,要么犯错误,有时会胡说八道。

为了发展人类和计算机共同产生问题的新颖方法,Boyd-Graber和他的团队创建了一个计算机界面,以揭示计算机在人类作家键入问题时正在“思考”的内容。然后,作者可以编辑他或她的问题,以利用计算机的弱点。

在新界面中,当计算机的猜测在屏幕上按排名顺序显示时,人类作者会键入一个问题,并突出显示导致计算机做出猜测的单词。

例如,如果作者写道:“海顿的作曲家对主题的变化是受卡尔·费迪南德·波尔的启发吗?” 并且系统正确回答了“ Johannes Brahms”,界面将突出显示单词“ Ferdinand Pohl”,以表明该短语将其引向了答案。利用这些信息,作者可以编辑问题,以使计算机更加困难,而无需更改问题的含义。在此示例中,作者用对他的工作的描述“维也纳音乐博物馆的档案保管员”代替了启发勃拉姆斯的那个人的名字“ Karl Ferdinand Pohl”,并且计算机无法正确回答。但是,专家级人类问答游戏玩家仍然可以轻松地正确回答已编辑的问题。

通过共同努力,人类和计算机可靠地提出了1,213个计算机绊脚石的问题,研究人员在比赛中测试了经验丰富的人类运动员-从初中高中琐事小组到“ Jeopardy!” 冠军-针对计算机 即使是最弱小的人类团队也击败了最强大的计算机系统。

UMD计算机科学专业研究生,该论文的合著者石峰说:“三到四年来,人们已经意识到计算机问答系统非常脆弱,很容易被愚弄。” “但这是我们知道的第一篇论文,实际上是使用机器来帮助人类打破模型本身。”

研究人员说,这些问题不仅可以作为计算机科学家更好地了解自然语言处理失败之处的新数据集,还可以作为开发改进的机器学习算法的训练数据集。这些问题揭示了六种不同的语言现象,这些现象始终困扰着计算机。

这六个现象分为两类。第一类是语言现象:释义(例如说“从悬崖上飞跃”而不是“从悬崖上跳”),分散注意力的语言或意想不到的环境(例如对政治人物的引用出现在无关紧要的线索中)政治)。第二类包括推理技能:需要逻辑和计算的线索,对问题中元素的心理三角测量或将多个步骤组合在一起以得出结论。

博伊德·格拉伯说:“人类有能力进行更多的概括,并看到更深的联系。” “他们没有无限的计算机存储能力,但是在查看树木的树林方面仍然具有优势。对计算机所具有的问题进行分类有助于我们理解我们需要解决的问题,从而使我们能够真正解决问题。计算机开始透过树木看森林,并以人类的方式回答问题。”

Boyd-Graber补充说,要实现这一目标还有很长的路要走。他还曾在马里兰大学高级计算机研究所(UMIACS)以及UMD的信息学院和语言科学中心共同任职。但是这项工作提供了令人兴奋的新工具来帮助计算机科学家实现该目标。

他说:“本文正在为未来几年制定研究议程,以便我们实际上可以使计算机很好地回答问题。”


 
责任编辑:

相关新闻
    无相关信息