您的位置:首页 >消费 >

研究人员探索自然语言处理来评估国际象棋的步法

来源:时间:2020-04-10

国际象棋和人工智能再次出现在新闻中,这一次报道了一个团队通过自然语言处理(NLP)探索国际象棋模型。 学习机制是国际象棋喋喋不休-很好的选择喋喋不休。 他们预先训练了与国际象棋动作有关的评论情绪。 这种情绪指导了代理人的决策。

他们所产生的象棋算法是通过分析专家评论员的反应来评估象棋动作的质量的。

伦敦大学学院的三位研究人员写了一篇论文,描述了他们的方法和结果。 艾萨克·卡米什、艾萨克·乔克伦和尼古拉斯·麦克卡西写道:“通过自然语言处理学习玩国际象棋”,这是在ar Xiv上。 这篇论文是上个月提交的。

“我们介绍了SentiMATE,一种新的端到端国际象棋深度学习模型,采用自然语言处理,旨在学习一种有效的评估功能,评估移动质量。 这一功能是根据与训练动作相关的评论情绪预先训练的,用于指导和优化代理人的游戏决策。

不要邀请AlphaZero和这个NLP模型参加同一个聚会,他们会呆在房间的对面。 研究人员写道,DeepMind的AlphaZero“经过了数百万次自我游戏的迭代,使用了数千个张量处理单元(TPU)。” 新的研究并非如此。

相反,他们说,他们的目的是“通过使用自然语言处理来处理对单个动作质量的评估.从不同的国际象棋网站收集数据,其中包括关于正在进行的动作的信息,并以评论的形式对动作本身进行定性评估,由各种国际象棋选手编写;结果形成了一个带有注释的动作数据库。

麻省理工学院《技术评论》的威尔·奈特说:“它通过分析专家评论员的反应来评估国际象棋的质量。”

他补充说,研究人员删除了与高质量动作和过于模棱两可的例子无关的评论。 然后,他们使用一种特殊类型的递归神经网络和单词嵌入(一种根据单词的含义连接单词的数学技术),在另一种最先进的分析语言模型上进行训练。

该算法称为SentiMATE,它自己制定了国际象棋的基本规则以及几种关键策略-包括叉和铸。

研究小组发现,SentiMATE能够“基于预先训练的情绪评估功能”来评估棋类动作。 他们的结论是,有强有力的证据支持自然语言处理被用于训练国际象棋引擎的评估功能。

他们的解决方案的表现不那么壮观。 奈特说:“它没能始终如一地击败一些传统的国际象棋机器人。” 然而,这不应分散对Senti MATE工作的事实及其工作方式的注意力:

作者说:“SentiMATE让研究人员感到惊讶的是,它有能力制定国际象棋的一些基本原则以及几种关键策略,如叉叉(当两个或两个以上的棋子同时受到威胁时)和抛球(当国王和城堡都在棋盘背面移动到一个更防御的位置时)。”

重要的收获是在努力设计这样一个程序:语言是否可以用来教如何用比传统方法所需的更少的实践数据下棋?

ZME科学的Tibi Puiu认为:

“只是这一次,他们的机器学习计划没有练习数百万盘棋来掌握国际象棋,而是分析了专家评论员的语言。 有一天,研究人员说,类似的方法可以让机器破译情感语言,并获得技能,而这些技能本来是无法通过“野蛮力量”获得的。

至于这种模式不是一个超级象棋冠军,他说,“高水平的表现并不是它的目标。 在桑提·马特闪耀的地方,它能够使用语言来获得一种技能,而不是练习它。”

在他们的论文中,作者谈到了支持他们的研究的所有重要数据集。 在根据评论对数据集进行清洗和分类、对国际象棋动作进行讽刺,并将情感分析应用于评论时,我们提出了一个以位格式表示的15,000次国际象棋动作的数据集,以及它们的评论和情感评估。 提供该数据集的目的是希望进一步发展围绕基于情感的国际象棋模型和统计移动分析的工作。

展望未来,威尔·奈特说,与游戏相关的聊天可以帮助AI程序以一种新的方式学习游戏。 而且,除了国际象棋,“同样的技术可以让机器使用我们语言的情感内容来掌握各种实际任务。”

(正如麻省理工学院技术评论(MIT)的小标题所说的那样,“欣赏‘聪明’和‘笨笨’棋步的机器可以更有效地学习玩游戏和做其他事情。”

图说财富