2
虽然现在的AI已经发展到了相对成熟的地步,但是它仍不能识别和解析自然语言。而Google一直都在努力打造一套系统来帮助AI理解自然语言。现在,Google在此领域的研究终于初见端倪。
近日,Google发布了开源的SyntaxNet自然语言神经网络框架,以帮助机器更好地理解自然语言。SyntaxNet中包括了Parsey McParseface,后者是一种专门用于“解剖”英语的语言解析器。Google称之为世界上最准确的语言解析器,并且已经放出了允许人们借助自有数据来训练SyntaxNet的全部代码。
SyntaxNet和Parsey McParseface都是自然语言理解(NLU)系统的一部分。给出一个句子,它就会将之分解成各种部分,比如名词、动词、形容词。
对自然语言研究人员和需要这种应用程序的人们来说,这款开源工具显然会助力相关研究的爆发式发展。
据Google自述,经过TensorFlow框架训练后的Parsey McParseface,是其出产的“最复杂的网络”之一。
在某一测试中,他们发现该模型的准确度超过94%——作为比较,训练有趣的语言学家的准确率在96-97%左右——这表明该软件的技能熟练度已与人类相当。
看到这里,如果你对SyntaxNet的运行方式还是不甚其解,那小编给大家一个比喻:Parsey 和SyntaxNet就像5岁孩子学习句法结构一样。
在上面这个句子中,“saw”是基本词(动词),”Alice”和”Bob”是非基本词(名词)。Paesey McParseface能正确地分析这一句子,也能理解下面这个更加复杂的例子:
Alice drove down the street in her car.
对于开发此自然语言神经网络框架的原因,Google是这样回应的:
解析语言最大的挑战就是人类语言有很多歧义,一个正常长度的句子(20到30字)也许有上百、上千,甚至上万中句法结构。而要一个自然的语言解析过程就是扫描所有句法结构,然后找出最合适的句法结构。
而虽然Parsey McParseface 和 SyntaxNet看起来牛逼哄哄,但它并不是自然语言解析的最终方式,它只是GoogleAI语言解析的第一步。
Via:TNW
雷峰网原创文章,未经授权禁止转载。详情见转载须知。