ACL 2017 最佳长论文，带你创造一门优雅的新语言

本文作者： camel

2017-08-04 13:28

专题：ACL 2017

导语：ACL 2017大会公布了今年的终身成就奖和五篇最佳论文奖

雷锋网 AI科技评论按：在昨天结束的ACL 2017大会的正会上，分别公布了今年的终身成就奖和五篇最佳论文奖。本篇文章雷锋网将带你一块儿来解读其中的最佳长论文《Probabilistic Typology: Deep Generative Models of Vowel Inventories》。

ACL 2017 最佳长论文，带你创造一门优雅的新语言

在了解这篇文章之前，首先需要了解一些语言类型学的知识。根据语言类型学的研究，发现任何一种人类语言都有元音，例如英语中的[i], [u], [æ]等，把所有语言中的这些元音收集起来（目前收集的大概有600多个独立的元音）就构成了一个元音集合。这些元音通常情况下可以用其音频的前两个共振峰 (F1, F2)来表示，这样就构成了一个2维的元音空间。在这个空间中，每一个元音都可以用一个向量f(F1,F2)来表示。

ACL 2017 最佳长论文，带你创造一门优雅的新语言

在语言类型学中对于元音有两个基本的定律：

其一，在一门语言中元音的音位必须相对较为分散，这样才能让听者能够很容易地辨别出它们，也即分散性。

其二，在所有语言中，并不是所有的元音都会出现，有些元音出现的频次较高，而有些则只在个别语言中出现或不出现，即聚焦性。

ACL 2017 最佳长论文，带你创造一门优雅的新语言

本篇论文即想要通过神经网络学习方法来对元音空间构建一个可训练的生成概率型分布方法，从而来研究语言类型学中的元音的分散性和聚焦性问题。

那么具体如何来研究呢？其实很简单，就是选定一种概率评分方法。作者考察了三种评分方法，分别为伯努利点过程（BPP）、马科夫点过程（MPP）和特征值点过程（DPP）。

其中第一种方法（伯努利点过程）只是元音概率的乘积，所以只考虑了元音的聚焦性，而没有考虑元音之间的分散程度。其公式为

ACL 2017 最佳长论文，带你创造一门优雅的新语言

第二种评分方法中，元音概率和前一种方法一致，但是同时考虑了元音之间的聚合程度，这种方法就弥补了前一种方法分散性的问题。其公式为

ACL 2017 最佳长论文，带你创造一门优雅的新语言

第三种评分方法，基本的考虑就是把两个元音向量乘积所得作为其评分标准。整体来考虑的话就是所有元音向量乘积构成的矩阵（称为Gram矩阵）的行列式构成其评分标准。其公式为

ACL 2017 最佳长论文，带你创造一门优雅的新语言

但是其中的向量e(vi)如何获得呢？在此之前人们通常是使用人工的方法，通过一种音频能量最优解之类的方法来获得。而作者此处选择了神经网络训练的方法。首先，作者选用国际音标中的53个音标作为学习训练的数据集。然后分别选用三种神经网络嵌入学习方法——神经嵌入（u）、可解释神经嵌入（i）、基于原型嵌入（p）。我们以神经嵌入为例，文章中选用下面这个公式来获得前馈神经网络

ACL 2017 最佳长论文，带你创造一门优雅的新语言