Instagram新推两款AI过滤工具，没错！背后功臣就是Deep Text

本文作者：李秀琴

2017-06-30 17:44

导语：Instagram 本周四发布了两款新工具。一款为自动评论过滤器，另一款为垃圾消息过滤器。两款过滤工具的技术基础都采用了Facebook的人工智能系统。

图片来源：TechCrunch

雷锋网6月30日消息据外媒《连线》杂志报道，Instagram 本周四发布了两款新工具。一款为自动评论过滤器，另一款为垃圾消息过滤器。两款过滤工具的技术基础都采用了Facebook的人工智能系统。

该公司表示，这两项工具可用来减少垃圾消息的数量，同时屏蔽内容和视频中的攻击性评论。

自动评论过滤器自去年9月就一直存在，用户可以选择自动启动该程序。该程序可利用机器学习来识别可能引人反感的评论。如果在评论过滤器开启的情况下仍然出现攻击性评论，那么用户可以像以往一样直接向Instagram报告。Instagram表示，评论过滤器目前仅支持英语，不过未来将支持其他语言。

另一方面，垃圾消息过滤器自去年10月上线以来就一直处于对外界保密的状态。而上线9月有余都未被用户发现，于 Instagram 而言已经说不准是好事还是坏事。目前该功能可以自动清除英语、西班牙语、葡萄牙语、阿拉伯语、法语、德语、俄语、日语和汉语共9种语言的垃圾消息。

雷锋网了解到，Facebook于2012年以10亿美元收购了Instagram，并将其内部技术迁移至Facebook的数据中心。

据报道，此次Instagram 发布的评论过滤器就是使用了Facebook 旗下AML实验室建立的“Deep Text”系统。在Facebook 上，其可以结合机器学习辅助器完成每日 40 亿次以上的翻译功能的处理。此外，该系统还能在一秒之内理解超过二十多种语言的数千封邮件的内容。

如此前雷锋网报道的 Facebook 在AI+广告中的应用和探索一文里，就详细的介绍了这一文本系统对 Feeds Ads的支持。

去年6月，Deep Text上线。其一开始被定位为内部工具，用来帮助Facebook 工程师快速排序大量文本，创建分类规则。其后 Instagram 高管深入了解该系统之后，立即看到了机会——借其打击垃圾邮件。因为对于Instagram 的用户来说，垃圾邮件几乎是一个极其影响用户体验的烦恼。

在决定使用该系统之后，Instagram 第一步就是聘请了一批人员对该平台进行评论，并将评论按照“垃圾邮件”和“非垃圾邮件”分类。事实上，这种工作，在社交媒体涉及的技术行业而言非常普遍。先利用人类来训练机器，让其执行单调甚至无聊的工作，如此反复，最终机器会慢慢变得聪明和智能。

Instagram 相关负责人表示，最终通过不断地数据整合，有3/4的数据被送入 Deep Text。基于此，Instagram 的工程师可创建算法，并对垃圾邮件可进行正确的分类。

在经历4个多月的不断测试和研究后，Instagram 团队在去年10月悄悄地上线了垃圾邮件过滤的功能。Instagram 的CEO Kevin Systrom对该功能的效果感到十分满意。他决定利用 Deep Text 来处理更复杂的问题——消除与Instagram 社区准则相悖的意见或评论。为此，Instagram 还公开发布了一个 1200字的长文，来解释其社区的精神。

与垃圾邮件过滤功能的开发过程类似，这次Instagram 又聘请了一大批的人员，每天就重复干一件事——看评论，并确定该评论是否合适。然后将其分类是否涉及欺骗 or 种族主义 or 性骚扰等等。所有这些工作人员都必须会两种语言。经过一段集中的处理，这些人一共分析了大约200万条评论。

同时，Instagram的员工率先在自己的手机上内测了该系统，以此协助公司调整算法。与垃圾邮件算法一样，该系统会基于文本语义来分析发帖的人和评论者（以及其发表的历史评论）之间的关系。通过一段时间对神经网络的训练和使用真实数据对模型的测试，Deep Text 已经可以探查到文本之间非常细微的语义差别。

直至今日，Instagram 终于正式宣布两大工具的上线。

当然，就目前这两大工具而言，仍然存在一些算法缺陷，如当被问及一些特定句子时，系统无法给出具体的回应。经过前文对 Instagram 这两个工具的开发过程的描述，我们也能看到 Instagram 的AI仍然依赖人类的力量，来训练机器学习系统。

正如 Facebook欧洲、中东和非洲地区公共政策副总裁 Richard Allen 如是表述，Facebook“还需要很长一段时间，才能依靠机器学习和人工智能来处理评估仇视言论时的复杂性。”

注：部分资料来源于Wired

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

1人收藏

李秀琴

记者

跟踪Fintech和区块链（微信：cqmm16，备注身份姓名来意，thx）

扫描关注作者微信

发私信

当月热门文章