您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
脑洞 正文
发私信给奕欣
发送

3

你或许不知道偷情对象的性别,但电脑可以

本文作者: 奕欣 2015-09-01 18:04
导语:这么可爱一定是男孩子

你或许不知道偷情对象的性别,但电脑可以

在网上聊天,没有人知道你是否是一只狗。偷情网站Ashley Madison的信息泄漏之后,人们才发现男女比例非但没有网站说的9:1,而且还有一大半是公司伪造的。聊了半天,才发现自己在搞基……

如果给你一篇文章或是一段话,你能判断它出自男性还是女性之手吗?我们可能只能靠蒙,然而电脑可以。

研究人员用一个叫Winnow的软件分析了566份出版的文档,这些文档主要为英式英语。该软件首先经过了“调教”,收录了一批已经标明作者为“男性”或是“女性”的文章。从中,研究人员从词性特点进行统计,特别是一些在英语句子里不表示意义的虚词;或是一些短语,如“above the table”这样的用法。

然后,研究人员开始用未注明性别的文章来测试,涵盖了多种体裁。据称,准确程度达到了98%。

在研究中,研究者发现出自男性之手的小说多会出现以下词语:“a”、“the”和“as”;而更能证明作者是女性的词语是:“she”、“for”、“with”和“not”。而在非小说的文章里,男性更喜欢用“that”、“one”,而女性更常用“for”、“with”、“not”还有“in”等词。

虽然这样的研究还比较粗浅,但对于信息匿名的网络世界而言,这可以为“偷情成功”提供必要的性别判断依据(微笑脸)。

via nytimes

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说