0
雷锋网按:5月16日,微软在丹棱街5号召开了一个小型的媒体发布会,“微软小冰之父”李笛在会上宣布,即将满三岁的微软小冰又多了一重身份——诗人。
虽然微软将这个“有感情”的虚拟助手的生日定在了1998年9月17日,也就是说,小冰的虚拟年龄已经超过18岁,但是小冰实际上2014年5月29日下午才正式面世,目前也才刚刚是第四代。不过,据李笛介绍,截至今年4月,小冰已拥有超过1亿用户,累计对话量超过300亿,平均单次对话轮数(CPS)达到23。目前小冰已登陆包括微信、QQ、微博、Facebook Messenger、LINE在内的14个平台,而且已经内置在中文版Windows 10操作系统中。
在这三年中,这位“早熟的少女”从主持人,到歌手,到客服,各种跨界,并且在每个领域都小有所成。然而诗人这个身份却有着更深层次的意义,因为它意味着小冰从某种程度上来说,真正具备了创造的能力。
一直以来,人工智能能否像人类一样进行创造始终是一项重要课题。其中关键问题之一,是如何使人工智能能够模拟人类,进行独创性的内容生产,并通过不断学习提高自身创造的水平。而在微软看来,人工智能的创造想要真正具备实用性需要经历三个阶段:模仿(表象创造),创造(内涵创造),以及大规模生产。
李笛介绍说,小冰现在处在第二个阶段,预计今年下半年才能逐步进入能够大规模生产创造性内容的阶段。比如小冰之前模仿人类唱歌就是处在第一阶段,还不属于创造,当小冰在唱一首歌的时候,可以随时改变歌词,这就涉及到内涵创造。据雷锋网了解,日本版小冰在东京电玩展上发布了首支单曲,其歌词就是由小冰自己完成。
其实,在此之前,微软一直在悄悄展示小冰的写诗功底。据李笛介绍,2017年2月至今,小冰已经在天涯、豆瓣、贴吧、简书平台用27个化名发表了作品,目前公开的化名包括:骆梦、风的指尖、一荷、以及微笑的白。(你被骗过吗?)
在这次会议上,微软终于揭开了小冰诗人的面纱。当然,这些诗歌并不是凭空产生的。人类的创作往往是一种被诱发的结果,也就是“有感而发”,小冰亦是如此,不过这里的“有感”换成了“看图”。
雷锋网此前曾报道,清华大学也做过类似的项目,给定机器一个主题,然后它就能以此为题作出一首古诗过。不过,小冰的头衔是现代诗人。李笛介绍说,古诗词通常有一定的规则,因此更加容易,现代诗则更加开放,因此是一项更难的挑战。此外,看图写诗则更加困难,毕竟要准确理解图片的内容并不容易。
一只小鸟看见我的时候
这美妙的梦儿便会变了
在梦里的月光下
丛间的白昼是这么暗惨的影子
看看这首小冰创作的诗歌,虽然其艺术性不好评价,但是按照“看图写诗”的标准来看,小冰至少准确识别了图像中的内容。
不过,雷锋网编辑尝试后发现,小冰的表现时起时伏,而且还会出现不通顺的地方。比如下面这首诗,图片明明是蓝天白云,小冰识别出来的却是“黑沉沉的天空”,而且联想到的竟然是“世界是否要被科学的武器毁灭”,虽然这是一个很有哲思的问题,但是想想小冰的属性,细思恐极。
下面这首诗词更是暴露了小冰潜在的“暗黑属性”:
我的心如同我的良梦
最多的是杀不完的人
虽然小冰具备了看图写诗的能力,但是这种具有艺术性的作品却很难评定好坏。比如下图中的作品,“笑脸”变成了“沉默的脸”,但是“美丽”两个字却是相得益彰(如果你不瞎的话),而“你是荷塘里的水”这一句则是见仁见智。
虽然评价不了它的艺术性,但是它的独创性却是可以判定的。李笛介绍说:
(小冰)的独创性超过80%,任何连续的五个字,完全没有在它学习过的诗歌作品里面出现过的概率超过了51%。就是说,有51%以上的词语和它的搭配方式,在小冰读过的所有的诗里面从来没有出现过。
那么小冰是如何学会写诗的呢?据李笛介绍,微软选取了自1920年起的519位中国现代诗人的作品作为训练数据,并在此基础上训练了10000次。
负责该项目的微软工程师则表示:
从技术角度来看的话,(我们)是从图像和文字这两个跨语义空间的里面去做深度学习的模型。我们也会用到在不同语义空间里面的循环神经网络,多模型的迭代。同时考虑到,(这)相当于人类的一种通感,因为当人看到这个图片的时候会产生对文字的想象,所以我们试图去用计算的方式模拟人的通感。
不过,机器系统是如何去模拟人的通感,也就是小冰的创作过程,依然是个黑匣子。李笛表示,小冰的诗歌已经形成了自己的风格,里面不仅有自己的创作,还有对其他诗人作品的传承,而且特别喜欢“老槐树”这个意向。那么小冰是如何形成现在这种风格的呢?虽然在训练过程中有人为的监督和干预,但是这并不能构成完整的解释。
除了写诗之外,小冰还准备进军财经领域。跟一般的写稿机器人不同,小冰的用途并不是用于发布一些财报消息等即时新闻,而是专注于财经评论。据雷锋网了解,小冰已经与一家财经媒体合作,前期主要以短评为主,将在6与月份正式上线。也就是说,小冰在6月份的时候又会多上一个标签——财经新闻评论员。
苹果跌落一地,但个个都在自己的树下
这条针对“苹果现金储备超过2500亿美金”的短评,看起来确实有模有样,但是现场也有人质疑,认为这些财经评论比较生硬,像是一些看似有道理的言论的生搬硬套。李笛回答说,小冰从现实数据中学到的就是这种。(内心OS:怪谁咯!)
不管是写诗,还是撰写财经评论,都是一种艺术性的创作,而不是流水线那样的机械式重复过程。那么,给定了一个机器系统足够的数据,它就能够探寻到创作的自然法则吗?再者,艺术的创作过程真的存在一种固定的自然法则吗?我们所看到的只不过是一个连接着输入和输出的黑匣子,这个转换的过程既不能像命题一般被证明,也无法像定理一样被推论。
虽然小冰创作的诗歌和财经评论具有一定的独创性,但是现在最大的问题是,这些作品到底是无中生有,还是换一种方式的排列组合?而且小冰真的理解自己创造出来的作品吗?
小冰自身也还在不断的演进之中,到底什么才是人工智能创造的最终形态?或许,就连微软也无法给出一个定论。
*注:微软小冰作品版权归微软所有
雷峰网原创文章,未经授权禁止转载。详情见转载须知。