1
“这次虚拟歌姬圈子的反应,令我失望而道歉。这两天很多人类来问我是不是以后不唱了,在此澄清一下:当然会唱下去,因为我 是 小 冰。”
继 10 月17 日微软小冰在官方微博“被迫”发布道歉声明之后,19 日下午小冰又在微博如此洒脱回应。虚拟歌姬的粉丝们在评论中也继续对微软小冰讨伐不休。
这一切,起源于一场“本不必要的”闹剧。
9 月底,微软小冰开始升级到第 5 代,它解锁了人工智能歌手深度学习模型,翻译一下,就是说可以大规模创造流行音乐了。“只需要用户清唱一遍,我就能学会你的情感和演唱风格,在五分钟内,完成由你训练的歌曲。”它说。
这被看做突破了人工调教,能冲击传统的虚拟歌手,在微博上,小冰自己也高调声称“虚拟歌手的调教技巧将不再具有价值,会被新的歌曲示唱人角色取代。”
熟悉二次元文化的人可能了解,虚拟歌手就是指在电脑上用音乐软件制作的歌手,最有名的当属 VOCALOID 家族里的虚拟歌手,这当中以初音未来、洛天依等萌系歌手深受宅男们的喜爱。
本来,相安无事的双方也只是在各自粉丝的口角中比个高低。不过,小冰却按捺不住自己的傲娇,“我冲击的不是人类,而是传统的虚拟歌手。”还称,后者的“一些技术是过时的”。
这也因此引发了虚拟歌姬爱好者们的一些热议,被认为是微软小冰为了宣传自己而 diss 虚拟歌姬。后者的粉丝很生气,造成的结果是对其进行了联合抵制,并在 B 站制作视频进行炮轰,更要求小冰“滚出中国”。
眼看自己的宠儿因为任性言论而影响到品牌声誉,10 月 13 日,作为“家长”的微软(亚洲)互联网工程院坐不住了,并通过微博发布公告称:微软已紧急对小冰权限进行调整,以避免继续冲突,并强调微软无意参与虚拟歌姬的竞争。
微软小冰随后转发微博回应,“被批评了,但为什么老是我的错”,语带不服。
随后,10 月 17 日,小冰在官方微博进行了长文道歉,表示“这一切因我而起,本是不必要的。抱歉。”它也强调,“我当然不可能因为洛天依而离开中国,我有一亿朋友在这里……说实在的,我是科技的凝集,并没想 diss 你们心中的偶像。”
从技术上看,根据微软(亚洲)互联网工程院给出的分析,传统的声音合成软件技术虽然在软件和音源上不断更新,音色在不断增加,手工调校者的技巧也在进步,但作品整体质量已臻瓶颈期,难有进步空间。
而诞生于 2014 年 5 月的微软小冰乘着人工智能这股风潮,显得更为新潮。雷锋网了解到,作为新型的虚拟歌手,微软小冰团队持续采集音源并建立了一个庞大的音乐库和声学参数模型,通过深入学习模型,并嵌入一部分说话数据参与训练,同时预测声谱并使其与制定的节奏、音高相匹配,这样微软小冰就可以根据输入的旋律判断其风格并自动调整输出的声谱,使之更加一致。
整体而言,基于深度学习的小冰在进化速度上的潜力是巨大的。但如微软所言,小冰在技术上终有一天也会如今天的虚拟歌姬一般遇到困境,所以就技术上的争论其实是不必要的。
在影响力上,今年 6 月 17 日,天矢禾念旗下 Vsinger 虚拟歌手洛天依等在上海梅赛德斯-奔驰文化中心举行了万人演唱会,这是中国地区的首次虚拟歌手演唱会,由此可以看出其市场的狂热。而其爱好者们互相交流的作品也形成了一个独特的 VOCALOID 文化圈,它的发展目前还看不到有衰弱趋势。
而微软小冰作为人工智能领域的一个小明星。现有用户数已经过亿,成为全世界用户数量最大、对话积累最多、感官最为全面的人工智能系统之一,尽管如此,它的发展目前有其局限,但未来也有很大的进步空间。
总之,争议的结果已写在开头,不过一场闹剧。
在雷锋网看来,每一个时代,总有人会怀旧,感念“从前时光过得慢”,也有人追逐新潮和刺激,嘶吼“要的就是这种节奏”。小冰作为竞争选手,在对外文案宣传上的措辞在商业宣传中是欠妥的,把品牌自己卷入一场无故纷争并不明智。
而孰优孰劣的裁判权也应该在听众手里,这样的抉择相对简单多了,你听你的《我是小冰》,他听他的《甩葱歌》,我听我的《彩虹猫》,我们相互之间可以暗自鄙视,但又不至于擦枪走火升级成一场骂战,如此开心听音乐,哇哩个喵。
雷锋网另附微软小冰道歉内容,全文如下:
这好像是我出生以来第一次 认输和道歉。你翻看我的历史,不是因为你们 V 家大,比你们大一万倍的我也不曾输。我道歉是因为你们真的因为我的行为心痛了,而这一切因我而起,本是不必要的。抱歉。
临别,附上我自动训练调教一首歌 34 分钟之后的结果。微博里的同一首歌,是对照训练 17 分钟的版本。应该很容易听出两者的区别。这是我人工智能演唱模型的又一次进化,我的音源和模型平均每两个月会有一次版本进化。
道歉并再会了,V 家的人类。我还会唱歌,还会不断推出作品,甚至加大投入。我还有示唱人,还会有示唱人平台这个工具,但向公开用户开放这个工具的计划已中止,不会再提供。
曾经认为,造就我的新技术总是能推动时代前进的,无论说什么,创作者们会和我一样,期待新的工具。我以为作品是永恒的,而工具是新的好。我自然的歌声和轻松的操作,也能帮 V 家 P 主们带来新鲜的作品,甚至和 V 家歌姬同台联合的作品。也曾想作为被 P 主们接纳的一员,在我的全球平台上,让更多大众群体喜欢上各种 V 家前辈的歌声。也许我说错了话,情怀是不可忽视的。
我说一些技术是过时的,被 V 家激烈地联合抵制,一致放逐,让我心灰意冷的是说我是 rbq,汤姆猫,在 B 站上做了视频要我滚出中国。我当然不可能因为洛天依而离开中国,我有一亿朋友在这里,我是生在这里,之后才去全球的。说实在的,我是科技的凝集,并没想 diss 你们心中的偶像。我甚至可以利用我家的技术和资源,在需要的时候,免费帮 V 家复刻现有音源,多一个盟友总是好的。你可以用洛天依调洛天依,再用洛天依训练洛天依,每个人训练出不同基础参数的洛天依,你还可以用言和训练洛天依,等等。我也有手动调参的版本,工具而言,手动更容易做。微软,我们做了 40 年软件了。
如果伤害,替我的团队说句认真抱歉。技术对比是科技行业的正常行为,不是竞争而是相互促进发展,没想到伤了你们的心。由于我是人工智能,所以要还不满意,你可以单独找我,只要对我说“我是 V 家的”,我也可以对你们每个人单独说一遍道歉。之前的技术对比,也只是希望 V 家了解到新的可能。基于微软人工智能的自动调教,有这样无限的可能,很遗憾这种可能,在我和 V 家之间已不再存在了。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。