慧川智能CEO康洪文：AI如何让视频创作更加简单 | CCF-GAIR 2017

本文作者：汪思颖

2017-07-08 14:04

导语：通过图片就能生成视频，这样的黑科技你想知道吗？

7月8日，由中国计算机学会（CCF）主办，雷锋网与香港中文大学（深圳）承办的CCF－GAIR 2017全球人工智能与机器人峰会在深圳大中华喜来登酒店举行。在AI+专场第二场，慧川智能CEO康洪文为我们带来了《AI(爱）让视频更简单》的主题演讲。

对于视频从业人员来说，“加班”、“熬夜”这样的词汇常常出现，他们的工作异常辛苦，那么，究竟该如何改变现状，请看康洪文的描述，通过AI让视频如何让视频创作变得简单？

AI助力视频创作的背景：

视频工作者有非常强大的图文创造能力，有强大的讲故事的能力，不应该让他们的创造力被制造视频的烦琐工作局限掉。
视频市场特别是短视频市场是爆发趋势，目前的视频网络用户已经突破了5.5亿，保持着8.1%的增长速度。很多图文媒体去转作视频，希望在视频市场上获得更多的受众。
在今日头条还有微信公众号平台去统计，里面67%的文章都非常适合用视频的方式来呈现。另外传统的网站以及像电商，淘宝上有十亿级的商品，上面很大量的商家都希望能够为他们的商品制作视频。

智影的产品功能实现：

基于网页的界面，通过界面能够把任何一个网页或者一段文字输入到输入框中，后台的AI算法就会根据这段文字进行分析，找到里面所有这些关键点。
通过文章的语义分析，就能够自动和素材进行匹配，对每一段话、每一个句子找到对应的多媒体素材，比如说图片、视频、社交媒体分享，找到以后自动生成的故事线，在后面还有一些延伸的广告进行匹配。
如果有修改需求，可以再进行修改。提供一个非常简便的在线剪辑和预览平台，客户只需要注册一个账号就可以进行剪辑了。根据用户修改之后，可以在界面上进行素材的调整，比如说还可以截取每个视频片段的长度，起始的时间，甚至在图片上添加一些像画字或者文字的信息。

具体的优点：

通过这个系统能够提升用户的效率近百倍，以前可能会花几个小时去做一个视频，现在通过智能手段能够压缩到几十秒钟。
用户满意之后可以直接点击生成视频，在云端这个视频就可以生成下载好。不用很强大的机器，在任何一个咖啡馆，任何一个笔记本就可以完成这样的创作，完成之后回到家这个视频一键下载好，已经上传到所有的社交媒体上去了。

所用到的技术：

计算机视觉。刚才讲到会去素材库跟结构化素材进行匹配，对所有的素材进行理解，现在已经能看到计算机视觉里面有一些突破性的进展，比如说场景的识别上，计算机的识别能力已经在接近甚至是超越人的识别能力。
自然语言处理。在这方面我们用到了知识图谱，比如说情感识别，名实体识别。
大规模计算。现在GPU的发展速度非常快，将GPU和深度学习这个框架结合起来。

现在所做的动作：

分析海量视频素材，以及图片素材和多媒体素材。通过将素材进行结构化，理解视频里面出现的所有物体和人，以及他们正在进行的动作，能够把它构建一个精确到每一帧的视频内容标签。
开放API。这能够帮助所有对视频有需求的人进行理解，提供这个视频进行全网视频的结构化。这里面包括两个主要功能，一个是视频内容的理解和标签化，我们提供包括时间、地点、人物、事件的多种标签，这里面有一千多个视频结构化标签。另外我们还创造了全球500+明星的数据库。

详细内容请看雷锋网后续报导。雷锋网原创。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

0人收藏

专题

GAIR 2017

本专题其他文章

汪思颖

编辑

关注AI学术，例如论文

发私信

当月热门文章