0
在雷锋网拜访络策网络科技之前,对方给发了一份关于公司和产品的简介资料,内容非常简洁,都是一些落地到实处的技术用法,如果没人讲解,你很难认为这是一家人工智能公司。这种逻辑简单明了的“技术宅”风格倒是与其创始人Jeff Lin的气质十分契合,Jeff Lin是美籍华人,说话短、平、快,直来直去,不绕弯子,在介绍其产品时没有像很多创业者一样,一直在说自己的技术有多么多么牛,而是不断地在介绍自己技术的应用场景和用途。
Jeff说,过去20年他一直都在做科技公司,地图、图片分享等领域都有涉猎,最近的一次创业是一个比较有名的图片分享软件“图钉”。大概从2014、2015年左右开始,Jeff就接触到了人工智能这一块,并且认识了络策公司现任首席科学家的Carl Kovamees。Carl当时就在做神经网络相关的项目,是其前公司的联合创始人之一,后来其公司被收购,恰逢人工智能风潮袭来,Jeff就和Karl一拍即合,成立了络策。
一、老百姓也能用的大数据产品
刚开始看络策产品资料的时候,雷锋网的第一个直观感受,就是他们做了一个排行榜类的公众号——Insight排行榜,在内容创业如此泛滥的今天,这不免让人感觉有些缺乏新意。当跟Jeff聊了之后才知道,这只是他们把人工智能落为实际用途的一个产品而已。
“老百姓可能都听说过大数据,一提起大数据,就觉得很高科技,很厉害,但是多数人都不明白大数据具体是干嘛的,我们这个Insight排行榜就是用神经网络收集了大数据,然后用最直观的表现方式给老百姓使用”。
Jeff介绍,Insight排行榜是一个消费品品牌排行榜,在这个公号内不定期的会发布不同领域品牌的排名,但是与很多网络上排行榜不一样的是,这份榜单并非人工撰写,而是依赖大数据分析自动生成排名,再由人工放到公号上去。
简单来说,公司的大数据系统接入了很多电商评论系统、社交网络工具(微博、Facebook、Twitter等等)以及论坛等等,爬取上面关于商品的评论文字,通过NLP分析处理,得到这些产品在网络上的“使用反馈”,而这些“使用反馈”则成为这个榜单最主要的排名依据。
“这份榜单是我们认为最公正、客观的,因为我们是拒绝与品牌商合作的”。
上面Jeff所说的拒绝与品牌商合作的意思是不给予他们竞价排名的机会,从而保证榜单的公正性。而在客观方面,由于排名受网络评论影响,难免会遇到一些“水军”或者恶意刷评,所以在这方面,Insight排行榜在进行数据分析的时候,做了一个排重机制,把一些重复的评论抵消掉,让其尽量拿到真实使用者的反馈。
络策在用大数据处理榜单方面尝试了三个月,在完全没有推广的情况下,做到了微博4W+粉丝,微信公众号由于需要长期积累,目前还没开始发力。
做2C产品对于做技术的人来说,通常都很难,因为消费者和企业在技术方面的需求不一样,技术公司想在2C方面找到好的商业模式还是有些困难的。
上面说的Insight排行榜只是络策在人工智能落地方面的一个实际性的尝试,虽然其面向消费者完全免费,又不和品牌商合作,看似完全公益化,但是其中却有个商业逻辑在里面。
虽说Insight排行榜为了公正不与品牌商搞竞价排名,但并不是完全拒绝品牌商方面的合作从而产生收入。如此说来看似矛盾,但是这个商业逻辑却很讨巧。
当Insight排行榜一个品类的榜单出炉之后,他们也会找这些上榜的或一些没有上榜的品牌商进行商谈,商谈的内容并不是关乎排名本身,而是关乎企业为何处在排名中的位置。
举个例子,在榜单中做一个奶粉排名,榜单出炉之后,可能第一名、第二名对自身认知很明确,觉得排名没有异议,就不会予以理会。但是对于排名在中间或后几名的厂商,会想知道自己为什么会处于现在的位置,为什么排名不会更靠前,这个时候,络策的商业逻辑就显现出来了。
络策方面会向这些品牌商提供榜单排名时的数据,以及经过分析处理的网络评论与反馈信息,让厂商意识到自己的问题在哪,比如,有很多用户反馈“奶粉太甜了”之类,这样能够让厂商针对这个问题进行整改。而提供这些数据与反馈,品牌商是需要向络策付费的。
以上所说,就是络策的大数据分析服务其中之一。在其目前主营业务之中, Insight大数据分析平台是其产品重要布局之一。 Insight大数据分析平台是一个SAAS服务平台,用Jeff的话来说,几乎不需要培训成本,让非技术人员只登陆网址就能进行专业的数据分析,而络策方面则对用户的分析结果进行收费。
据介绍,这个分析平台可以帮助品牌商抓取24小时内的社交网络内容,让品牌商及时了解该品牌在过去24小时的网络评论,除了能够收集各种关于品牌的相关数据,更能帮助品牌监测舆情,如果系统的语言处理机制发现大规模的负面评论,品牌商就能够立即悉知该消息,并且通过平台直接连接社交网络(微博)对用户进行相关解释。
图片
利用自然语言处理做大数据分析的技术提供商还是有很多的,但是这些厂商在向品牌商提供网络数据的时候,对于图片内容是很难搞定的。
“图片数据也十分重要,有的时候一张图片里面有字,很多数据系统能够抓取,但更多的时候只是一张图,你要分析里面有什么就必须需要神经网络的支持。”
Jeff告诉雷锋网,为了搞图片分析,络策做了七个独立的神经网络,包括半督导的训练集群和由GPU服务器组成的生产集群环境,支持不同品牌的logo识别、成人内容识别、1,000+通用物件识别(日常用品、汽车等等)、360+环境背景识别、人脸识别(性别、年龄段以及表情的识别)等等。
关于先做7个神经网络,Jeff表示,这是基于他们首席科学家以往的经验,先搭了7个神经网络的框架,而这些框架有内在逻辑在里面,并不是随意搭的。举个简单的例子,比如一个品牌商在收集数据的时候,肯定想要知道“我们产品出现的同时有没有其他品牌出现“(logo识别)、”用户在用我产品的时候跟环境背景有什么关联”(通用物体、背景识别)、“什么年龄段的人在用我们的产品”(人脸识别)等等。
目前,络策针对这些神经网络在进行调试,不停地给他们进行训练,准确度已经达到了人们能接受的容错范围。
Jeff直言,在图片识别这一块,识别率不会达到百分之百,就算人眼因为折光等问题都可能产生误差,所以神经网络只能在不停的训练之下让其准确度更高,达到商业数据分析用途的标准就可以。
视频
在视频分析服务方面,Jeff给雷锋网演示了一个系统对可口可乐的广告视频分析的Demo,视频播放过后,系统直接就能给出数据:
可口可乐短视频总长16秒
监测出可口可乐的logo出现了3次,时长11秒,分别为2秒-6秒,9秒-11秒
14秒-16秒之间 • 同时监测出logo出现时的背景场景,通用物件和人物信息
这个视频分析功能将被用在品牌商对视频品牌露出的检测等方面,比如品牌商在电影中投放广告,想知道自己的植入到底出现了多少,这个时候,该系统就能发挥作用了。然而这种视频可视化的搜索系统目前却少有人在做。
“视频分析现在很少有人做,主要原因是框架搭不好。”
Jeff说,视频分析主要核心点在于框架,直接影响视频的拆帧。比如,一个20帧的视频,一秒钟能够拆成20张图片,如果系统框架做不好,速度不够快,在一秒钟内不能分析完这20张,接下来的时间就会有新的图片进入,系统就会堵塞 。而他们的视频分析框架经过优化之后,能够达到非常流畅的分析效果,甚至用在直播的画面上也是可以的。
目前人工智能概念炒得火热,多数产品都处于概念之中,对于人工智能如何落地等商业模式方面的探索显得有些匮乏。
“作为一个创始人,应该明确的知道要做什么”。
有着20年科技行业从业经验的Jeff,对市场的观察还是十分敏锐的,无论是大数据榜单、大数据服务亦或后来的图片视频分析,这些产品都能够很好的落地到实际用途中,把目前火热的“神经网络”、“NLP”、“人工智能”等等热词融入到了产品中,想清楚了商业模式并加以实施。
去年12月份,络策网络科技拿到了由飞拓无限、德同资本的投资,飞拓无限是国内一家提供移动互联网整合营销服务的移动互联网公司,去年年底刚在新三板挂牌上市,也就是说,此次融资除了让络策有更多的资金投入技术研发之外,还在资源整合上增益了不少,加快了一些其“人工智能”技术在跨社交媒体的大数据服务的落地。
总之,把技术快速用在实际用途中,是络策目前的风格,也是目前所有创业者最应该优先考虑的事情。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。