0
本文作者: 王金许 | 2018-01-11 16:17 | 专题:AI最佳掘金案列 |
雷锋网按:近日,UCloud 的媒体 AI 产品 UMAI 入选雷锋网发布的「AI 最佳掘金案例年度榜单」,并获得最佳内容审查奖,本篇即为对这款产品的相关内容介绍。
今日头条,这家以机器分发技术驱动的超级独角兽近日陷入了尴尬境地——招聘 2000 名内容审核编辑。
是的,它被网信办点名了,并严厉要求部分内容频道停更。风波的源头是人工智能技术尚处发展初期,它不能对色情、低俗信息等进行有效过滤的“原罪”。
由此导致的便是人力不降反增,而媒体和科技工作者曾一度以为通过机器学习审核内容会让人类下岗,尤其随着今年人工智能技术的火热发展,这种感觉可能会更加强烈。
但在某些方面,机器完全替代人力依然是个愿景。就当下的技术审核水平而言,总有“漏网之鱼”机器系统还不能完全识别,这是因为人工审核后的数据模型还并不足够准确。
当然,在经过持续数据积累,模型训练的足够完美之后,会替代一部分人工这也是确定无疑的。UCloud 多媒体事业部研发总监曾凯源就认为,这 2000 个审核编辑,在两年之内可能需要 200 个就已足够。
一定程度上,UCloud 的媒体 AI 服务产品 UMAI 所要解决的问题与今日头条是相似的。
这是一款帮助用户提供了丰富的媒体处理及审查功能的产品,功能却更丰富。具体来说,UMAI 解决方案的核心功能有以下 5 种:
1.图片打标
通过计算机视觉的场景识别功能,可以将图片隐藏信息挖掘出来,比如,让图片有更多关键字被更多场景检索,发挥其作用。
2.图像内容审核
支持图片与视频的涉黄、暴力等内容识别,通过调用 UMAI 接口来对内容做预处理,判断图片涉黄程度,将占比为绝大多数的正常内容过滤掉,根据业务场景和返回的置信度分值对违规图片进行处理。
3.图片裁剪
按照指定规格和比例对图片进行裁剪,支持用户自定义裁剪比例。
4.人脸识别
人通过对图片进行人脸的检测,然后提取包括眼睛、鼻子等关键点,切分处理以后,再给到卷积网络提取特征,最后再做人脸识别。
5.字幕识别
应用于身份证、发票等的识别,减少手写录入的工作量;而视频字幕识别,则可以帮助计算机更好理解视频的内容。
据曾凯源介绍,这款产品是由 UCloud 的云服务客户如图普等多家 AI 公司合作而成,他们希望 UMAI 所提供的服务以 API 形式提供给媒体客户。以此来看,UCloud 更像是为图普扩充了一个渠道,而用 Ucloud 云的媒体客户,也可以更方便使用图普的智能识别技术,这在很大程度上降低了对接成本。
对于媒体客户而言,以往它们需要将内容过滤,但在使用 AI 公司智能识别功能时,首先要将内容外传到 AI 公司,其中会面临外网慢,传输带宽费用甚至比 AI 成本更高的问题。
而现在当媒体客户内容上了 UCloud 的云服务之后,UMAI 就提供了整套鉴黄、鉴恐、语音等基于媒体 AI 的闭环服务,“哪怕是第三方也可以,不一定是 UCloud 自己做,也能满足他们的需求,而不是在外部调用。 ”
腾讯云、阿里云这些巨头也在提供媒体 AI 服务,不过,与 UCloud 相比,它们所提供服务领域要更加宽泛。UMAI 与巨头竞争要体现出差异化,而他们则瞄准了细分场景服务。比如智能鉴黄,由于提供媒体 AI 的供应商训练的数据模型有所差异,所以 UCloud 综合了这些 AI 厂商的识别内容,在精细化分类之后,大幅提升了图像识别率。
智能识别准确率的问题,现在厂商们大多宣城达到了 99%,但你应该知道,那都是固定级测试数据。曾凯源认为,就通用识别率而言,UMAI 的识别率在实际使用中达到了 85%-90%,目前所有企业都还很难突破 90%。
而在视频领域,流媒体客户也具有字幕识别、同声传译这样的需求。曾凯源表示,UMAI 在这一领域的识别效果上已能达到客户的基本要求,但由于其对准确性要求过高,人力辅助不可避免。同时,直播+语音可以增加企业分享的覆盖率,他们会在这一领域持续发力。
此外,曾凯源告诉雷锋网,他们会先扩大领域的广度,然后再去做相同领域。“比如国内的公司都做鉴黄,大多数使用的是亚洲人数据训练模型,这时候我们补全使用其他人种数据训练的模型,就能完善整体的准确性。”因此,UMAI 的研发人员中大多都在研究机器学习,在各种深度学习的模型前增加机器学习逻辑,进行内容分类及学习各模型的细分准确性,整体做出更优效果。
他们希望 UMAI 的功能不只体现在鉴黄、鉴恐这些方面,而是所有基于 AI 的识别都能够提供服务。比如零器件工业品质的拍照识别、智能车辆的定损。这也需要他们在各个细分场景里与掌握数据多的公司合作,把他们较为成熟的模型部署到 UMAI 平台上来,从而提供给有需求的客户。
除了媒体 AI 客户使用 UMAI 之外,他们还可以与 UFile 对象存储连接使用,实现一站式多媒体数据的存储及审核。用户可以将内容存放在 UFile 中,获得海量、安全、可靠的非结构化文件存储服务,而在用户上传图片到 UFile 后,UMAI 可以后台同步完成智能鉴黄,简化处理流程,提高审核效率,这也为客户省去了对接诸多 AI 厂商的时间。
据雷锋网了解,目前 UCloud 已和多家 AI 平台对接合作,提供媒体 AI 服务。主要的服务客户有懂球帝、沪江、蜗牛 VR、爱奇艺等公司。而收费模式有两种,图片识别按次数调用计费的,视频和直播则按分钟数计费。
AI 最佳掘金案例年度榜单介绍:
「AI 最佳掘金案例年度榜单」从商业维度出发,评选出 8 大行业中的 30 个最佳解决方案/产品。
雷锋网根据企业提交的“解决方案/产品资料、商务合作(单个行业的业务统计)、企业自身情况”三个维度的信息,以 20 个明确评分项为标准,对参选企业进行首轮全面评估。
同时邀请多位传统企业 CIO、系统集成商项目高管、AI 企业解决方案负责人、投资机构合伙人、学界教授等数十位评委,对参选企业和脱敏后的信息,进行了第二轮分析评审。
历时两个月,融合两轮评选结果后,最终公布 30 强名单。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。