0
内容产业庞大而复杂,涵盖了文字、影响、语音等各个方面。不过,近年来,随着 AI 的加入,内容产业在各个方面都取得一定的突破——精准的内容分发,全面的内容应用,自动化的影像生成,高质量的语音合成、快速的语言传译等。
毋庸置疑,AI 为内容产业打开了一扇全新的大门。
在此背景下,雷锋网推出了「AI 最佳掘金案例年度评选」,从商业维度出发,致力于寻找各个行业用户/客户问题解决能力强的最佳产品和解决方案。经过多轮的筛选与评审,评选结果终于在日前正式揭晓。
在内容领域,阿里文娱、影谱科技、深声科技、汽车之家、搜狗同传五家公司凭借各自的技术脱颖而出,分别获得了“最佳内容智能推荐奖”、“最佳 AI 影像自动化生产奖” 、"最佳语音合成奖”、“最佳 AI 内容应用创新奖” 、“最佳人工智能翻译设备奖” 。
作为一个视频内容分发平台,阿里文娱优酷旨在为用户提供个性化的服务。
目前,无论是影剧综长视频、资讯体育等垂类频道,还是短视频、小视频信息流,基于推荐技术的视频分发已遍布优酷应用的各个场景。2017 年,在优酷实现全站的个性化推荐分发后,用户观看视频播放量和观看时长分别提升了 30% 和 10%。
得益于优酷对短小视频的精准理解能力和对用户兴趣演变的实时建模能力,优酷为用户提供了千人千面的个性化推荐服务。
在短小视频内容的理解方案上,优酷将文本、音频、图像等看作不同的视图,对不同视图的信息进行拆分整合。先挖掘视图间信息的共有性,然后分别提取各个视图信息的私有性,最后对共有的同质信息与私有的异质信息进行整合。
在用户兴趣演化建模方面,优酷在传统的推荐系统中加入了时间流模块,提出了一种新颖的深度时间流框架,建模用户在连续时间上的兴趣演化,从而推荐用户更感兴趣的内容。并且,该深度时间流框架已被 AAAI2020 收录。
影谱科技是一家致力于智能影像生产技术落地应用的视觉技术企业,成立于 2009 年,是国内智能影像生产技术提供商及应用方案提供商。
通过对影像数据的多模态语义理解,借助深度学习技术实现影像再加工以及影像生成,影谱科技为传统的人工结合 CG 的影像生产方式带来效率和质量的提高。
作为智能影像系统的开发者及提倡者,影谱科技专注于视频影像的工业化进程,推动传统机器影像向智能影像的变革升级,在该领域有着技术与市场的领先优势。
另外,影谱科技还支持大批量数字内容视频化,融合多模态图像识别、情感语境、关键帧捕捉等关键技术,对视频元数据进分析和理解,进而机器可以自动化生产一段全新视频。
目前,影谱科技深入科教领域的教、管、研等环节,为科教产业转型升级赋能;探索挖掘视频增值价值、视频信息内容增强、影视轻工业自动化生产,优化文化传媒产业视觉呈现;用技术赋能内容自动化生产,支持各级媒体融合,打造综合智能化服务体系。
深声科技是一家专注于“智能语音”技术研发和业务落地的人工智能公司,2018 年成立之初即获得小米科技数千万天使投资。
不到两年,深声科技已自主研发包括语音合成、声音定制、声音克隆等七大核心技术,是业内少有的拥有语音合成全链路技术能力的公司。
深声科技采用可控的声学模型和卓越的声码器模型,能快速学习目标人的语音特征,将输入的文字转换成清晰自然的语音输出,并支持语速、语调和音量的设置,可为持续应用在同一或不同的场景。
另外,深声科技还建成了丰富的语音合成语料库,有专业的数据资源团队对数据大规模而严格的采集、拼音和韵律自动化标注以及人工校正的品质监管,能够向客户提供海量发音人资源和多种优质音色。凭借先进的技术和优质的业务能力,深声科技获得包括小米、金山、畅读书城、中国科学院、探迹、同行者等客户的青睐,合作覆盖多个应用场景。
在 2019 年 7 月斩获国际语音合成大赛 Blizzard challenge2019 中,深声 TTS 获得了亚军,代表着当前行业商用语音合成技术的最高水平。
汽车之家是致力于为汽车消费者提供选车、买车、用车、换车等所有环节的全面、准确、快捷的一站式服务。
如今,汽车之家已转型升级为“基于数据技术的‘汽车’公司”,建设了“车媒体、车电商、车金融、车生活” 4 个圈,通过产品服务、数据技术、生态规则和资源更进一步为客户赋能。
作为全球访问量最大的汽车网站,汽车之家构建了汽车行业最大最全的知识网络,涵盖各类汽车行业知识,实现多源异构数据的语义集成,形成了三类场景化应用:行业数据可视分析(之家大脑)、聊天机器人(家家小秘)和车机问答。
其中,“之家大脑”支持实体为中心的关联探索分析,能够进行多维度展示;“家家小秘”满足用户在各个阶段的答案需求,实现即问即答;“车机问答”弥补了传统车机汽车知识性不足的缺陷,理解汽车专业领域意图,涵盖看车、买车、用车常见问题。
不仅如此,在第二届中国 AI+ 创新创业大赛总决赛暨创新创业峰会上,汽车之家从 2000 多支队伍中脱颖而出,荣获了特等奖。
搜狗同传利用搜狗先进的语音识别和机器翻译技术,可以实现“中译英”和“英译中”两种同传工作,以中英双语字幕形式呈现,打破了国际会议语言沟通的障碍,大大提高信息传递效率。
自 2016 年首次亮相世界互联网大会后,搜狗同传已成为国内、国际会议的“标配”,支持过 T-EDGE 创新大会、GMIC 大会、TechCrunch 国际创新峰会、CNCC 中国计算机大会、中国车联网博览会、全球人工智能技术大会、世界电信和信息大会等数百场会议,覆盖了医疗、科技、经济、汽车等多个领域。
与传统的机器翻译不同,搜狗同传具备了听、译、改三种功能,不仅能流畅地记录、翻译内容,还能很好地识别词语和句子的停顿,覆盖了语音断句、语音识别、文本断句、机器翻译等多个技术维度,在各个大会上都有着稳定可靠的临场表现。
另外,在 2018 年,根据搜狗方面给出的预测数据,搜狗语音识别的准确率为 97%,支持最快每秒 400 字的高速听写,语音输入日频次高达 3.4 亿次,搜狗语音翻译的准确率则可以达到 90%。雷锋网雷锋网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。