0
主题为“Create with AI”的百度AI开发者实战营自10月19日启动以来,为全国各地开发者、创业者和合作伙伴带来语音、图像、人脸、UNIT、AR、PaddlePaddle等百度最核心的AI技术能力支持。
自历经深圳、成都、杭州、上海、广州之后,终于于12月7日落地北京。每期不同之处在于——在深圳发布“燎原计划”,成都推出全新“机器人视觉解决方案”,杭州开启“人脸硬件合作伙伴计划”,上海宣布“人脸识别接口新计费模式”,广州宣布“语音技术全系列接口永久免费开放”,北京举办“百度AI加速器第一期开营仪式 ”。
百度副总裁、AI技术平台体系(AIG)总负责人王海峰表示,百度对人工之智能的准备到如今已逐渐形成完整布局——从基础层,到感知层的语音、图像、视觉、AR、VR等技术,以及认知层的自然语言处理、知识图谱、用户画像等。
此次作为百度AI实战营的收官站点,王海峰表示,百度不仅提供AI核心能力,也提供合作伙伴、市场渠道、资金等方面的支持。之后,百度AI加速器即将开营,提供实战演练机会。
下面,雷锋网从收官回顾至启动,从技术层面介绍百度AI开发者实战营共提供了哪些技术加持,以吸引开发者与合作伙伴的加入:
百度AI方面表示,百度机器人视觉是市面上唯一既有导航定位(SLAM),也有物体识别(人脸识别、物品识别、OCR识别)的机器人视觉SDK,且是唯一软硬件都开源的视觉模组。
百度机器人视觉解决方案采用硬件开源、软件开放的形式为开发者提供全方位一站式服务,包括硬件模组和机器人SDK两部分。
硬件方面,百度自主研发的立体惯性相机模组配置两个全局摄像头和一个传感器,开发者可根据需要调整双目的距离。机器人SDK提供视觉惯性SLAM、障碍物检测、平面2D建图等离线功能,以及人脸、文字、物体等云端识别功能。
通过百度机器人视觉解决方案,开发者可以将百度相机模组应用于自己的机器人产品中,模组输出的图像和传感器数据输入百度机器人视觉SDK。SLAM视觉惯性算法将为机器人提供高精度的实时定位;由双目图像经过深度神经网络获取的图像经过深度神经网络,可以为机器人提供准确完整的障碍物信息,让机器人安全自由地行走;同时,连接到百度云端API,机器人还拥有人脸识别、OCR(文字识别)、物体识别等功能。
百度人脸硬件合作伙伴招募计划将面向开发者开放从模型算法、开发组件、场景覆盖到行业应用的全链条能力。
在技术能力方面,据雷锋网了解,百度面向开发者和合作伙伴开放人脸属性识别、关键点定位、人脸 1:1 比对、人脸 1:N 识别、活体检测等技术能力。
在开发支持方面,百度将开放所有人脸识别API接口能力和所有终端的SDK,满足开发者全面覆盖所有设备应用场景并进行免费调试测试;此外,还将提供最快24小时集成的各场景示例工程代码以及硬件算法调优服务,并保证全方位技术人力的支持。
在市场资源和客户渠道,百度将发挥自身在品牌背书、宣传推广、客户资源、资金等方面的优势,全面扶植和帮助AI开发者。
除了技术与资源支持,此次百度AI 讲实行免费包月模式。
据雷锋网了解,百度人脸识别接口将完全抛弃传统调用量计费模式,改为QPS包月收费模式,并向开发者与认证企业,每个接口每天分别赠送2QPS和5QPS的免费配置量,超过才会进入包月收费模式,这对于人脸应用并发量不高的中小企业,相当于永久免费。如果企业使用量超限,百度也将提供低于行业目录价的收费,以及稳定、安全、高效的企业级服务保障。
目前,人脸识别接口通常采用调用量和QPS包月混合收费模式,对于资金不充裕的创业公司来讲可能会有较大压力,百度方面表示,是希望将人脸识别技术真正平民化。
而作为百度最核心的人脸识别基础技术,具有人脸检测与追踪、关键点定位、人脸属性分析、人脸1:1对比、人脸1:N查找、活体检测等六大基础能力。同时具有多种检测能力,可针对不同场景组合变化成不同应用方案,比如金融、安防行业的人脸核身,零售行业的会员识别、人脸支付、身份校验、安防监控等。
除了人脸识别接口免费,百度语音技术系列也将永久免费。
据雷锋网了解,百度永久免费开放语音识别、语音合成和语音唤醒三大语音技术接口。其中,语音识别系列接口方面,用户每天每接口拥有5万免费的直接调用量,若大于5万,开发者可按需申请,审核通过即可继续免费调用;语音合成系列接口方面,用户每天每接口拥有20万免费的直接调用量,超过后用户可申请获取更多的免费调用量;语音唤醒系列接口方面,每个用户拥有3个自定义唤醒词,支持每月导出3次。
目前,百度语音开放平台已有25万注册开发者,日调用次数超过20亿次,每日识别请求PV已超过1亿。继百度AI开发者大会后,百度新开放了长语音识别、远场模型等功能。
百度AR生态平台“DuSee”是由百度深度学习实验室(IDL)、百度搜索产品研发及销售、市场团队通力合作的产物。
到目前,百度AR在自主研发的渲染引擎、底层算法等基础上,完善3D模型、图影音、脚本交互等内容系统。同时,通过AR业务系统中广告营销、行业解决方案将制作分发给服务商、将内容展现给用户、将SDK开放给超级APP,最终形成既有客户、销售、服务商,又有用户、APP分发渠道的闭环AR生态。
目前,百度AR平台已开放SDK Basic、SDK Professiona两版本的公测。
百度深度学习平台 PaddlePaddle——是并行分布式全功能深度学习框架,支持海量图像识别分类、机器翻译和自动驾驶等多个领域业务需求, 现已全面开源。PaddlePaddle提供丰富算法服务,包括机器视觉、自然语言理解、推荐系统等,并具有四大特点:
易用性:为用户提供了直观、灵活的数据接口和模型配置接口。
灵活性:支出CNN、RNN等多种神经网络结构和优化算法。简单书写配置文件即可实现复杂模型。
高效性:计算、储存、通信、架构等方面实现高效优化,有助于充分发挥各种资源的性能。
扩展性:全面支持多核、多GPU、多机环境,能够轻松应对大规模训练需求。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。