0
近日,新京报拍摄的一段视频在微博上引发网友转发讨论,中国传媒大学一位老师在课堂上用ipad进行刷脸签到,学生们排队站在终端前一秒钟左右就可识别通行。
该老师名叫沈浩,是中国传媒大学新闻学院教授、大数据挖掘与社会计算实验室主任。沈浩教授表示该系统主要是借助了百度的技术,然后开发出了这个适用于课堂的作业模式,从目前的使用效果来看,成功率非常高,如今他所带的六个班级都采用了刷脸签到。
沈浩老师说,“在通过系统刷脸识别之前,学生们必须提交个人照片进行人脸图像采集。在这个过程中,很多学生提交的都是生活照、美颜照,也会存在少数学生刷脸失败(太过于模糊),后来改进之后,在一百多个同学中只有一位同学没有刷脸成功,化妆、换发型在技术上来说对识别效果没有任何影响。”
最让人意外的是,这套“人脸签到机”,完全是由沈老师自己开发的。据他介绍,他大概花了两个星期完成这套上课签到系统,目前不仅能准确识别人脸信息,还能对比两张人脸的像判断是否是同一个人,防止代签到。
从以上来看,沈浩老师所开发的人脸识别签到系统是通过1:1的人脸认证技术进行身份比对,确认学生信息,并将学生的图像信息录入到数据库中;课堂上刷脸时,通过1:N的人脸识别技术(N不大),将学生信息与库中的信息进行核对,确认签到信息。
雷锋网了解到,这其中有几个关键步骤:
人脸检测,系统根据眼睛、眉毛、嘴巴、鼻子等器官的特征以及相互之间的几何位置关系来检测人脸,即在在一副图像或一序列图像(比如视频)中判断是否有人脸,若有则返回人脸的大小、位置等信息。
人脸图像预处理,然后系统获取的原始图像由于受到各种条件的限制和随机干扰,往往不能直接使用,必须在图像处理的早期阶段对它进行灰度校正、噪声过滤等图像预处理;人脸图像的预处理主要包括人脸对准,人脸图像的增强,以及归一化等工作。人脸对准是为了得到人脸位置端正的人脸图像;图像增强是为了改善人脸图像的质量,不仅在视觉上更加清晰图像,而且使图像更利于计算机的处理与识别;归一化工作的目标是取得尺寸一致,灰度取值范围相同的标准化人脸图像。
人脸图像特征提取,人脸特征提取就是针对人脸的某些特征进行的。人脸特征提取,也称人脸表征,它是对人脸进行特征建模的过程。
人脸图像匹配与识别,人脸识别就是将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。这一过程又分为两类:一类是人脸确认,是一对一进行图像比较的过程,将某人面像与指定人员面像进行一对一的比对,根据其相似程度(一般以是否达到或超过某一量化的可信度指标/阀值为依据)来判断二者是否是同一人;另一类是人脸辨认,是一对多进行图像匹配对比的过程。将某人面像与数据库中的多人的人脸进行比对(有时也称“一对多”比对),并根据比对结果来鉴定此人身份,或找到其中最相似的人脸,并按相似程度的大小输出检索结果。
之所以会开发这个系统,沈浩老师表示,这学期自己的课程很多,数量最多的班有140多人。“点名”成为一件令他纠结的事,如果认真点名,就会耽误很多时间。如果草草点名,又不够公平。更尴尬的一次是,到了期末,纸质的点名册不知去向了。
而作为技术发烧友,综合考虑之下,他想到了运用人脸识别技术来“刷脸”签到。利用这个系统就可以自动记录学生的签到次数,也能提前预警学生因签到不足而无法结课,提升上课效率和学习积极性。
雷锋网了解到,自在沈浩老师的课堂上试行之后,目前该技术已经在中传所有课堂应用,未来还有望在宿舍、水房等场景全面铺开。沈浩老师说,这就是人工智能带来的变化,他也希望同学们能时刻感受到这种变化,感受到未来技术发展的趋势。
人脸签到得益于百度AI开发平台
雷锋网了解到,沈浩老师之所以花了极短时间就可开发出这个系统,是得益于百度人工智能技术全面开放。
百度AI技术生态部总经理喻友平介绍说,“百度开放了一系列基于深度学习的能力,包括但不限于语音、人脸识别、自然语言理解、知识图谱、数据智能等,几乎涵盖目前已知人工智能的所有技术领域。我们提供的不仅是API接口,而是综合的、解决场景化需求的一体化解决方案,可以让开发者、合作伙伴快速加入。”
除了课堂签到以外,当下以All in AI为转型方向的百度已取得初步成效,人脸识别等技术也深入到了各个角落,包括利用人脸识别寻找丢失儿童、用于机场刷脸登机、用于药房会员识别、用于乌镇互联网大会刷脸入场等等。
百度的AI开放平台让很多开发者都能免费地用到一系列成熟资源,包括像沈浩老师这样的高校教师,但并非人人都愿意一试。
华南理工大学软件学校黄翰教授表示,从教学层面来看:如果是教学管理人员,需要这样的技术及设备去快速、准确地了解整个学校的学生出勤情况;但作为老师来说,可以不需要这些,教师应该把工作重心放在如何提升教学质量上,而不是把重点放在治理手段上。
从技术层面来说, 单从算法出发,高校的技术储备也很雄厚,如果要做这些设备也不会用到百度的技术。他认为,这些技术太过于简单,从专业的角度出发,如果要做也不会做这样的设备,从视频中来看是一个一个地排队检测(1:N),而在人数不多的集体中,完全可以做到不用一个一个人地去排队,只需要拍张照片就可快速识别(M:N)。
在黄翰教授看来,百度开放相关技术是为了普惠到各行各业,各个单位也需根据自身需求去合理使用。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。