0
得益于物联网和工业4.0的兴起,最近几年,不少企业已经通过物联网的手段,建立起了数据采集,监控和展示的平台。对于数据的深层次应用,例如利用最新的机器学习算法,对数据进行智能化提升,则是目前工业用户进行数字化转型的必由之路。
从现在的趋势来看,人工智能的热点领域都集中在语言、图像交互类, 或者商业应用类。对于工业领域,基于物联网获取的流式数据,如何通过人工智能来实现效率提升?在使用这些数据的过程中,如何避免踩坑,顺利进行方案的部署?这是工业界需要解决的问题。为此,本期硬创公开课,雷锋网邀请了觉云科技CEO常伟来为大家讲解如何用物联网数据来构建工业智能。
常伟先生是觉云科技的的创始人及CEO,在成立觉云科技前,他来自于微软上海,是物联网方案部门负责人,负责基于云端的物联网的服务组件设计和推广,包括了Azure的PaaS和SasS的服务在中国的落地,提供云端的数据接入,协议转换,服务分配,平台集成,分析和展示。主要客户包括上海观致,中国福特、中国通用等企业。
以下内容整理自本期公开课,雷锋网做了不改变愿意的编辑:
整个互联网到物联网走到现在是可以通过数据其解决一些问题的。
在信息化时代,我们经历了从数据到信息到知识再到智能的过程,我们也相信在商业、工业领域都有大量的信息或者数据,而这些数据的价值就需要业界来挖掘,最后才会走到金字塔顶端智能所要解决的问题。
大家常见的是交互类的智能,例如语音识别、图像识别等,毋庸置疑,这是现在很热门的一类课题,但今天讲的内容主要聚焦工业领域,怎么利用工业智能解决工业领域的问题。
这张图片列举了常见的几种算法,分类、回归、推荐、异常点检测、聚类。分类主要是用来区分不同的群体,回归主要用来预测,例如预测一台设备什么时候发生故障;推荐主要解决的是,用户买了商品A之后,可以推荐商品B或者C;异常点检测主要针对没有历史记录如何在一个矢量集来找出异常点。
现在这些算法都已经存在,我们的任务主要是利用这些算法来应用到商业应用或者工业应用当中。
工业物联网的范围很大,包括数据传输、采集、通信以及平台的展示等。觉云目前做的是工业算法和模块。这处于工业物联网中游的位置,即拿到工业领域的流失数据后,再进行智能分析得出结果后在跟企业应用系统做集成。
在工业智能里面,一般使用的数据是流式数据,采集的数据大部分来自设备端的数据,例如,泵、变速箱和机床这些和设备相关的变量。
在采集完数据后,可以通过算法模型进行建模评估,评估完之后就可以给客户提供预测性维护、能效管理以及质量管理等。
针对不同业务领域提供算法模型,这些算法模型还会推送出一些结果。最后还会有不同的部署方式。有两种,一种是结果会嵌入到现有的设备管理系统平台,第二种是会构建SaaS服务平台,例如机床诊断模块。
工业大数据分析是最近一两年有了工业物联网后才兴起的。目前觉云是基于既有经验,已经有行业的know how,可以在8周的时间里进行部署。
在这期间,主要做两大工作:第一阶段是数据的准备,包括数据导入、数据清洗和基本的可视化;第二部分是数据建模,包括特征和算法的选择、模型测试和评估。这两大工作后面会结合实际案例作分析。
在这两部分工作做完后,就是数据运营了。上述模型通过可视化之后会部署到现有的平台或者是SaaS服务云。在这部分,需要有日常的运营工作,例如应用端的部署、分值计量和衡量指标,到最后还会反馈到第一个阶段,算法不是一成不变的,随着数据的积累、故障调优,会重新反馈到第一阶段。所以实际上,算法是在云端或者在本地的自学习的算法,随着数据的积累,也会更加智能。
电梯是量很大的设备,对安全质量要求很高。在电梯的智能化转型过程中,有三个阶段。
第一阶段以安全监控为主,主要是东芝、日立这些日系企业通过总线系统收集电梯运行的实时数据,根据预先定义的阈值(例如最高速度)进行报警。
第二阶段就是三菱电梯通过历史数据进行存储,然后对地洞次数、运行时间做统计。统计指的是数据分析来预测电梯的健康状况。第一阶段和第二阶段主要用的是历史数据或者是人工统计的方式来做分析。
第三阶段就是智能预测了,这一阶段可以通过电机总线和外加传感器的方式来收集实时数据,这些数据可以从系统层面来分析故障、能耗等。与此同时,随着这些数据的积累,还可以建立一个回修专家系统,像OTIS、蒂森克虏伯这些公司已经在做这部分工作。
Gartner曾对蒂森克虏伯的方案做出这样评价,它是电梯预测性维护的第一个方案,它可以告诉技术工人怎么去维护。蒂森是一家德国高端电梯公司,在北美一共有一百万的电梯在运行。蒂森和微软、CGI合作,通过物联网监控平台BlueBox,可以把数据实时上传到云端,在云端进行数据存储分析,最后把结果展现到终端,所以售后团队就可以提前知道电梯的情况,这样就可以实现停机时间缩短一半。
虽然很多都能做到实时监控,但大数据需要做的是用云来做实时的分析。
这张图显示了某台电梯在某个位置的健康状况。从图中可以看到,这台设备的健康指数是70%,这其中采集了温度、电梯速度高速、电梯门关门时间等,通过这些数值的综合评估来给电梯做健康值的打分。
下一步就是实时性预测。采集这些电梯变量之后,通过分析就可以得出预测,再对工作人员进行通知,设备在几天之后会出现故障。
这是蒂森电梯的应用架构
从图中可以看出,BlueBox获取数据后,进行前端处理并做存储。事实上,在这一阶段,做存储并不容易,流式数据的采集、展示和分析,对数据质量要求很高。此外,还可以利用机器学习来对实时监控做评判。
做大数据分析出发点是解决用户痛点,工业物联网和传统交互体验的人工智能相比,最大的区别就是工业智能解决的是显示存在的问题。预测维护可以帮助客户进行提前预警、备货,减少人力成本;创建新的可靠性标准;实时监控,可以给电梯提供商、业务和用户带来安全保障。
和电梯一样,变速箱也是一台成套设备,由电机、减速箱、驱动器、钢丝绳等部分组成。而对成套设备做预测性维护并非是预测成套设别的生命周期,最终都是对系统的组成单元做预测性维护,把问题聚焦。
这是整体的分析框架
数据源来自客户,包括报警数据、模拟数据(电流电压温度等)、数字数据(开关位置)、标签描述。拿到这些数据后,就要做相应的数据存储和分析。这里主要做两部分工作:1.可视化,主要目的发现问题的时间分布在哪,从该图可以看出,我们收集到的数据量非常大,模拟数据175M,数字数据10M,报警历史记录有1740条。。
然后再通过机器学习进行建模,对故障模型进行分析,分析后把故障预测的结果推送到可视化工具。
在之前的案例中我们发现,每个这些问题发生的频率是不同的。变速箱过热是常态问题,5个月一共发生了1340起,占到了整个故障的77%,如果能准确预测这类问题,那么就能结局大部分问题。
除此之外,需要注意的是,有些问题之间也存在关联,例如变速箱过热会产生其它的问题。当某天变速箱过热问题特别集中,我们要分析这其中的原因,这对数据建模、特征分析、特征工程非常有帮助。
拿到数据做完分析之后,下一个工作是要工程处理。
工业智能数据有个特点:低维高频,维度不多(相比购买行为预测的变量很少),但是频次很高,每秒都在采集。所以,我们需要有相应的处理办法:对传感器的数据做聚合,最大、最小、中值、标准方差等,主要目的是让初始变量更加丰富,变量越多预测的准确性也越高。
然后是数据建模。对于故障预测,我们进行了多个模型的选择,尤其是在分类和异常检测方面。分类是要告诉设备是否会坏,这会用到二元分类、回归、多元分类和异常点检测。
建模后要进行模型评估
这张图显示的是,在自由的算法包中进行评估来预测下5个小时内发生变速箱过热的概率。右下角是预测的对比值(逻辑回归、增强决策树、决策树、支持向量机):
最终评估下来,增强决策树算法在准确性、精准度等拥有很好的表现,所以最后选择用这个算来作为变速箱过热的预测。
最后是模型部署。做完模型之后,输出的结果是一条记录,例如变速箱在未来5个小时发生过热的概率是多少。这之后有三种选择:第一是和现场维修工单系统对接,第二是把结果推送到系统监控平台,另外也会发邮件提醒给管理人员。
从目前来看,能做数据采集的公司一般都具备这样的维修工单系统平台。
变速箱智能化主要给客户带来了四个方面的价值:提升设备、人员的生产力;减少故障停机,提高客户满意度;建立智能码头;构建新的价值体系。
另外,这个案例还得出了一个结论:如果要做成套设备的话,一定要从组件开始做预测。
在工业制造里面,机床最核心的问题就是刀具问题。实际上,刀具之于机床就如牙齿之于人类,如果刀具发生问题能提前感知,才能第一时间修复。
如果问题发生之后,再去修复就已经产生了废品,这也会造成更大的损失。
上图显示的是某公司通过控制器收集了不同机床运行的数据,包括电流、电压等。这里有几个原则:因为影响刀具寿命的变量很多,所以需要人工智能算法来预测;另外,可以和多年经验曲线进行结合;刀具寿命是非线性关系,一定要通过实时数据进行在线学习。
应用大数据算法形成智能化机床设备管理体系之后,会根据数据建模分为两大问题:第一类,刀具会不会发生故障,第二类是多久发生故障。
针对第一类问题,用分类模型来解决,例如选择用逻辑回归、决策树还是神经网络来告诉我们会不会坏,如果会坏,就来到下一个问题。预测多久发生故障,则主要用决策树、泊松回归、神经网络回归等来告诉设备提供商设备多久会坏。
之前,我们看到的智能算法主要聚焦在商业或者交互领域,现在我们正在尝试把智能算法带到工业领域。
工业智能,解决问题的算法体系主要分为三大类:第一是预测性维护,这对于基于物理损耗为主的设备是最行之有效的算法;第二类是能效管理;第三类是质量管理。
Q:对于流程工业生产环境下的生产设备故障预测,在数据采集汇总阶段,需要考虑哪些因素?或者需要哪些数据输入呢?
A:这里面有两个层次的问题:第一个是自上而下来做,现在流程工业里面,DCS(雷锋网注:分布式控制系统,Distributed Control System)已经采取了很多数据,现在我们用这些DCS数据,我们可以做一些基本预测性维护;
第二种是自下而上,以泵为例,DCS有些数据是关于泵的,但是有些数据是没有的,在这种情况下,一定是前装+后装的方式。前装就是利用DCS固有的数据,后装就是加装一些没有的数据,这样配合才能准确预测泵或者管道的预测性维护的点。
我认为前装方式所拿到的数据是最好的,后装则更具挑战。
Q:阿里云正式发布了ET工业大脑。这个大脑目前已经被用在了协鑫光伏工厂里,可以提高1%的生产良品率。常伟老师如何看待这个产品?对传统工厂来说,怎么选择?
A:阿里云这个是上文提到的第三类解决方案,质量管理方案。对于生产良品率来说,每个工厂都要case by case做分析,对传统工厂肯定需要找一个比较靠谱的方案。
Q:小型工厂缺乏数据的积累,以您的经验来看,对我们来说接入大数据方案需要考虑哪些问题?
A:小型工厂我建议采用SaaS解决方案,现在很多服务商提供一些现成的SaaS解决方案,帮助现有的工厂机床、泵等做到云端,然后再来根据数据做分析,对小型工厂来说,这种方案还是比较靠谱可行的。
Q:国内政府一直在喊数字化转型,从目前来看,国内技术是否成熟了?
A:从现在来看,尤其是对制造企业而言,技术是比较成熟了,数字化转型无非是数据采集、传输、存储和分析这几块。目前的企业在几部分都有比较成熟的解决方案,不过有些企业的管理水平有待提高。
大家一直在谈我们的工业水平比较低,现在有一个问题是我们的管理能力是否能支持中国制造2020。
Q:工业化转型最大的挑战是什么?怎么去克服这些问题?
A:最大的挑战我们认为有两个方面:一个是人的管理水平;第二个是技术方面的问题。
觉云有一个客户是做刀具的,通过传统的方式他认为没有法提升了。他们希望通过数字化的方式来提取数据,来告诉他这种刀具在加工哪种材料和工艺是最佳的,这就可以帮助他去挑战国外一些企业。
目前来看,数字化转型是解决技术问题的主要方式。做数字化平台第一步是建立数字化预测,第二步是数字化工单系统,第三步建立和工艺之间的关系,这几步下来最少要2-3年,所以工厂要对这个周期有一个认知。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。