0
作者 | 王德清
出品 | 雷锋网产业组
德国人文地理学家F.拉采尔曾指出“交通是城市形成的力”。而拥堵的交通环境,则能让一个城市“乏力”,处于亚健康的状态。
在人口密度大、城市集聚效应明显的亚洲和拉美地区,交通拥堵更是阻碍城市发展的“老大难”问题。
“交通是一个城市的尊严,数据挖出看不见的路”。2018年的云栖大会上,中国工程院院士王坚这样表示。
很多城市面临着亟待解决的交通问题,而数据是实现交通立体化管理的基础元素,然而目前城市交通数据普遍面临数据少、质量差、呈孤岛分布等问题,导致模型构建困难,阻碍了智慧城市的发展,这该如何“破题”?
“任何人工智能应用都需要大量真实数据进行训练,才能投入实际应用,像计算机视觉技术可以发展到今天这个地步,和有海量高质量真实数据的知名数据集ImageNet是有很大的关系的。”香港科技大学教授陈凯对雷锋网表示道。
陈凯教授
“但在智慧城市领域,目前还没有一个像ImageNet这样高质量的数据集,所以在我们项目计划中,我们要打造一个智慧城市领域的数据集,我给它起名叫‘CityNet’”
“具体来说,我们计划建设一个高性能的分布式AI云平台,叫图灵平台,首先我们会将香港的交通数据(交通署、运输署、天文台等机构的多模态数据),以隐私保护和数据脱敏的方式实时汇入图灵平台上的CityNet,然后利用图灵平台的算力,应用图神经网络、迁移学习、联邦学习等最新的人工智能技术,对城市交通流量、人流量实现精准的预测,从而提供精细的、动态化的城市交通管理。”
在提出建设CityNet这一数据集的背后,是陈凯教授对于智慧交通建设现状的清楚认识,他认为,目前智慧交通的建设存在两个问题:
一是不同的数据源只能分开分析:现有研究工作多数只能同时对一种数据源进行分析,但不同类型的数据源之间存在关联,同时对多种数据进行分析可以提高预测系统的准确性和稳定性;
二是不同城市的经验知识无法相互借鉴:每个城市使用自身数据构建系统模型,不能有效利用先进城市的知识帮助其他城市构建模型,在新城市部署交通流量预测系统要重新训练模型,成本较高。
陈凯说道:“大家都在追求新技术这个是好事,但就智慧交通来说,目前并没有一个顶层的架构设计,也会出现同类技术重复开发的现象,我们希望用技术手段推动数据和算法层面合作,避免机器学习模型的重复训练,这是我们要建设图灵平台和CityNet的初衷。”
“力”的作用是相互的。城市在为CityNet提供数据的同时,也可以应用CityNet中已有的模型,来建设智慧城市。
透过陈凯教授的介绍,我们不难发现,CityNet数据库的建设,会为城市智慧化建设带来强有力的帮助。但CityNet数据库要汇聚诸多城市的数据,数据安全则是首要考虑的问题。
当前,欧洲、美国相继颁布了数据隐私保护法,很多科技巨头甚至因为数据安全问题被巨额罚款。
基于此,雷锋网深入解了陈凯教授团队是如何应对智慧交通建设中的隐私安全问题。
在陈凯教授看来,隐私问题不仅仅是一个监管的问题,也是一个技术问题。“我们在把CityNet 数据库建设成最大的智慧城市数据库的规划中,数据隐私安全是很关键的一个研究课题。”
陈凯继续说道:“图灵平台会对CityNet 数据进行统一管理,应用联邦学习和加密计算等技术,以隐私保护的方式把 CityNet 数据提供给智慧城市的研究者使用,研究者在训练机器学习算法的时候,无需知道原始数据里的私有和敏感信息。”
联邦学习则可以让数据不动,模型动,通过联邦学习技术,可以让使用者不需要知道CityNet的原始数据是什么,但仍然能够学到知识。
除了针对数据隐私安全的理论研究之外,经过加密后的庞大数据对计算机算力的要求提高了十倍甚至更高,那么,这个时候,算力也成为了一个挑战,而这也是陈凯教授擅长的研究领域之一。
陈凯教授详细讲解《图的数据流深度学习范式》
据雷锋网了解,陈凯教授从事大规模数据中心的研究有十多年,在相关高水平国际会议和期刊发表学术论文的数量居亚洲第一,是系统和网络性能优化这一领域的带头人。
“我们的图灵平台是一个高性能分布式AI集群计算架构,通过高速通信技术RDMA,提高大型 GPU 集群吞吐量,降低通信延时,提升集群的整体计算效率,支撑大规模图式流数据上的深度学习和迁移学习。”陈凯教授解释道。
除此之外,陈凯教授还组织了一支集土木工程、信息科学、计算机科学等多个领域的专家团队来共同推进项目的研究。
“为了这个项目我们组成了一支比较综合的核心团队,由香港科技大学、香港理工大学、香港中文大学的8位教授组成,我们还将组织一支50人左右的团队,让我们的研究成果可以从科研到展示到实现项目的真正落地”
陈凯教授和实验室团队
谈起研究中更长远的目标,陈凯教授对雷锋网说道:“香港的交通比较复杂,如果我们可以将香港交通做好,其实对于其他城市的借鉴意义非常大。如果有成功的经验的话,我们会逐步延伸到粤港澳大湾区中另外一些交通网比较复杂的城市。”
2017年,香港特区政府拟斥资7亿港元发展智慧城市建设,并公布了未来5年的香港智慧城市发展蓝图,其中涵盖6个方面,包括智慧出行、智慧生活、智慧环境、智慧市民、智慧政府以及智慧经济。
在此次采访的一个月前,陈凯教授提出的应用在智慧城市中的“高性能分布式基于图的流数据机器学习框架”,获得了2020/21年度香港政府高达3300万「主题研究计划」资助。
值得一提的是,「主题研究计划」自2011年设立至今,共计52位项目统筹负责人在列,80%以上为资深讲席教授,包括多位国内外科学院/工程院院士。而陈凯教授是香港「主题研究计划」有史以来最年轻的项目统筹负责人,
“我们的项目面向智慧城市蓝图中的三个场景:交通、健康和经济。首先落地在智慧交通场景上。”,陈凯对雷锋网解释道,“据相关数据显示,香港每一公里交通路段上面,有350辆车左右;香港每天乘坐公共交通可达1200万人次。我们希望通过人工智能算法提高公共交通的运输线路的效率,缩短人们上下班出行高峰的等待时间。”
此外,在陈凯教授团队的规划中,下一步还将整合城市交通、公共医疗、金融方面的真实的实时数据。基于这些数据,就会为商业选址、基础设施建设、商业广告投放等多个产业提供智能化的帮助。
经过陈凯教授的介绍,整个项目框架也逐渐清晰,雷锋网将其总结为:
建设高质量的智慧城市数据集:通过隐私计算,数据脱敏的方式将香港以及国内外诸多城市的交通数据汇入到CityNet数据集中;
搭建图灵平台:对CityNet中的数据进行处理、分析来搭建深度图神经网络模型;
通过深度图神经网络模型、大数据分析与可视化工具,对城市运输提供精细的、动态化、自动化的城市交通管理,例如: 1)对城市交通流量、人流量实现精准的预测,辅助实现精准交通调控;2)实现智能预警系统,对预测车流量超出容量的区域作为潜在拥堵区域进行报警;3)分析预测城市出行需求与各路线与交通工具的预计到达时间(ETA),实现个性化的最佳出行建议与路线规划。
基于在AI算力和数据安全领域的不断探索,2018年,陈凯教授创办了星云Clustar,持续在加速AI算力、提高集群计算效率、保护隐私安全等方面进行研究,致力于将联邦学习,同态加密,高性能AI集群技术等最新研究成果应用到金融业、制造业等其他领域。
相信在不久的将来,我们就会迎来陈凯教授团队的捷报。
在最后,我们也转达一下陈凯教授对其智慧城市研究项目的期望:这是一个非盈利的科研项目,我们希望可以有更多的人能了解图灵平台和CityNet,来做一些贡献,同时也会享受到CityNet带来的回报。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。