0
雷锋网 AI科技评论按:9月10日,北京理工大学 大数据创新学习中心 将在北京理工大学召开“知识图谱与智能问答研讨会”,届时将邀请学术界与知名业界的专家做主题报告和面对面的研讨。
“北京理工大学大数据创新学习中心”于2016年12月成立,长期开展大数据挖掘的学习与交流活动。在过去几个月中,其有效地融合了高校资源和业界资源推出了Python、知识图谱、机器学习等系列专题学习与研讨活动,其中知识图谱专题涉及了知识图谱构建技术、知识图谱应用、大规模知识图谱数据存储、知识图谱与聊天机器人等主题,引起了北京地区广大师生和业界人员的高度关注。
陈华钧教授为浙江大学计算机科学与技术学院教授、博导,主要研究方向为语义 互联网与知识图谱、大数据、生物信息计算等。浙江省大数据智能计算重点实验 室副主任、中国中文信息学会理事/语言与知识计算专家委员会副主任、中国人工智能学会知识工程与分布智能专委会委员等。在 IJCAI, WWW, AAAI/IAAI, ICDE, TKDE, Briefings in Bioinforamtics 等国际顶级会议或期刊上发表多篇论文, 并曾获国际语义互联网会议 ISWC 最佳论文奖。作为主要参与者,获得教育部技 术发明一等奖、国家科技进步二等奖等奖励。全国知识图谱与语义计算大会CCKS2016 程序委员会主席,联合创办国际语义技术联合会议 JIST 等。
漆桂林教授为东南大学教授、博导,获得“六大人才高峰”资助,中国中文信息学 会语言与知识计算专业委员会副主任和中国科学技术情报学会知识组织专业委 员会副主任,开放知识图谱联盟 openKG 的联合创始人之一,新华社中国经济信 息社特约专家语义 Web 著名国际期刊 Journal of Web Semantics 的编委。曾任中 国语义 Web 和 Web 科学大会主席、国际会议 JIST 程序委员会主席。指导学生在 国际会议 ICTAI 获得最佳学生论文奖。发表高水平学术论文 100 余篇,出版专著 一部。6 项专利获得授权或者受理。先后承担包括国家自然科学基金和欧洲第七 框架项目Marie Curie IRSES在内的多项科研项目,并且承担了华为、百度等企 业项目,作为第二负责人参与了由科大讯飞牵头的 863 课题“高考机器人”的一个 子课题。在知识工程、大数据语义分析、知识图谱等领域有将近 20 年的研究和 产业化经验。
Dr Jun Yan graduated from Peking University in 2006 and then joined Microsoft Research Asia. He is currently research manager of Data Mining and Enterprise Intelligence Group. His research interests include Text Data Analysis, Knowledge Mining, Information Retrieval etc. He has more than 80 papers published in conferences and journals of related areas and has played as PC, senior PC of conferences including SIGKDD, SIGIR, AAAI etc. He is currently deputy director of Microsoft-Peking University joint lab.
丁力是海知智能CTO,联合创始人,OpenKG 发起人之一,全球首款语义 搜索引擎 Swoogle 作者,美国开放政府数据 Data.gov 语义技术专家,国际语义 网大会挑战赛第二名。北京大学计算机系本科及硕士。UMBC 博士,斯坦福博 士后,RPI 研究员。前高通研究院科学家。主要研究方向为语义搜索,知识图谱政府数据公开,机器学习与中文自然语言处理等。发表上百篇论文,引用量过万,Google H-index >30。
肖国辉现为意大利博尔扎诺自由大学计算机学院助理教授,北京大学应用数学 本科、硕士,奥地利维也纳工业大学计算机博士。目前他的主要研究领域包括知 识表示与推理,数据集成,时空数据推理,专攻基于本体的数据访问(OBDA)的 理论和技术。并研究如何将这些技术和理论应用于实际的工业案例。目前为Ontop 研究团队的负责人,主持 OBDA 技术的研究,开发和应用。Ontop 为当前 最先进的 OBDA 系统,其研发主要依托于欧盟第 7 框架项目 Optique。发表论文50 余篇,其中多篇发表在国际顶级学术会议及期刊。
王昊奋,上海瓦歌智能科技公司总经理,深圳狗尾草智能科技公司 CTO,OpenKG 发起人之一。在语义技术和图数据管理方面有比较丰富的经验和 积累,共发表 75 余篇高水平论文,其中包括 35 余篇 CCF A 类和 B 类论文。作 为技术负责人,他带领团队构建的语义搜索系统在十亿三元组挑战赛 (Billion Triple Challenge)中获得全球第 2 名的好成绩;在著名的本体匹配竞赛OAEI 的实体匹配任务中获得全球第 1 名的好成绩。他带领团队构建了第一份中 文语义互联知识库 zhishi.me,被邀请参加 W3C 的 multilingual 研讨会并做报告。 他还带领团队参加了百度知识图谱竞赛获得所有任务第一名的好成绩。此外,他 还长期作为 ISWC, WWW, AAAI 等国际顶级会议程序委员会委员。目前,王昊 奋担任 CCF YOCSEF 上海主席,中文信息学会语言与知识计算专委会副秘书长, 中国计算机学会术语工作委员会执行委员等社会职位。
Lei Zou received his BS degree and Ph.D. degree in Computer Science at Huazhong University of Science and Technology (HUST) in 2003 and 2009, respectively. He received a CCF (China Computer Federation) Doctoral Dissertation Nomination Award in 2009 and won Second Class Prize of CCF Natural Science Award in 2014. Since September 2009, he joined Institute of Computer Science and Technology (ICST) of Peking University (PKU) as a faculty member. He has been an associate professor in PKU since August 2012. His recent research interests include graph databases, knowledge graph, particularly in graph-based RDF data management. He has published more than 30 papers, including more than 20 papers published in reputed journals and major international conferences, such as SIGMOD, VLDB, ICDE, TODS, TKDE, VLDB Journal.Lei Zou’s research is supported by NSFC-Young Excellent Talent Project and National Key Research and Development Program of China. His work has been cited by more than 1300 (Google Scholar Citation statistics).
鲍捷博士有十余年的人工智能研究经验,研究领域有神经网络、知识表现与推 理、语义网、机器学习、自然语言处理等。中国中文信息学会语言与知识计算专 委会委员。历任美国三星研发中心研究员,MIT 访问研究员,BBN 访问研究员,RPI 博士后,Iowa State Univ 博士,W3C Web 本体语言工作组成员,国际语义网 会议 ISWC 组委会和程序委员会成员。
魏晨,图灵机器人认知计算小组负责人。于 2012 年获得硕士学位。硕士期间在 数据挖掘领域发表了 2 篇会议论文,1 篇 ISF 期刊,Springer 书的一章,和 1 本 书(在亚马逊售卖)。曾经是美国政府特邀访问学者,也曾在科英布拉大学做研 究员。目前在图灵机器人工作。研究兴趣包括推荐系统,知识图谱和文本挖掘。 图灵机器人公司是以语义理解为核心驱动力的人工智能公司,致力于“让机器理 解世界”, 产品服务包括机器人开放平台,机器人 OS 和场景方案。公司成立于2010 年,2013 年推出全球第一款中文人工智能语音助手-虫洞语音助手,累计4500 万用户量。2014 年推出开放人工智能机器人平台,至今已有 60 多万合作伙 伴和开发者。让开发者和厂商能够在 10 分钟内创建专属的聊天机器人。2015 年 推出图灵 OS。2016 年推出图灵 OS 1.5。
丁力 ,9:40—10:20
报告内容:cnSchema.org 是一个基于社区维护的开放的知识图谱 Schema 标准。cnSchema 的词汇集包括了上千种概念分类(classes)、数据类型(data types)、属性(propertities)和关系(relations)等常用概念定义,以支持知识图谱数据的通用性、复用性和流动性。结合中文的特点,我们复用、连接并扩展了 Schema.org,Wikidata,Wikipedia 等已有的知识图谱 Schema 标准,为中文领域的开放知识图谱、聊天机 器人、搜索引擎优化等提供可供参考和扩展的数据描述和接口定义标准。通过cnSchema, 开发者也可以快速对接上百万基于 Schema.org 定义的网站,以及 Bot的知识图谱数据 API。本报告描述了我们遇到的挑战和工作方向,给出了案例分 析和发展路径。最后介绍了 schema 目前完成/在研的若干志愿者任务。
肖国辉,10:20—10:40
报告内容:基于本体的数据访问技术(ontology-based data access,OBDA)可以
将现有的数据库虚拟化为知识图谱。虚拟化的知识图谱通过提供了一种高层次的
查询接口,使得最终用户不需关心底层的数据存储和组织。此技术的核心为查询
重写,可以重用现有的数据库的功能。本报告首先将介绍 OBDA 技术的基本知
识。然后讲解 Ontop 系统怎样实现知识图谱虚拟化。最后,我们讨论知识图谱虚
拟化技术在石油、能源、医疗、考古、测绘、海事安全、电子商务等领域的具体
应用案例和前景。
王昊奋,10:50—11:30
报告内容:近年来,聊天机器人作为 AI 技术的杀手级应用,发展得如火如荼, 各种智能硬件层出不穷。本次演讲将系统地阐述聊天机器人的分类和关键技术, 并分析 Apple Siri、IBM Watson、Google Allo、Facebook Messenger 和 Amazon Echo等典型代表的优缺点,并第一次给出聊天机器人行业的技术面面观。在此基础上, 将展望聊天机器人通往更智能化、更人性化、更趣味化的道路上所面临的挑战, 并聚焦到知识图谱技术在问答、推理和服务融合等方面的机遇和挑战。
陈华钧,11:30—12:10
报告内容:OpenKG 旨在促进知识图谱数据的开放与互联,促进知识图谱与语义 技术的广泛应用与普及,本报告概要介绍了开放知识图谱 OpenKG 的一些正在开展的工作,这包括开放图谱资源库、链接的开放中文百科知识图谱、开放知识 图谱的 Schema——cnSchema。并结合 cnSchema 的一些工作,介绍了知识图谱 在智能搜索及问答领域的潜在应用场景。
漆桂林,13:30—14:10
报告内容本报告中,我们首先介绍佛学和农业知识图谱构建的相关技术,包括 如何从百科中抽取领域相关的知识,以及然后对百科中缺失的数据进行补全;其 次,我们将介绍佛学和农业知识图谱问答的相关技术,并做系统演示。
闫
峻,14:10—14:50
报告内容:In this talk, we will mainly introduce an application of knowledge mining
and natural language processing in healthcare domain, including bi-direction
knowledge graph construction, knowledge explicit representation by synonym
learning and question retrieval with knowledge data with application scenarios.
邹磊,15:00—15:40
报告内容:AS more and more structured data become available on the web, the question of how end users can access this body ofknowledge becomes of crucial importance. As a de facto standard of a knowledge base, RDF (Resource Description Framework)repository is a collection of triples, denoted as <subject, predicate, object>. Although SPARQL is a standard way to access RDF data, it remains tedious and difficult for end users because of the complexity of the SPARQL syntax and the RDF schema. An ideal system should allow end users to profit from the expressive power of Semantic Web standards (such as RDF and SPARQLs) while at the same time hiding their complexity behind an intuitive and easy-to-use interface. In this talk, I first review two categories of existing methods on natural language question answering (Q/A) over RDF knowledge graph---one is IR (Information Retrieval)-based and the other one is called semantic parsing method. Then, I will talk about our RDF Q/A system (gAnswer), which is based on graph matching-based technique. The most challenge to RDF Q/A task is the ambiguity of natural language question sentence. The contribution of our method is that we combine the disambiguation and query evaluation in a uniform process, i.e., we push down the disambiguation into the query evaluation stage. Based on the queryresults over RDF graphs, we can address the ambiguity issue efficiently. gAnswer joined QALD-6 knowledge graph Q/A competition (hosted by ESWC) and it won the second place in the Q/A precision. We host an online demo of our system at ganswer.gstore-pku.com.
鲍捷,15:40—16:20
报告内容:问答系统是一种复杂系统,难以一次性整体构造,也不存在单一算法
的解决方案。端到端的训练算法在现实落地中经常会遇到困难。本次讲座探讨如
何精益地构造问答系统,即如何循序渐进的从简单到复杂,去“生长”一个问答系
统。
魏晨,16:20—17:00
报告内容:随着人工智能的高潮,聊天机器人渐渐引起了人们的青睐。如何快速 的搭建一个聊天机器人,其背后的主要技术是什么。在搭建的过程中,需要借鉴 怎样的理论框架。图灵机器人将会进行分享。
本次活动面向北京理工大学师生、北京地区高校师生及科研机构免费开放,提供茶歇,参会人员食宿与交通费用自理。
时间:2017年9月10日(周日) 9:00—17:30
地点:北京理工大学(中关村校区) 研究生院 101报告厅
报名方式:点击这里(雷锋网注:由于座位有限,人数规模将控制在150人左右)
主办方:北京理工大学大数据创新学习中心
协办方:雪晴数据网,北京友万信息科技有限公司
合作媒体:雷锋网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。