0
由中国中文信息学会社会媒体处理专委会主办、哈尔滨工业大学承办的第七届全国社会媒体处理大会(SMP 2018)将于 2018 年 8 月 2 日- 4 日在哈尔滨召开。雷锋网作为战略合作媒体将带来专题报道。
SMP 专注于以社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术成果提供广泛的交流平台,旨在构建社会媒体处理领域的产学研生态圈,成为中国乃至世界社会媒体处理的风向标。
本届 SMP 大会主席由哈尔滨工业大学教授刘挺与伊利诺伊大学芝加哥分校教授 Philip S. Yu 担任,程序委员会主席由哈尔滨工业大学教授秦兵与清华大学助理教授刘知远担任。
距离 SMP 2018 还有两周时间,大会官方也揭晓了更多议程细节。心动不如行动,抓紧最后机会注册报名吧!
今年 SMP 2018 阵容相较去年毫不逊色,目前已确认出席的六位特邀讲者包括:李宇明(北京语言大学)、林学民(新南威尔士大学)、林鸿飞(大连理工大学)、张洪忠(北京师范大学)、胡小华(美国德雷赛尔大学)、李兵(中央财经大学)。
部分特邀报告摘要及讲者介绍如下:
北京语言大学语言资源高精尖创新中心 李宇明 主任
报告主题:世界知识的中文表达问题
报告摘要:语言是知识的容器,也是不同语言的人获取知识的藩篱。知识可以分为现代知识和过往知识。过往知识各种语言都有储存,而现代知识主要储存在现代较为活跃的语言中。现代知识可分为科学知识和社会知识两大类,随着科技的发展、教育普及和科技成果快速地用于社会生活,科学知识成为现代知识的主要代表。随着语言全球化的进程,英语成为“世界通用语”,特别是成为科技(包括社会科学和人文科学)的主要“国际用语”。中文虽然伴随着中国国力的提升,也加快了国际传播的步伐,但是在国际科学技术领域却同英语之外的其他语言一样,被严重边缘化。这将对国人获取世界科技知识(亦即现代知识)形成严重障碍,将对中华文化的发展强盛带来严重影响。虑今思远,我们不能不讨论世界知识的中文表达问题。
嘉宾简介:李宇明,北京语言大学语言资源高精尖创新中心主任。国际中国语言学会会长(2016年-2017年),中国语言学会语言政策与规划专业委员会会长,中国中文信息学会副理事长。曾任国家语委副主任、教育部语言文字信息管理司司长、教育部语言文字应用研究所所长、华中师范大学副校长、北京语言大学党委书记。 1991年获霍英东教育基金奖;1993年破格晋升教授;1994年成为“湖北省有突出贡献的中青年专家”,并享受国务院发放的政府特殊津贴;1996年被评为湖北省劳动模范,全国妇联和国家教委授予“全国优秀家长”称号;1997年获全国“五一”劳动奖章;1998年确定为湖北省跨世纪学术带头人;2000年成为教育部“人文社会科学跨世纪优秀人才”; 2010年应邀为香港中文大学“王泽森-新法书院语文教育访问教授”;2012年获“第八届全国五好文明家庭标兵户”称号; 2013年11月荣膺香港理工大学“杰出中国学人”荣誉。主要研究领域为理论语言学、语法学、心理语言学和语言规划学。出版《儿童语言的发展》《汉语量范畴研究》《语法研究录》《中国语言规划论》《Language Planning in China》《当代中国语言学研究》(主编)《语言学习与教育》《李宇明语言传播与规划文集》等著作20余部;发表论文490余篇,被译为蒙、藏、维、日、法、英、俄、韩等多种文字;主编《全球华语词典》《全球华语大辞典》;曾主持《通用规范汉字表》的研制;与李嵬联合主编的THE LANGUAGE SITUATION IN CHINA(VOLUME1~3)由德国DE GRUYTER出版社与中国商务印书馆联合出版,并有日语、韩语译本。国际著名语言规划学家斯波斯基,高度评价《Language Planning in China》:“这本译文集提供的不仅仅是数据。它通过揭示一位学者,同时也是一位长期活跃的管理者的观点,形成了理解中国语言管理的基础,也为其他地方从事类似工作的人们提供了一个有用的模型。……李宇明这本全新的译文集,已经超越了中国语言规划的主题,可以为指导整个语言管理领域的研究打下坚实的基础。”
大连理工大学计算机科学与技术学院 林鸿飞 教授
报告主题:幽默计算探讨
报告摘要:幽默作为一种特殊的语言表达方式,是生活中活跃气氛化解尴尬的重要元素。随着人工智能的快速发展,如何利用计算机技术识别和生成幽默成为自然语言处理领域热门的研究内容之一,并逐渐形成一个新兴研究领域,即幽默计算。幽默计算致力于利用计算机手段,理解和识别包含幽默的文本表达,挖掘幽默表达潜在的语义内涵,构建面向幽默表达的计算模型,并在此基础上,智能地将非幽默表达转化为幽默表达,实现幽默的自动生成,提升人机交互的智能程度。
本次报告首先对当前幽默计算的背景进行概述,阐明幽默的可计算性;在此基础上,对幽默研究的发展情况进行回顾,梳理幽默研究的认知语言学基础理论;然后,综述当前幽默计算在幽默识别和幽默生成两个方面的进展情况,给出幽默计算的研究框架,从幽默的表达方式和呈现载体两个维度讨论幽默的识别和生成,主要讨论谐音、双关语的识别与生成、相声和情景喜剧的结构分析。最后,对幽默计算在聊天机器人、机器翻译、外语教学等多个自然语言处理任务上的应用前景。希望通过对幽默计算及其应用研究的总结,完善现有幽默计算模型,增进计算机对于自然语言的理解,推动人工智能的进一步发展。
嘉宾简介:林鸿飞,大连理工大学计算机科学与技术学院教授、博士生导师。主要研究领域为自然语言处理、情感计算、社会媒体处理、面向生物医学领域的文本挖掘。担任中国中文信息学会常务理事,中国中文信息学会社会媒体处理专业委员会副主任、信息检索专业委员会常务委员,中国人工智能学会离散智能计算专业委员会副主任、机器学习专业委员会常务委员,辽宁省高等学校计算机专业教学指导委员会副主任、辽宁省计算机基础教育学会理事长。《中文信息学报》编委、《模式识别与人工智能》编委、《小型微型计算机系统》编委、《大连理工大学》(自然科学版)编委,SCI期刊IJDMB编委。主持国家863高科技计划、国家自然科学基金和教育部博士点基金等项目十余项,参与国家自然科学基金重点项目、国家十二五支撑计划项目多项。SCI收录论文80余篇,在SIGIR、ACL、CIKM和BIBM等国际重要学术会议发表论文20余篇,入选辽宁省“百千万人才工程”百人层次。获得国家级教学成果一等奖、二等奖和辽宁省教学成果一等奖。
The College of Computing and Informatics, Drexel University
Xiaohua Tony Hu, full professor
报告主题:Question-based Text Summarization
报告摘要:In the modern information age, finding the right information at the right time is an art (and a science). However, the abundance of information makes it difficult for people to digest it and make informed choices. In this talk, we will discuss how to help people who want to quickly capture the main idea of a piece of information before they read the details through text summarization. In contrast with existing works, which mainly utilize declarative sentences to summarize a text document, we aim to use a few questions as a summary. In this way, people would know what questions a given text document can address and thus they may further read it if they have similar questions in mind. A question-based summary needs to satisfy three goals, relevancy, answerability, and diversity. Relevancy measures whether a few questions can cover the main points that discussed in a text document; answerability measures whether answers to the questions are included in the text document; and diversity measures whether there is redundant information carried by the questions.
To achieve the three goals, we design a two-stage approach which consists of question selection and question diversification. The question selection component aims to find a set of candidate questions that are relevant to a text document, which in turn can be treated as answers to the questions. Specifically, we explore two lines of approaches that have been developed for traditional text summarization tasks, extractive approaches and abstractive approaches to achieve the goals of relevancy and answerability, respectively. The question diversification component is designed to re-rank the questions with the goal of rewarding diversity in the final question-based summary. Evaluation on product review summarization tasks for two product categories shows that the proposed approach is effective for discovering meaningful questions that are representative for individual reviews. This research work opens up a new direction in the intersection of information retrieval and natural language processing.
嘉宾简介:Xiaohua Tony Hu is a full professor at the College of Computing and Informatics, Drexel University and lecture professor at Central China Normal University. He is also serving as the founding Co-Director of the USA National Science Foundation Center on Visual and Decision Informatics (NSF CVDI, the only designated NSF Industry-University sponsored Big Data center at USA, and IEEE Computer Society Big Data Conference Steering Committee Chair. Tony is a scientist, teacher and entrepreneur. He joined Drexel University in 2002. Earlier, he worked as a research scientist in the world-leading R&D centers such as Nortel Research Center, and Verizon Lab (the former GTE labs). In 2001, he founded the DMW Software in Silicon Valley, California. He has a lot of experience and expertise to convert original ideas into research prototypes, and eventually into commercial products, many of his research ideas have been integrated into commercial products and applications in data mining fraud detection, database marketing.
Tony’s current research interests are in big data, data/text/web mining, bioinformatics, and social media. He has published more than 270 peer-reviewed research papers in various journals, conferences and books. His research projects are funded by the National Science Foundation (NSF), US Dept. of Education, the PA Dept. of Health, the Natural Science Foundation of China (NSFC). He has obtained more than US$9.5 million research grants in the past 12 years as PI or Co-PI and has graduated 23 Ph.D. students from 2006 to 2017 and is currently supervising 8 Ph.D. students.
中央财经大学国际经济与贸易学院 李兵 副教授
报告主题:经济学中的大数据应用
报告摘要:随着信息技术的普及与广泛应用,数据来源更加广泛,数据的收集成本不断下降,这也为经济学中原本无法检验的理论提供了实证验证的可能。本讲座主要介绍大数据在经济学研究中的应用,包括卫星遥感数据、行政管理数据、网络平台数据、媒体文本数据等在经济学顶级期刊发表文章中的应用实例。并结合本人使用大数据的研究成果讨论研究经验与教训,最后对未来的大数据在经济学研究中的应用进行展望。
嘉宾简介:李兵,中央财经大学国际经济与贸易学院副教授,贸易经济系系主任。2008年于吉林大学获得经济学博士学位,2011年于香港科技大学获得社会科学博士学位。主要研究方向是外商直接投资、国际贸易、国际政治经济学、互联网经济学、贸易与创新等。研究成果发表于The Economics of Transition、《经济研究》、《世界经济》等SSCI英文期刊和中文权威期刊。主持省部级课题2项,国家社科重大课题子课题负责人1项,参与2项,参与教育部重大课题1项,其他省部级课题以及政府部门课题多项。全国万名优秀创新创业导师人才库首批入库导师;中国技术经济学会知识产权分委会理事;《经济研究》、《世界经济》等期刊匿名审稿人;“雏鹰读书会”创始人,学术顾问。
本届 SMP 2018 讲习班主席由浙江大学助理教授杨洋担任,邀请到了如下讲者做报告:
SMP 2018 同期将在 8 月 4 日召开八个分论坛,雷锋网此前已介绍过其中的两个,详情可点击链接查阅往期报道,更多议程细节敬请期待雷锋网后续报道。
智能金融论坛
计算社会学论坛
数据挖掘论坛
智能司法论坛
计算历史学论坛
智能教育论坛
去年的 CSDN 用户画像技术评测和中文人机对话技术评测给与会观众及雷锋网留下了深刻印象,而今年 SMP 2018 的技术评测单元则有了更多玩法。除原有的中文人机对话技术评测步入第二届(SMP-ECDT)外,今年还有用户画像技术评测(SMP-EUPT)与文本溯源技术评测(SMP-ETST)等两个评测单元。从赛题到选手表现,相信还有更多精彩等待我们在现场一睹为快。
大会同期还有 21 篇论文口头报告及 31 篇论文海报展示,更多议程正在确认中,敬请期待雷锋网带来的后续报道。
欢迎点击访问 SMP 2018 大会官网,获取注册及参会信息。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。