讲习班背景
CAAI-AIDL已在北京、南京、深圳、武汉等地先后成功举办七次,凭借专业、优质、精细的前沿解读广受好评,惠及2000余人次。中国科学院自动化研究所研究员陶建华,南京大学计算机科学与技术系副主任周志华,中国科学院计算技术研究所研究员、副所长、副总工程师程学旗,北京航空航天大学计算机学院副院长王蕴红,清华大学教授季向阳,腾讯人工智能实验室主任张潼,伊利诺伊大学芝加哥分校杰出教授刘兵,华中科技大学电信学院教授、副院长白翔,浙江大学计算机辅助设计与图形学国家重点实验室教授章国锋,9位精英领衔7场讲习班,携手76位著名学者及业界专家,围绕深度学习、机器学习、大数据、智能感知、自然语言处理、计算机视觉应用技术等领域内的热点前沿问题,带来56场主题报告展开高、精、深的讲解。
讲习班内容
第8期CAAI-AIDL主题为《自然语言理解、生成与人机对话》,由中国人工智能学会主办,复旦大学计算机科学技术学院教授邱锡鹏和字节跳动人工智能实验室总监李磊担任学术负责人,并邀请到自然语言处理领域八位著名学者作为特邀报告人。参会者不仅可以听取专家们对本领域基础知识和最新进展的集中讲解,也可以获得跟顶尖专家交流的机会。
学术主任
邱锡鹏
复旦大学计算机科学技术学院副教授
主要从事自然语言处理、深度学习等方向的研究,在ACL、AAAI、IJCAI、EMNLP等计算机学会A/B类期刊会议上发表60余篇学术论文,引用2200余次,获得ACL2017杰出论文奖、CCL2019最佳论文奖。开源中文自然语言处理工具FudanNLP作者,FastNLP项目负责人。2015年入选首届中国科协人才托举工程,2018年获中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”。
李磊 字节跳动人工智能实验室总监
本科毕业于上海交通大学计算机系,博士毕业于卡耐基梅隆大学计算机系。曾任加州大学伯克利分校作博士后研究员和百度美国深度学习实验室少帅科学家。曾获2012年美国计算机学会SIGKDD最佳博士论文第二名、2017年吴文俊人工智能技术发明二等奖、2017年CCF杰出演讲者、2019年CCF青竹奖。在机器学习、数据挖掘和自然语言处理领域于国际顶级学术会议发表论文50余篇,拥有三项美国技术发明专利。担任CCF中文信息处理专委委员,2017 KDD Cup、2018 KDD Hands-on Tutorial、2019KDD Sponsorship联合主席, IJCAI2017和AAAI 2019资深程序委员,EMNLP2019领域主席和NeurIPS、ICML、KDD、IJCAI、AAAI、NAACL、EMNLP等大会程序委员。
特邀讲师
洪宇 苏州大学教授
题目
信息抽取的常识与前沿
摘要
信息抽取是NLP领域中重要的研究任务,涉及的主题非常广泛,包括事件抽取、实体关系抽取和属性抽取等等。每个主题又可以细分为若干子任务,比如,事件抽取涵盖触发词识别、事件类型分类、论元及角色判定、真假鉴别;关系抽取囊括关系分类、实体链接(Entity Linking)和槽填充(Slot filling);属性抽取则可根据对象的不同,形成情感属性、术语属性和知识片段的识别与分类。这里即将开展的一次讲习,将从上述任务的定义和背景说起,希望初学者从中挖掘一些研究兴趣。此次讲习有一个变化,即尝试加入关于“如何利用神经网络构建简单信息抽取模型”的介绍,这一部分将以事件检测、实体关系分类和术语属性识别为例,围绕基础性的神经抽取模型进行说明。在此基础上,讲习将对近几年ACL和EMNLP会议中的相关探索与前沿技术进行简介,并尽量将一些可解释性的分析融入讨论之中。希望参与讲习班的同学与同行从中获益。
简介
毕业于哈尔滨工业大学计算机学院,2009获得计算机应用专业工学博士学位,同年进入苏州大学计算机科学与技术学院工作。2014-2016在美国纽约州伦斯勒理工学院担任博士后研究助理。研究兴趣集中在自然语言处理和人工智能,具体涉及信息抽取、篇章关系理解、多模态机器翻译及智能问答。主持和参与多项国家自然科学基金重大专项、重点、面上项目,以及市厅级国际合作和基础研究基金项目。已发表论文近百篇,其中包括ACL、EMNLP、COLING、SIGIR、CIKM等CCF认定的A和B类国际会议论文,以及国内计算机领域一级与核心学报《计算机学报》、《软件学报》、《计算机研究与发展》、《人工智能与模式识别》、《中文信息学报》中文论文,已获授权发明专利5项,受理专利6项。合作参与多项国际评测,包括TAC-KBP信息抽取评测,于2014-2016期间,在事件检测和Slot Filling(Cold Start)任务中,曾获得综合排名第一和第二的评测成绩。参与制定事件关系标准及数据标注规范,以及低资源信息抽取、垂直领域信息抽取和跨模态信息抽取的项目指南。
刘康 中科院自动化所副研究员
题目
面向知识图谱的问答系统
摘要
随着搜索引擎的飞速发展,将互联网文本内容结构化,从中抽取有用的知识,构建基于知识的问答系统,对于文本内容的语义理解以及搜索结果的精准化有着重要的意义。然而,面对大规模知识库/知识图谱,如何正确理解用户自然语言形式的问题语义,从已有结构化的知识图谱中获取正确的答案,是摆在众多研究者和开发者前的一个重要问题。本报告将主要介绍大规模知识图谱问答的基本概念、模型以及最新研究进展,包括:基于符号表示的Semantic Parsing、基于Deep Learning的端到端知识问答方法、Neural Semantic Parsing等,最后对其中存在的问题和趋势进行分析和展望。
简介
研究领域包括信息抽取、网络挖掘、问答系统等,同时也涉及模式识别与机器学习方面的基础研究。在自然语言处理、知识工程等领域国际重要会议和期刊发表论文90余篇(如TKDE、ACL、IJCAI、EMNLP、COLING、CIKM等),获得KDD CUP 2011 Track2 全球亚军,COLING 2014最佳论文奖,首届“CCF-腾讯犀牛鸟基金卓越奖”、2015、2016 Google Focused Research Award。2014年获得中国中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新一等奖”、2018年获得中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(排名第二)等奖项。曾任ACL2017、ACL2019问答系统领域主席、兼任中国中文信息学会青年工作委员会主任、语言与知识计算专业委员会秘书长等学术职务。
唐都钰 微软亚洲研究院自然语言计算组主管研究员
题目
知识驱动的智能问答与语义解析
摘要
本次报告介绍知识驱动的智能问答和语义解析方法。本次报告中,“知识驱动”中的“知识”涵盖语法知识、语境知识、数据知识和外部背景知识。首先,以基于表格和基于知识图谱的问答系统为例,介绍利用语法知识的语义解析方法;然后,介绍基于语境知识的语义解析和多轮问答方法。接下来,介绍如何融合检索模型和元学习利用数据知识。最后,介绍基于如何利用样本的外部背景知识辅助智能问答和自然语言理解。
简介
从事智能问答、语义理解、机器推理等自然语言处理研究,多项研究成果已经转化到必应搜索、Cortana语音助手等在内的微软人工智能产品。
周浩 字节跳动人工智能实验室
题目
深度文本生成模型的前沿进展
摘要
文本生成技术是自然语言处理中的一项基础技术,在机器写稿、机器翻译、对话、搜索、在线广告等产品上有很多应用。本次讲座将围绕三个方面介绍文本生成中的深度生成模型。一是序列到序列的生成,包括最新的Transformer模型,最新的非自回归的文本生成模型以及它在各种文本生成中的改进。二是比序列生成有更多优势的深度隐变量模型,包括生成与编码结合的变分自编码模型(VAE)与对抗生成网络(GAN)。VAE要对离散的文本序列学出光滑连续的隐空间,生成时可以从隐空间采样。而GAN可以附加一个与任务有关的判别器,可以生成与最终任务更相关的文本。第三类是可控贝叶斯方法,可以生成更大多样性和可解释性的文本。最后,我们讲介绍实际场景中的一些应用,例如数据到文本的生成,问题生成等。
简介
Dr. Hao Zhou is a senior researcher at ByteDance AI Lab. Hao Zhou obtained his Ph.D. from computer science department of Nanjing University in 2017, and he was the recipient of Chinese Association of Artificial Intelligence 2019 Doctoral Dissertation Award. His research interests are machine learning and its applications for natural language processing. Currently he focuses on deep generative models for NLP. He has served in the Program Committee for ACL, EMNLP, IJCAI, AAAI, NIPS. He has more than 20 publications in prestigious conferences and journals, including ACL, EMNLP, NAACL, TACL, AAAI, IJCAI, NIPS and JAIR.
黄民烈 清华大学智能技术与系统实验室副主任、副教授
题目
知识增强的自然语言生成
摘要
现有的自然语言生成模型仍然面临许多问题:在这些模型中,尤其是在开放式语言生成(输入信息有限、普遍存在1对多映射的语言生成)任务中,多样性、信息量、重复性、一致性、连贯性或逻辑性没有得到很好的控制。在此讲座中,演讲者将讨论自然语言生成中的典型设置,问题和现有解决方案。特别是,演讲者结合学术界现有的工作,探讨一个重要的问题:现有的语言生成模型多大程度拥有常识或世界知识?在常识生成、知识补全、对话生成,故事结局生成、常识性故事生成等应用中,知识可以更好地辅助语言理解和语言生成。这些研究尝试表明,知识可以提供信息量、一致性、连贯性和隐式规划,在开放式语言生成中尤其有用。
简介
他的研究兴趣包括强化学习、深度学习、自然语言处理等,尤其是对话系统,阅读理解和情感分析。在国际顶级会议和期刊(ACL,EMNLP,AAAI,IJCAI,WWW,SIGIR等)上发表了60多篇论文,入选ACL 2019最佳演示论文候选,获得IJCAI 2018杰出论文奖,CCL 2018最佳演示奖,NLPCC 2015最佳论文奖,2018年汉王青年创新奖(中文信息处理学会),2019年MSRA合作研究奖, 2019年获得吴文俊人工智能科技进步奖一等奖(排名第一)。情感对话模型的工作被麻省理工技术评论、英国卫报、参考消息、新华社等媒体广泛报道,常识对话模型的工作获得人工智能顶级会议IJCAI 2018杰出论文。担任TACL的常务编审,ACL 2020/2016、EMNLP 2019/2014/2011的领域主席,AAAI 2017-2020和IJCAI 2017-2020的高级程序委员以及TASLP,TKDE,TOIS,TPAMI等的审稿人。2019年获得国家自然科学基金重点项目资助。他的主页位于http://coai.cs.tsinghua.edu.cn/hml/,谷歌学术主页位于
https://scholar.google.com/citations?user=P1jPSzMAAAAJ&hl=zh-CN
严睿 北京大学助理教授
题目
开放领域人机对话系统的技术现状与挑战
摘要
近年来,自动人机对话系统在学术界和工业界都获得了相当大的关注度,随着微软小冰百度度秘等产品的发布,以及大量人工智能公司的建立,这些对话系统背后的技术在逐步积累,也逐步解密。随着研究者的探索愈发深入,人们看到了一个对话系统逐渐从科幻电影中走进现实生活的可能。在讲座中,我将回顾人机对话的发展历程,以及随着深度学习技术盛行之后,由数据驱动模型带来的革命性改变。讲座将从人机对话的已有应用出发,再分析现有对话系统的不足,展望下一代人机对话系统的挑战。同时会分享课题组在人机对话研究所做的努力与探索,以及相应的代表性成果。
简介
主持研发多个开放领域对话系统和服务类对话系统,发表高水平研究论文100余篇,担任多个学术会议(KDD, IJCAI, SIGIR, ACL, WWW, AAAI, CIKM, EMNLP等)的(资深)程序委员会委员及审稿人。受邀在EMNLP, WWW, SIGIR, IJCAI等多个顶级国际会议上做针对人机对话系统与自然语言处理的讲习班教程报告(Tutorial)或邀请报告(Invited Talk)。
车万翔 哈尔滨工业大学计算机学院教授
题目
任务型对话系统
摘要
对话系统一般可以分为两种,即任务型对话系统(也称作目标导向型对话系统)和闲聊对话系统。本讲习班主要介绍任务型对话系统,其多用于垂直领域业务助理系统,如微软小娜、百度度秘、阿里小蜜以及我们研发的对话技术平台(DTP)等。这类系统具有明确需要完成的任务目标,如订餐、订票等。我们将首先介绍任务型对话系统的背景和定义,然后依次介绍其中的关键技术,包括自然语言理解(包括领域意图的识别和语义槽的填充)、对话管理(包括对话状态跟踪和对话策略优化)以及自然语言生成;接着介绍任务型对话系统的评价方法和国内外相关技术评测任务;最后对任务型对话系统的技术和应用趋势进行展望。
简介
在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文50余篇,其中AAAI 2013年的文章获得了最佳论文提名奖,论文累计被引用2,500余次(Google Scholar数据),H-index值为27。出版教材 2 部,译著 2 部。目前承担国家自然科学基金、973等多项科研项目。负责研发的语言技术平台(LTP)已被600余家单位共享,提供的在线“语言云”服务已有用户1万余人,并授权给百度、腾讯、华为等公司使用。2018、2019连续两年获CoNLL国际评测第1名。2015、2016连续两年获Google Focused Research Award(谷歌专注研究奖);2016年,获黑龙江省科技进步一等奖(排名第2);2012年,获黑龙江省技术发明奖二等奖(排名第2);2010年获中国中文信息学会“钱伟长”中文信息处理科学技术奖一等奖(排名第2)、首届汉王青年创新奖(个人)等多项奖励。2017年,所主讲的MOOC课程《高级语言程序设计(Python)》获国家精品在线开放课程。
张伟男 哈尔滨工业大学计算机科学与技术学院副教授
题目
任务型对话系统
摘要
对话系统一般可以分为两种,即任务型对话系统(也称作目标导向型对话系统)和闲聊对话系统。本讲习班主要介绍任务型对话系统,其多用于垂直领域业务助理系统,如微软小娜、百度度秘、阿里小蜜以及我们研发的对话技术平台(DTP)等。这类系统具有明确需要完成的任务目标,如订餐、订票等。我们将首先介绍任务型对话系统的背景和定义,然后依次介绍其中的关键技术,包括自然语言理解(包括领域意图的识别和语义槽的填充)、对话管理(包括对话状态跟踪和对话策略优化)以及自然语言生成;接着介绍任务型对话系统的评价方法和国内外相关技术评测任务;最后对任务型对话系统的技术和应用趋势进行展望。
简介
研究兴趣包括人机对话及自然语言处理。在ACL、AAAI、IJCAI及IEEE TKDE等CCF A类国际会议及国际顶级期刊发表论文多篇,主导研发了人机对话系统“笨笨”。目前为中国中文信息学会(CIPS)信息检索专委会委员、青年工作委员会委员,中国人工智能学会(CAAI)青年工作委员会委员。曾获黑龙江省科技进步一等奖、中国人工智能学会最佳青年成果奖、中国人工智能学会“合创杯”第二届全国青年创新创业大赛三等奖及首届“百度奖学金”。
日程安排
2019年12月14日
09:00 - 09:10
开幕式
09:10 - 10:40
信息抽取的常识与前沿
洪宇
苏州大学教授
10:40 - 10:50
茶歇
10:50 - 12:20
面向知识图谱的问答系统
刘康
中科院自动化所副研究员
12:20 - 14:00
午餐+休息
14:00 - 15:30
知识驱动的智能问答与语义解析
唐都钰
微软亚洲研究院自然语言计算组主管研究员
15:30 - 15:40
茶歇
15:40 - 17:10
深度文本生成模型的前沿进展
周浩
字节跳动人工智能实验室
2019年12月15日
09:00 - 10:30
知识增强的自然语言生成
黄民烈
清华大学智能技术与系统实验室副主任、副教授
10:30 - 10:40
茶歇
10:40 - 12:10
开放领域人机对话系统的技术现状与挑战
严睿
北京大学助理教授
12:10 - 14:00
午餐+休息
14:00 - 15:30
任务型对话系统
车万翔
哈尔滨工业大学计算机学院教授
15:30 - 15:40
茶歇
15:40 - 17:10
任务型对话系统
张伟男
哈尔滨工业大学计算机科学与技术学院副教授
报名参会
组织机构
主办单位:中国人工智能学会
讲习班时间
2019年12月14日-15日,时长2天
讲习班地点
上海市张衡路825号(复旦大学张江校区)
讲习班费用
CAAI会员价:2000元/人
全价票:2500元/人
在校生参会可享受学生优惠价格1200元/人;
希望以会员价购票的参会人可自行注册http://app01.cast.org.cn:7001/cast/reg.jsp?sid=E66
或致电010-62283663张老师咨询。
付款方式
1、银行转账
开户行:工行北京新街口支行
户名:中国人工智能学会
帐号:0200002909200166203
2、现场付费(POS机)
其他事项
1、差旅和住宿费用自理。
2、请您在支付时留言备注您的姓名+第8期讲习班,方便我们的工作人员为您核对,付款成功后请填写参会回执(附件)。
3、更多讲习班事项,欢迎扫码入群咨询。
联系我们
入群或致电以下联系人
联 系 人:郭老师
联系电话:13521772968
点击AI前沿讲习班直达报名系统 |