机器学习前沿研讨会暨清华大学计算机系“计算未来”博硕论坛第047期
Hide
12月29日(周日),PaperWeekly将携手清华大学计算机系带来机器学习前沿研讨会暨清华大学“计算未来”博硕论坛047期。
【嘉宾介绍】
李永波 / 旷视研究院Video组
2018年博士毕业于西安电子科技大学。研究领域包括图像视频处理、目标检测识别等,已发表多篇顶级国际会议和期刊。目前参与旷视科技视频结构化算法、人脸检测与识别算法的研究和开发,致力于人工智能算法在安防场景中的应用和提升。旷视科技2018年度最佳团队(MegTeam)成员。
Object Detection:从算法到实用
物体检测是计算机视觉领域的经典问题。目前物体检测的整体框架已经比较成熟,但从算法到实际商用之间还存在很多挑战。这次分享将结合旷视在物体检测问题上的探索,从数据到算法再到应用分别展开,详细介绍新想法是如何诞生,并演变成为有意思的实用新技术。
庞天宇 / 清华大学计算机系博士生
庞天宇,清华大学计算机系直博三年级,导师为朱军教授。主要研究方向为提升深度学习模型的鲁棒性与可靠性。目前在ICML、NeurIPS、ICLR、CVPR上共发表9篇文章,其中有5篇为一作/共同一作。曾获国家奖学金、英伟达学术先锋奖。
深度学习中的对抗鲁棒性研究
尽管深度学习模型在各类任务上达到了很高的准确率,但是几乎所有标准的深度学习模型都存在对抗鲁棒性缺陷。这种缺陷导致了潜在的安全风险。本报告主要围绕如何提高模型鲁棒性展开介绍讨论。
程书宇 / 清华大学计算机系博士生
程书宇,清华大学计算机系二年级博士生,导师为朱军教授。
Improving Black-box Adversarial Attacks with a Transfer-based Prior
在对抗攻击任务中,我们考虑黑盒的设定,即攻击者不能完整访问到目标模型的架构和参数信息,故无法直接得到模型的输出关于输入的梯度。估计梯度的已有方法包括基于迁移的攻击和基于查询的攻击。为了提高梯度估计的质量,我们将迁移梯度作为先验引入基于查询的攻击,并通过理论推导得出最优的参数。新方法减少了攻击成功需要的查询数量。
李佳维 / 清华大学计算机系博士生
李佳维,清华大学计算机系博士生,先后在香港理工大学、腾讯公司等机构参加深度学习及计算机视觉算法的研究,现在在腾讯公司AI LAB视觉组实习,参与虚拟人项目的研发。
Ensemble Deep Learning
在本次报告中,首先会介绍一个集成深度学习的框架。然后再分别介绍采样技术、模型训练技术、以及聚合方法,最后分享集成深度学习领域的一些最新进展、及实际的应用效果。
李丽姗 / 清华大学计算机系博士生
李丽姗, 清华大学计算机系博士生在读,主要研究方向为机器学习在计算机网络中的应用。目前在Globecom以及ACML等会议上发表多篇文章。
在POI推荐任务中的多模式表示学习方法
对于基于位置信息的社交网络而言,POI推荐是非常重要的研究问题。本报告介绍一种多模式表示学习方法,能够统一刻画POI的特征信息以及用户偏好。
吴栋贤 / 清华大学计算机系博士生
吴栋贤,清华大学计算机系四年级直博生。
关于残差网络 (ResNet)中跳线(skip connection)的安全思考
跳线 (Skip Connections) 是当前主流神经网络中的重要组成部分,例如ResNet、DenseNet。虽然在模型设计上,跳线取得了巨大的成功,但它同时给模型安全带来了隐忧。我们发现,通过简单控制反向传播中流经跳线和卷积层的梯度流,可以显著提升对抗样本的迁移性,从而实现更有效的黑盒攻击。这项研究展现了由模型结构引发的安全问题,对模型结构的设计提出了挑战。同期论文已被录用为 ICLR 2020 的 spotlight。
杨超 / 清华大学计算机系博士生
杨超,现为清华大学计算机系普博二年级学生,导师是孙富春教授,本系2018级硕士毕业生,主要研究方向强化学习,模仿学习以及在机器人上的应用。目前发表NeurIPS,AAAI,ICRA等会议/期刊4篇,担任ICRA2018-2020,IROS2017-2019,T-ASE 2019学术审稿人,2019年11月参加IROS2019机器人抓取与操作国际竞赛获得冠军。
基于观测模仿的机器人学习方法
本次报告主要介绍报告人2019年被NeurIPS录取的一篇论文《Imitation Learning from Observations by Minimizing Inverse Dynamics Disagreement》,这是国内单位在强化学习/模仿学习领域被该会议录取的唯一一篇亮点论文(Spotlight)。
本文主要讨论如何在只提供专家状态演示(缺乏专家动作演示)下的模仿学习,即从观察中学习(LfO)。与从完备专家演示中学习(LfD)不同,LfO在利用更多形式的数据(比如视频,以往方法是无法使用这些数据)方面更具有实用性。同时,因为专家演示信息的不完备,所以实现LfO更加具有挑战性。在这篇文章中,我们从理论和实践的角度讨论了LfD和LfO的不同。首先我们数学证明了,在GAIL的建模框架下,LfD和LfO的分歧实际上就是智能体和专家的逆运动模型的不一致性。更重要的是,这个分歧的一个上界是可以通过无模型的最大化熵来实现。我们的方法命名为IDDM,通过最小化LfO与LfD的区别来增强LfO的性能。大量实验验证了我们方法相比传统LfO方法的优势。
【活动时间】
报名时间:即日起至 12 月 28 日 24:00
活动时间:12 月 29 日(本周日)14:00 - 17:00
【活动地点】
清华大学信息科学技术大楼(FIT楼)二层多功能厅,请从 FIT 楼西门进入
【活动名额】
1. 因场地有限,本次活动仅接受 120 位 用户凭电子门票二维码入场;
2. 活动采取审核制报名,我们将根据用户研究方向与当期主题的契合度进行筛选,通过审核的用户将收到包含电子门票二维码的短信通知。
【主办单位】
PaperWeekly
清华大学计算机科学与技术系
(4年前)
(5年前)
(5年前)
(5年前)
(5年前)
(5年前)