机器学习前沿研讨会暨清华大学计算机系“计算未来”博硕论坛第047期

Event DetailsHide...More...

12月29日（周日），PaperWeekly将携手清华大学计算机系带来机器学习前沿研讨会暨清华大学“计算未来”博硕论坛047期。

【嘉宾介绍】

李永波 / 旷视研究院Video组

2018年博士毕业于西安电子科技大学。研究领域包括图像视频处理、目标检测识别等，已发表多篇顶级国际会议和期刊。目前参与旷视科技视频结构化算法、人脸检测与识别算法的研究和开发，致力于人工智能算法在安防场景中的应用和提升。旷视科技2018年度最佳团队（MegTeam）成员。

Object Detection：从算法到实用

物体检测是计算机视觉领域的经典问题。目前物体检测的整体框架已经比较成熟，但从算法到实际商用之间还存在很多挑战。这次分享将结合旷视在物体检测问题上的探索，从数据到算法再到应用分别展开，详细介绍新想法是如何诞生，并演变成为有意思的实用新技术。

庞天宇 / 清华大学计算机系博士生

庞天宇，清华大学计算机系直博三年级，导师为朱军教授。主要研究方向为提升深度学习模型的鲁棒性与可靠性。目前在ICML、NeurIPS、ICLR、CVPR上共发表9篇文章，其中有5篇为一作/共同一作。曾获国家奖学金、英伟达学术先锋奖。

深度学习中的对抗鲁棒性研究

尽管深度学习模型在各类任务上达到了很高的准确率，但是几乎所有标准的深度学习模型都存在对抗鲁棒性缺陷。这种缺陷导致了潜在的安全风险。本报告主要围绕如何提高模型鲁棒性展开介绍讨论。

程书宇 / 清华大学计算机系博士生

程书宇，清华大学计算机系二年级博士生，导师为朱军教授。

Improving Black-box Adversarial Attacks with a Transfer-based Prior

在对抗攻击任务中，我们考虑黑盒的设定，即攻击者不能完整访问到目标模型的架构和参数信息，故无法直接得到模型的输出关于输入的梯度。估计梯度的已有方法包括基于迁移的攻击和基于查询的攻击。为了提高梯度估计的质量，我们将迁移梯度作为先验引入基于查询的攻击，并通过理论推导得出最优的参数。新方法减少了攻击成功需要的查询数量。

李佳维 / 清华大学计算机系博士生

李佳维，清华大学计算机系博士生，先后在香港理工大学、腾讯公司等机构参加深度学习及计算机视觉算法的研究，现在在腾讯公司AI LAB视觉组实习，参与虚拟人项目的研发。

Ensemble Deep Learning

在本次报告中，首先会介绍一个集成深度学习的框架。然后再分别介绍采样技术、模型训练技术、以及聚合方法，最后分享集成深度学习领域的一些最新进展、及实际的应用效果。

李丽姗 / 清华大学计算机系博士生

李丽姗，清华大学计算机系博士生在读，主要研究方向为机器学习在计算机网络中的应用。目前在Globecom以及ACML等会议上发表多篇文章。

在POI推荐任务中的多模式表示学习方法

对于基于位置信息的社交网络而言，POI推荐是非常重要的研究问题。本报告介绍一种多模式表示学习方法，能够统一刻画POI的特征信息以及用户偏好。

吴栋贤 / 清华大学计算机系博士生

吴栋贤，清华大学计算机系四年级直博生。

关于残差网络 (ResNet)中跳线(skip connection)的安全思考

跳线 (Skip Connections) 是当前主流神经网络中的重要组成部分，例如ResNet、DenseNet。虽然在模型设计上，跳线取得了巨大的成功，但它同时给模型安全带来了隐忧。我们发现，通过简单控制反向传播中流经跳线和卷积层的梯度流，可以显著提升对抗样本的迁移性，从而实现更有效的黑盒攻击。这项研究展现了由模型结构引发的安全问题，对模型结构的设计提出了挑战。同期论文已被录用为 ICLR 2020 的 spotlight。

杨超 / 清华大学计算机系博士生

杨超，现为清华大学计算机系普博二年级学生，导师是孙富春教授，本系2018级硕士毕业生，主要研究方向强化学习，模仿学习以及在机器人上的应用。目前发表NeurIPS，AAAI，ICRA等会议/期刊4篇，担任ICRA2018-2020，IROS2017-2019,T-ASE 2019学术审稿人，2019年11月参加IROS2019机器人抓取与操作国际竞赛获得冠军。

基于观测模仿的机器人学习方法

本次报告主要介绍报告人2019年被NeurIPS录取的一篇论文《Imitation Learning from Observations by Minimizing Inverse Dynamics Disagreement》，这是国内单位在强化学习/模仿学习领域被该会议录取的唯一一篇亮点论文（Spotlight）。

本文主要讨论如何在只提供专家状态演示(缺乏专家动作演示)下的模仿学习，即从观察中学习(LfO)。与从完备专家演示中学习(LfD)不同，LfO在利用更多形式的数据(比如视频，以往方法是无法使用这些数据)方面更具有实用性。同时，因为专家演示信息的不完备，所以实现LfO更加具有挑战性。在这篇文章中，我们从理论和实践的角度讨论了LfD和LfO的不同。首先我们数学证明了，在GAIL的建模框架下，LfD和LfO的分歧实际上就是智能体和专家的逆运动模型的不一致性。更重要的是，这个分歧的一个上界是可以通过无模型的最大化熵来实现。我们的方法命名为IDDM，通过最小化LfO与LfD的区别来增强LfO的性能。大量实验验证了我们方法相比传统LfO方法的优势。

【活动时间】

报名时间：即日起至 12 月 28 日 24:00

活动时间：12 月 29 日（本周日）14:00 - 17:00

【活动地点】

清华大学信息科学技术大楼（FIT楼）二层多功能厅，请从 FIT 楼西门进入

【活动名额】

1. 因场地有限，本次活动仅接受 120 位用户凭电子门票二维码入场；

2. 活动采取审核制报名，我们将根据用户研究方向与当期主题的契合度进行筛选，通过审核的用户将收到包含电子门票二维码的短信通知。

【主办单位】

PaperWeekly

清华大学计算机科学与技术系