学术报告:物理世界决策学习:环境虚拟—强化学习—模型重用的途径-美高梅网址

信息发布

图片新闻

  • 学院举行2019年离退休老同志...
  • 学院组织发放“庆祝中华人民...
  • 日本东北大学环境科学学院Smi...

推荐阅读

通知公告

当前位置: 首页 > 信息发布 > 通知公告 > 正文

学术报告:物理世界决策学习:环境虚拟—强化学习—模型重用的途径

发布日期:2019-09-10  作者:  单位:   点击数:

报告人:俞扬,南京大学教授

报告时间:2019911日(周三)下午1500

报告地点:育贤楼C502

摘要:基于强化学习技术,人工智能系统已在围棋、视频游戏等领域展示出了可超越人类的决策能力。然而在大量的实际应用中,如此强大的决策能力仍然难以获得,其主要瓶颈之一在于,目前强化学习的训练过程需要大量试错,而在实际应用环境中直接试错将造成难以承受的代价,甚至发生灾难。针对这一瓶颈,我们在近期的研究中发展了"环境虚拟—强化学习—模型重用"的途径,对于有历史数据积累的应用领域,实现了0试错代价的决策学习。本次报告将汇报我们在这一途径上的探索进展和在应用场景中取得的效果。

专家简介:

俞扬,博士,南京大学教授。主要研究领域为机器学习、强化学习。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位,获2013年全国优秀博士学位论文奖、2011CCF优秀博士学位论文奖。发表论文40余篇,包括多篇Artificial IntelligenceIJCAIAAAINIPSKDD等,获得4项国际论文奖励和2项国际算法竞赛冠军,入选2018IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”,获2018亚太数据挖掘"青年成就奖”,受邀在IJCAI18作关于强化学习的"青年亮点"报告。

 

分享到:

版权所有:美高梅网址
地址:江苏省南京市浦口区点将台路40号       邮编:210031       苏ICP备11055736号-3

总访问量: 今日访问量:

  • 关注官方微信