郭先平教授学术报告-中南大学数学与统计学院

郭先平教授学术报告

发布时间:2018年07月25日 作者:   消息来源:    阅读次数:[]

报告题目:Constrained continuous-time MDPs  on the finite horizon

报告人:郭先平教授 中山大学

报告时间:2018年7月25日下午15:00-18:00

报告地点:数理楼一楼小报告厅145

报告摘要:This talk is on the constrained optimality of  nonhomogeneous continuous-time Markov decision processes on the finite horizon, in which the transition rates are unbounded and policies can be randomized history-dependent. The performance criterion to be optimized is  the expected total reward on the finite horizon,while N constraints are imposed on similar expected costs. Under  suitable conditions, we will show three main results: (a) the class of all the randomized history-dependent policies is

equivalent to the class of all randomized Markov policies; (b) every extreme point of the space of performance vectors is  generated by a deterministic Markov policy; and (c) there exists a constrained-optimal Markov policy, which is a mixture of no more than N+1 deterministic Markov policies. The arguments of these results are based on a novel characterization of the occupation measures o

报告人简介:郭先平,男,博士,教授,博士生导师,国家杰出青年科学基金获得者,广东省珠江学者特聘教授,湖南省张家界市桑植县人, 1996年于中南大学获博士学位(概率统计专业),2002于中山大学晋升为教授,2003年在中山大学被聘为博士生导师并入选“教育部优秀青年教师资助计划”, 2004年入选“教育部新世纪优秀人才支持计划”,2005年被评为“广东省优秀博士后”,2008年在国际会议“The 7-th WCICA” 上获优秀论文奖. 现任国际(SCI)杂志 Advances in Applied Probability、Journal of Applied Probability、 Science China Mathematics、以及中文期刊 《中国科学:数学》、《应用数学学报》和《运筹学学报》的编委. 郭先平教授从事马氏过程和随机最优化的研究. 曾应邀到美国Wayne State大学,英国Liverpool大学,澳大利亚Queensland大学,澳大利亚South Australia 大学,墨西哥CINVESTAV, 香港科技大学,香港中文大学等进行多年合作与研究.在马氏决策过程(英文缩写为MDP)和随机对策(又称博弈)的研究中取得若干创新性成果和重要进展. 比如: 他原创性地建立了研究MDP平均最优的第三种方法---“平均最优双不等式”方法;首次建立美法学者等关注的离散时间非平稳MDP的平均最优方程;还首次给出连续时间Markov对策的最优性条件和逼近算法.他的主要成果以学术论文形式发表在Ann. Appl. Probab., IEEE Trans. Autom. Control, SIAM J. Optim., SIAM J. Control Optim., Math. Oper. Res.,Adv. in Appl. Probab., J. Appl. Probab., J. Optim. Theory Appl., J.Theory Probab., IFAC Automat., European J. Oper. Res., Systems Control Lett., Bernoulli,《中国科学》,《科学通报》等上多种国际杂志上,并在国际顶级出版社Springer 出版第一本关于连续时间MDP的英文专著. 难得的是,他的科研成果还得到国际同行学者发表在 SIAM J. Control Optim., Automatica J.IFAC, Math. Meth. Oper. Res., J. Math. Anal. Appl.,TOP, Math. Reviews,和Zentralblatt MATH等国际杂志上的高度肯定和公开评价.




打印】【收藏】 【关闭