研究方向
在线学习与在线优化
在线学习和在线优化方法的基本思想是结合模型驱动(Model-based)和数据驱动(Data-driven)方法的长处,通过在线调节模型的决策策略,折衷保持算法的经验性能和理论性能。
多智能体在线强化学习
多智能体强化学习协调多个智能体在环境中进行交互学习,每个智能体在观察、测量环境的动态性的同时,协同其他智能体的行为,进行最优决策。
大模型加速推理与软硬件优化
大模型加速推理与软硬件优化致力于突破边缘端芯片的资源限制。其核心在于通过软硬件协同设计,从模型层、执行层、软硬件协同层三个维度,构建了大模型加速推理的全栈优化体系:模型侧通过稀疏化、量化等技术精简计算负载;推理执行侧通过智能调度策略提升资源利用率;软硬件结合侧则深度适配硬件特性,从计算精度、存储管理、多核调度等方面实现软硬协同,最终全方位突破大模型推理的性能瓶颈。
发表论文
ACM SIGMETRICS, June 2025 (Full Paper)
UAI 2025 (Full Paper)
NeurIPS 2025 (Full Paper)
NeurIPS 2025 (Full Paper)
NeurIPS 2025
Reinforcement Learning Conference 2024 (Full Paper)
UAI 2023 (Full Paper)
SIGMETRICS 2023 (Full Paper)
SIGMETRICS 2022 (Full Paper); Journal Version: POMACS, 6(2), 1-29, 2022
INFOCOM 2022
SIGMETRICS 2022 (Full Paper); Journal Version: POMACS, 5(3), 1-30, 2021
Performance 2021
Transactions on Cybernetics, 2021
SIGMETRICS 2020 (Full Paper); Journal Version: POMACS, 4(1), 1-29, 2020
CISS 2019 (Invited Paper)
Systems & Control Letters, 2019, 123: 62-68
International Journal of Adaptive Control and Signal Processing, 2018
SIGMETRICS 2017 (Poster Paper)
IET Control Theory and Applications, 12(1), 110-118, 2017
EEDC Workshop 2016
Wireless Personal Communications 83 (1), 527-549, 2015
IEEE Communications Letters, 19(3), 331-334, 2015