报告时间:2026年3月22日 上午9:00开始
报 告 人:朱利平(中国人民大学统计与大数据研究院 教授)
报告地点:9-218
报告题目:面向高维度和异质性大数据的关联分析技术与理论
报告摘要:皮尔逊相关系数和距离相关系数等经典关联分析方法被广泛应用于度量低维数据之间的关联性,但在处理高维数据时,常面临随机变量取值范围差异显著(即异质性强)的挑战。在此情形下,聚合高维自变量与因变量的关联时,取值范围较大的自变量易主导聚合结果,致使取值范围较小的自变量之关联信息被掩盖。为此,本文提出一类基于排序的鲁棒(即稳健)关联分析方法,并从理论上严格分析了该方法在同质和异质情形下的统计检验功效,并严格证明了其在应对高维数据异质性方面的优势。
报告人简介:中国人民大学长聘教授、博士生导师,统计与大数据研究院院长、学校和理工学部学术委员会委员,国家重大人才工程入选者,国家杰出青年科学基金获得者,享受国务院特殊津贴专家,国家重点研发计划项目首席科学家,兼任中国现场统计研究会生存分析分会理事长和高维数据统计分会副理事长,人民教育出版社普通高中教材《数学》(B版第一册)联合主编,《中国大百科全书》(第三版、统计学)学科编委会委员、统计学卷数据科学分卷(纸质版)主编以及统计学科大数据统计分析分支(电子版)联合主编等。先后受邀担任国际统计学领域顶级学术期刊《美国统计学会会刊》和《统计年刊》、国际权威学术期刊《中华统计学》和《多元分析期刊》等副主编,以及国内统计学领域顶级学术期刊《中国科学·数学》(中、英文版)、《系统科学与数学》(中、英文版)、《统计理论及其应用(英文)》和《应用概率统计》等青年编委、编委和副主编等。
长期从事大数据统计学基础理论、方法和应用等研究。
1. 在高维度大数据领域,提出不依赖于切片数的累积切片估计方法、不依赖于分布条件的半参数降维方法和不依赖于模型的变量筛选方法,解决了充分降维领域的“公开问题”,被认为是该领域的“突破性进展”,被列为变量筛选领域的“基准方法”。
2. 在非线性大数据领域,提出投影相关系数度量非线性相关关系,广泛应用于天体物理学、海事经济学和类脑科学研究中;原创性提出区间分位数相依基本思想,扩宽了(分布)独立基本概念并建立了(分布)独立与分位数独立和均值独立的联系。
3. 在大数据应用领域,主持开发的虚假诉讼预警甄别系统已经在四川省高级人民法院和成都市中级人民法院等10家法院部署应用示范,参与编写的人民法院信息化标准《民事案件信息技术规范》已被最高人民法院发布实施。