高维复杂结构数据降维
项目介绍
AI项目解读
基本信息
- 批准号:11471030
- 项目类别:面上项目
- 资助金额:60.0万
- 负责人:
- 依托单位:
- 学科分类:A0402.统计推断与统计计算
- 结题年份:2018
- 批准年份:2014
- 项目状态:已结题
- 起止时间:2015-01-01 至2018-12-31
- 项目参与者:徐兴忠; 刘旭华; 赵俊光; 黄乐乐; 张莹; 詹书仕;
- 关键词:
项目摘要
With the development of technology, it is increasingly common to model the high dimensional data of complex structure. Modeling the matrix (tensor) valued data is commonly encountered in the field of medicine and biology. Although there are many theories and methods developed to deal with the high dimensional vector-valued data, vectorizing the matrix (tensor) data into vector simply and applying the existing methods for vector valued data will destroy the inner structure of the data and induce too many redundent paprameters, leading to unstable estimate. Compared with vector-valued case, parameters in the statistical model of matrix(tensor) data usally have more complicated structure. And the researches are less developed for many cases. This project will develop dimension reduction and varaible selection techniques for the high dimensional matrix(tensor) data of complex structure. It contains three parts. (1) Parameter estimation and hypothesis testing in the regression model of high dimensional matrix (tensor) valued data. (2)Robust statistical methods for high dimensional matrix(tensor) valued data. (3) The covariance and precision matrix estimate for high dimensional matrix(tensor) valued data. This project has great academic values and promising future in application.
随着技术进步,高维复杂结构数据的建模已经越来越普遍。在生物、医学等领域中经常需要对矩阵(张量)值(即变量取值为矩阵或张量)高维数据建模。尽管向量值(即变量的取值为向量)高维数据已有许多降维和变量选择方法,但是简单将矩阵(张量)值数据拉直为向量,并使用已有的向量值数据统计方法,将破坏数据的行列结构,导致参数维数过高,估计不稳定。和向量值数据相比,高维矩阵(张量)值数据建模中,参数往往具有更复杂的结构,而许多情形的研究还很不充分。本项目将研究具有复杂结构的高维矩阵(张量)数据的降维和变量选择方法,主要包括三个内容:(1)高维矩阵(张量)值数据回归模型中的参数估计和假设检验。(2)高维矩阵(张量)值数据的稳健统计方法。(3)高维矩阵(张量)值变量的协方差及其逆矩阵的估计。本项研究具有很高的学术价值和很强的应用价值。
结项摘要
随着信息技术的发展,在生物、医学等领域中经常需要对矩阵(张量)值高维数据建模。与传统向量数据不同,矩阵(张量)数据具有行列结构信息。建模过程中简单将数据拉直成向量会丢失行列结构信息并造成变量维数过高。本项目研究复杂结构高维矩阵(张量)数据的建模问题,主要包括三个内容:(1)高维矩阵值数据回归模型的参数估计以及影响点诊断;(2)高维矩阵值数据协方差及其逆矩阵的稳健统计;(3)高维数据若干假设检验问题。 . 本项目研究了矩阵值数据迹回归模型中,参数的估计和变量选择问题。通过将核范数和group lasso惩罚相结合,建立了凸的目标函数,得到了估计的相合性。在实际问题中,异常值或影响点是十分常见的。 当有多个影响点时,由于masking效应和swamping效应的存在,模型诊断是一个困难的问题。我们提出了影响点诊断的新方法MIP,有效克服了masking和swamping效应。 此外,我们研究了分类问题的有限样本崩溃点问题,通过研究发现,经典的有限样本崩溃点的概念并不适应于分类问题,我们提出了角度崩溃点的概念,并给出了线性和kernel分类器下崩溃点的上界。. 本项目研究了高维矩阵值数据协方差矩阵的稳健估计问题。针对协方差矩阵具有非稀疏Kronecker乘积和结构。我们基于Kendall's 相关系数提出了协方差矩阵的稳健估计。其次针对相关系数矩阵具有稀疏Kronecker结构的情形,我们用类似方法,建立了相关系数的稳健估计,该估计在维数增加时具有更快的收敛速度。此外,针对高维因子模型中因子载荷矩阵具有稀疏行结构的情形,我们提出了一种新的估计方法,将协方差矩阵分为稀疏稠密子块分别处理,所得估计具有更高的收敛速度。. 本项目还研究了高维正态总体的若干假设检验问题。研究了协方差具有spike结构下两正态总体均值的估计问题。研究了K个具有相同协方差矩阵的正态总体,均值是否相等的检验问题。研究了高维正态线性模型系数是否为零的假设检验问题。
项目成果
期刊论文数量(30)
专著数量(0)
科研奖励数量(0)
会议论文数量(2)
专利数量(0)
On two-sample mean tests under spiked covariances
尖峰协方差下的两个样本均值检验
- DOI:10.1016/j.jmva.2018.05.004
- 发表时间:2018-09
- 期刊:Journal of Multivariate Analysis
- 影响因子:1.6
- 作者:Wang Rui;Xu Xingzhong
- 通讯作者:Xu Xingzhong
Least squares generalized inferences in unbalanced two-component normal mixed linear model
不平衡二元正态混合线性模型中的最小二乘广义推论
- DOI:10.1007/s00180-015-0604-8
- 发表时间:2015-07
- 期刊:Computational Statistics
- 影响因子:1.3
- 作者:Liu Xuhua;Xu Xingzhong;Hannig Jan
- 通讯作者:Hannig Jan
An analysis of penalized interaction models
惩罚交互模型分析
- DOI:10.3150/15-bej715
- 发表时间:2016-03
- 期刊:Bernoulli
- 影响因子:1.5
- 作者:Junlong Zhao;Chenlei Leng
- 通讯作者:Chenlei Leng
Spline Multiscale Smoothing to Control FDR for Exploring Features of Regression Curves
通过样条多尺度平滑控制 FDR 来探索回归曲线的特征
- DOI:10.1080/10618600.2014.1001069
- 发表时间:2016
- 期刊:Journal of Computational and Graphical Statistics
- 影响因子:2.4
- 作者:Li Na;Xu Xingzhong;Xu Xingzhong;Li N;Xu XZ;Xu XZ
- 通讯作者:Xu XZ
A new generalized confidence interval for the among-group variance in the heteroscedastic one-way random effects model
异方差单向随机效应模型中组间方差的一种新广义置信区间
- DOI:10.1080/03610918.2015.1041975
- 发表时间:2017-03
- 期刊:COMMUNICATIONS IN STATISTICS-SIMULATION AND COMPUTATION
- 影响因子:0.9
- 作者:Xuhua Liu;Na Li;Yuqin Hu
- 通讯作者:Yuqin Hu
共 24 条
- 1
- 2
- 3
- 4
- 5
其他文献
局域波时频相干方法及其工程应用
- DOI:--
- 发表时间:2012
- 期刊:振动.测试与诊断
- 影响因子:--
- 作者:赵俊龙;王奉涛;李宏坤;韩素兰
- 通讯作者:韩素兰
东方巴贝斯虫核糖体蛋白L26全长cDNA克隆及蛋白特性分析
- DOI:--
- 发表时间:--
- 期刊:中国血吸虫病防治杂志
- 影响因子:--
- 作者:张颖;周丹娜;周艳琴;刘琴;赵俊龙;贺兰
- 通讯作者:贺兰
高压静脉注射转染法建立脂源性炎症介导的肝癌小鼠模型。
- DOI:--
- 发表时间:2020
- 期刊:细胞与分子免疫学杂志。
- 影响因子:--
- 作者:卢羿同;杨嘉蒙;赵俊龙;秦鸿雁
- 通讯作者:秦鸿雁
基于核磁共振的煤岩孔裂隙应力变形特征
- DOI:--
- 发表时间:2015
- 期刊:煤炭学报
- 影响因子:--
- 作者:许浩;李松;赵俊龙;孟艳军
- 通讯作者:孟艳军
已有降维方法的推广
- DOI:--
- 发表时间:--
- 期刊:数学年刊A辑(中文版)
- 影响因子:--
- 作者:徐兴忠;赵俊龙
- 通讯作者:赵俊龙
共 27 条
- 1
- 2
- 3
- 4
- 5
- 6
赵俊龙的其他基金
张量数据稳健估计和假设检验中的若干问题
- 批准号:12371288
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
融合结构信息的高维数据稳健估计
- 批准号:11871104
- 批准年份:2018
- 资助金额:52.0 万元
- 项目类别:面上项目