基于再生核希尔伯特空间的变量选择及其相关问题研究
项目介绍
AI项目解读
基本信息
- 批准号:11901375
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:A0402.统计推断与统计计算
- 结题年份:2022
- 批准年份:2019
- 项目状态:已结题
- 起止时间:2020-01-01 至2022-12-31
- 项目参与者:--
- 关键词:
项目摘要
With the development of high-performance computing and big data storage technology, ultra-high dimensional data analysis has attracted tremendous interests from both researchers and practitioners, because of its appearance in many real applications, including social and economic sciences. Variable selection aims to correctly identify the truly informative variables in the ultra-high dimensional data, overcome the difficulties encountered in classical statistical methods, and significantly improve the estimation and prediction accuracy. Thus, the objective of this research proposal is to provide a novel variable selection method by taking full use of the nice properties in reproducing kernel Hilbert space (RKHS), such as derivative reproducing property, representer theorem, as well as the kernel ridge regression in RKHS. Its key advantage is that it assumes no explicit model assumption, admits general predictor effects, allows for scalable computation, and attains desirable asymptotic theoretical results. Tighter theoretical results are provided for squared loss function with some extra operators in functional analysis, and a linear case is studied as a special case of our method to provide some better understanding both methodologically and theoretically. Furthermore, we extend the proposed method to interaction selection, which has attracted tremendous interest in recent years. The applicant’s solid theoretical foundation,rich research experience and preliminary exploratory research will lead the project into the right direction for its successful completion, which will make some substantial contributions to the research on variable selection, and provide a novel idea for efficiently solving the ultra-high dimensional data.
随着高性能计算与海量数据存储技术的发展,超高维数据越来越多的出现在社会生活以及科学研究等诸多领域,引起了研究者的广泛关注。通过变量选择,可以抓取超高维数据中对统计分析真实有用的变量,克服经典统计学方法所遇到的困难,并且可以显著地提高统计估计与预测的精确性,为更深入的统计分析奠定了基础。本项目拟利用再生核希尔伯特空间中函数所特有的性质,如导数的可再生性等,基于再生核希尔伯特空间的岭回归工具,提出一类具有良好数据与模型适应性、计算高效迅速以及有理论保证的变量选择方法;以平方损失函数为例,借助泛函分析中的算子工具给出更精确的理论结果,并以线性模型等为特例深入研究其性质;将该类方法扩展到目前热门的变量交互效应的选择中。申请者扎实的理论基础,丰富的研究积累以及前期较多的探索性工作,为本项目的顺利完成奠定坚实的基础,其最终研究成果将进一步丰富变量选择方法,为有效处理超高维数据提供一个新颖的思路。
结项摘要
随着高性能计算与海量数据存储技术的发展,超高维数据越来越多的出现在社会生活以及 科学研究等诸多领域,引起了研究者的广泛关注。本项目拟利用再生核希尔伯特空间中函数所特 有的性质,如导数的可再生性等,基于再生核希尔伯特空间的岭回归工具,提出一类具有良好 数据与模型适应性、计算高效迅速以及有理论保证的变量选择方法;以平方损失函数为例,借 助泛函分析中的算子工具给出更精确的理论结果,并以线性模型等为特例深入研究其性质;将 该类方法扩展到目前热门的变量交互效应的选择,网络数据分析以及有向无环图的还原估计中。申请者扎实的理论基础,丰富的研究积累 以及前期较多的探索性工作,为本项目的顺利完成奠定坚实的基础,其最终研究成果将进一步丰富相关领域的研究。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Learning linear non-Gaussian directed acyclic graph with diverging number of nodes
学习具有不同节点数的线性非高斯有向无环图
- DOI:--
- 发表时间:2022
- 期刊:Journal of Machine Learning Research
- 影响因子:6
- 作者:Zhao Ruixuan;HE Xin;Wang Junhui
- 通讯作者:Wang Junhui
Variable selection for classification with derivative-induced regularization
通过导数诱导正则化进行分类的变量选择
- DOI:10.5705/ss.202018.0086
- 发表时间:2020
- 期刊:Statistica Sinica
- 影响因子:1.4
- 作者:Xin He;Shaogao Lv;Junhui Wang
- 通讯作者:Junhui Wang
Learning sparse conditional distribution: An efficient kernel-based approach
学习稀疏条件分布:一种高效的基于内核的方法
- DOI:10.1214/21-ejs1824
- 发表时间:2021
- 期刊:Electronic Journal of Statistics
- 影响因子:1.1
- 作者:Fang Chen;Xin He;Junhui Wang
- 通讯作者:Junhui Wang
Efficient kernel-based variable selection with sparsistency
具有稀疏性的高效基于内核的变量选择
- DOI:10.5705/ss.202019.0401
- 发表时间:2021
- 期刊:Statistica Sinica
- 影响因子:1.4
- 作者:Xin He;Junhui Wang;Shaogao Lv
- 通讯作者:Shaogao Lv
Directed Community Detection With Network Embedding
通过网络嵌入进行定向社区检测
- DOI:10.1080/01621459.2021.1887742
- 发表时间:2022
- 期刊:Journal of the American Statistical Association
- 影响因子:3.7
- 作者:Jingnan Zhang;Xin He;Junhui Wang
- 通讯作者:Junhui Wang
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}