超高维数据统计推断

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    11731011
  • 项目类别:
    重点项目
  • 资助金额:
    250.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    A0402.统计推断与统计计算
  • 结题年份:
    2022
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2022-12-31

项目摘要

With the development of computer and network information technology, high-dimensional data are increasingly emerged in biomedical and medical health. Unlike the traditional data, high-dimensional data have the following new features: the diversity of the data, the sparsity of the useful information, the dependency of the data and missingness of the data, which shows that the traditional statistical analysis methods can not be used to deal with these challenges. Hence, it is a pressing need to develop novel statistical methods to make statistical inference on high-dimensional data. Although there are some effective methods to analyze high-dimensional data with some features, they are far from meeting the increasing requirement. This project aims to develop some novel approaches to make statistical inference on high-dimensional data with some new features such as dependence, missing and unknown distributions, and establish their theories; and propose some novel approaches to model-free variable screen, new clinical design study, hypothesis test, subgroup analysis and interval censored data analysis.
随着计算机和网络信息技术的发展,在生物医学和医疗健康等领域涌现出大量的高维数据。与传统数据不同,高维数据具有类型多样、有用信息稀疏、数据相依以及缺失等新特征,致使经典的统计推断方法在分析这些数据时遇到了瓶颈。因此,针对高维数据的这些新特征发展新的统计推断方法是统计学目前迫切需要解决的关键问题。尽管针对高维数据的某些特征已发展了一些有效方法,但现有的统计推断方法远远不能满足现实发展需要。鉴于此,本项目拟针对高维数据的一些新特征如:相依、缺失、分布未知等,发展一些新的统计推断方法并建立其理论,进而研究它们在不依赖于模型假设的变量筛选、新型临床试验设计方法研究、假设检验、亚组分析、区间删失数据分析等中的应用。

结项摘要

对医疗健康大数据的有效收集和挖掘,可为患者提供精准的个体化诊断和治疗方案。与传统数据不同,医疗健康大数据具有维数高、数据量大但信息稀疏、类型多样且结构复杂、数据相依以及缺失等新特征。尽管针对此类数据的某些特征已发展了一些有效的统计推断方法,但现有的统计推断方法远远不能满足现实发展需要。因此,本项目针对生物医学、遗传学、临床试验以及医疗健康等领域出现的大数据发展新的统计推断方法具有十分重要的理论和现实意义。.本项目的主要研究内容包括:在高维数据框架下提出了广义的多组平衡重要协变量的自适应随机化临床试验设计新方案以及筛选生物标记物的新方法,在超高维数据框架下发展了协变量选择自适应设计方案及其渐近马氏链的理论,在自适应设计下建立了检验有关处理效应假设的理论框架以及基于海量流数据的聚类自适应Network数据A/B检验过程,在超高维缺失数据情况下提出了可适用于两个试验组的连续型协变量自适应临床设计方案,针对超高维复杂相依数据发展了一系列亚组分析新方法并建立了其理论和算法,针对超高维数据提出了一系列不假设数据模型的特征筛选方法以及拟合优度检验方法,针对超高维协变量的区间删失数据模型基于广义估计方程发展了有效的统计推断理论等。在国内外重要学术刊物,如:《JASA》、《AoS》、《JRSSB》、《JoE》、《JBES》、《JMLR》等上发表学术论文91篇;在科学出版社出版专著2部,在国际出版社Intechopen主编出版学术论文集3部;获计算机软件著作权3项。获云南省自然科学二等奖1项。.项目执行期间,组织或承办国内国际学术会议9次;项目组成员中,1人当选IMS Fellow,1人获“国家杰出青年科学基金”,1人晋升副教授,1人获“云南省最美科技工作者”称号,1人获ICSA 杰出服务奖,1人获“云南省中青年学术和技术带头人”称号。培养出站博士后8人,毕业博士研究生18人、硕士研究生39人, 其中1名博士生的博士学位论文获云南省优秀博士学位论文。

项目成果

期刊论文数量(90)
专著数量(5)
科研奖励数量(1)
会议论文数量(0)
专利数量(0)
Diagnosis of thyroid nodules for ultrasonographic characteristics indicative of malignancy using random forest
使用随机森林诊断甲状腺结节的超声特征提示恶性肿瘤
  • DOI:
    10.1186/s13040-020-00223-w
  • 发表时间:
    2020-09-03
  • 期刊:
    BIODATA MINING
  • 影响因子:
    4.5
  • 作者:
    Chen,Dan;Hu,Jun;Feng,Yuran
  • 通讯作者:
    Feng,Yuran
Bayesian Joint Modeling of Multivariate Longitudinal and Survival Data With an Application to Diabetes Study.
多变量纵向和生存数据的贝叶斯联合建模及其在糖尿病研究中的应用
  • DOI:
    10.3389/fdata.2022.812725
  • 发表时间:
    2022
  • 期刊:
    FRONTIERS IN BIG DATA
  • 影响因子:
    3.1
  • 作者:
    Huang, Yangxin;Chen, Jiaqing;Xu, Lan;Tang, Nian-Sheng
  • 通讯作者:
    Tang, Nian-Sheng
Single-index Thresholding in Quantile Regression
分位数回归中的单指标阈值
  • DOI:
    10.1080/01621459.2021.1915319
  • 发表时间:
    2021-04
  • 期刊:
    Journal of the American Statistical Association
  • 影响因子:
    3.7
  • 作者:
    Yingying Zhang;Huixia Judy Wang;Zhongyi Zhu
  • 通讯作者:
    Zhongyi Zhu
Sufficient dimension reduction and instrument search for data with nonignorable nonresponse
对具有不可忽略的无响应的数据进行充分的降维和仪器搜索
  • DOI:
    10.3150/20-bej1260
  • 发表时间:
    2021-03
  • 期刊:
    BERNOULLI
  • 影响因子:
    1.5
  • 作者:
    Zhao Puying;Wang Lei;Shaw Jun
  • 通讯作者:
    Shaw Jun
Empirical likelihood inference for longitudinal data with covariate measurement errors: An application to the LEAN study
具有协变量测量误差的纵向数据的经验似然推断:精益研究的应用
  • DOI:
    10.1016/j.csda.2022.107553
  • 发表时间:
    2021-10
  • 期刊:
    Computational Statistics & Data Analysis
  • 影响因子:
    1.8
  • 作者:
    Yuexia Zhang;Guoyou Qin;Zhongyi Zhu;Jiajia Zhang
  • 通讯作者:
    Jiajia Zhang

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

非线性再生散度随机效应模型的渐近性质
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    数学物理学报A辑
  • 影响因子:
    --
  • 作者:
    唐年胜;夏天;王学仁;张文专
  • 通讯作者:
    张文专
变窗宽局部线性回归中的M-估计
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    云南大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    蒋学军;唐年胜;夏天
  • 通讯作者:
    夏天
Bayesian Analysis for Mixture of Latent Variable Hidden Markov Models with Multivariate Longitudinal data
潜变量隐马尔可夫模型与多元纵向数据混合的贝叶斯分析
  • DOI:
    10.1016/j.csda.2018.08.004
  • 发表时间:
    --
  • 期刊:
    Computational Statistics and Data Analysis
  • 影响因子:
    1.8
  • 作者:
    夏业茂;唐年胜
  • 通讯作者:
    唐年胜
Estimation and variable selection in generalized partially nonlinear models with nonignorable missing responses
具有不可忽略的缺失响应的广义部分非线性模型中的估计和变量选择
  • DOI:
    10.4310/sii.2018.v11.n1.a1
  • 发表时间:
    2018
  • 期刊:
    Statistics and Its Interface
  • 影响因子:
    0.8
  • 作者:
    唐年胜;唐琳
  • 通讯作者:
    唐琳
含不可忽略缺失数据非线性再生散度模型参数的Bayes估计
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    生物数学学报
  • 影响因子:
    --
  • 作者:
    和燕;彭燕梅;唐年胜
  • 通讯作者:
    唐年胜

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

唐年胜的其他基金

分布式张量回归的变分推断
  • 批准号:
    12271472
  • 批准年份:
    2022
  • 资助金额:
    46 万元
  • 项目类别:
    面上项目
高维缺失数据半监督支持向量机研究
  • 批准号:
    12126362
  • 批准年份:
    2021
  • 资助金额:
    20.0 万元
  • 项目类别:
    数学天元基金项目
数学学科2021-2035年中长期发展规划及“十四五”发展规划战略研究
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    10 万元
  • 项目类别:
    专项基金项目
国际贝叶斯分析学会2020年世界大会
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    20 万元
  • 项目类别:
2018年统计学研究生暑期学校
  • 批准号:
    11826027
  • 批准年份:
    2018
  • 资助金额:
    60.0 万元
  • 项目类别:
    数学天元基金项目
2017年全国统计学研究生暑期学校
  • 批准号:
    11726024
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    数学天元基金项目
删失数据超高维共线性模型的变量选择
  • 批准号:
    11726615
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    数学天元基金项目
2016年统计学研究生暑期学校
  • 批准号:
    11626020
  • 批准年份:
    2016
  • 资助金额:
    68.0 万元
  • 项目类别:
    数学天元基金项目
不可忽略缺失数据模型的统计推断方法研究
  • 批准号:
    11671349
  • 批准年份:
    2016
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目
2015年西部地区统计学青年教师暑期培训
  • 批准号:
    11526027
  • 批准年份:
    2015
  • 资助金额:
    75.0 万元
  • 项目类别:
    数学天元基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码