面向大数据的统计分布式计算及隐私保护的理论与方法
项目介绍
AI项目解读
基本信息
- 批准号:92046005
- 项目类别:重大研究计划
- 资助金额:20.0万
- 负责人:
- 依托单位:
- 学科分类:G0105.管理统计理论与方法
- 结题年份:2021
- 批准年份:2020
- 项目状态:已结题
- 起止时间:2021-01-01 至2021-12-31
- 项目参与者:李超君; 明静思; 彭梦姣; 郁淼淼; 李子洋; 赵志嵩; 张鸿飞; 苏瑾;
- 关键词:
项目摘要
In the big data era, the research focuses on the frontiers of distributed computing that solves the basic problems in management and decision-making, which are effectively applicable in the analysis and modeling of large-scale data set scenarios. More specifically, we develop the communication-efficient and non-iterative distributed algorithm for non-smooth loss function and complex loss function of U-type statistics, respectively. At the same time, the properties of parameter estimation under communication-efficient distributed computing are given, so that the method has good interpretability in the applications and can carry out effective statistical inference. Finally, we discuss the data security issues that are of great concern in big data analysis based on the distributed algorithm and propose the scientific and reasonable data privacy protection technologies to achieve the balance between the requirements of data privacy and the efficiency of the computing and inference. The above methods will be widely applied in the areas of management, finance, biomedicine, and high-precision industries to provide guidance for management.
本项目聚焦于分布式计算的前沿探索,是一项解决大数据管理决策问题的基础性研究。首先对于非光滑损失函数以及U统计量类型的损失函数设计非迭代且高效通讯的分布式算法,使得提出的方法可以有效地应用于大规模数据集场景的分析与建模。同时给出算法中参数估计的统计性质,以使方法在实际应用中具有良好的解释性,并能进行有效的统计推断。最后基于大数据分布式算法,围绕大数据分析中备受关注的数据安全问题开展讨论,提出科学合理的隐私保护技术与方法,最终达到使以上研究的分布式计算方法既能满足数据安全要求,又不破坏原有的数据通讯以及统计推断效率的目的,并将其应用到管理、金融、生物医学、高精密行业的实际场景,为管理决策提供咨询建议和指导。
结项摘要
本项目聚焦于分布式计算以及数据隐私保护的前沿探索,是一项解决大数据管理决策问题的基础性研究,取得了如下的创新研究成果:(1)在分布式算法中,针对梯度不一定存在的非光滑目标函数,项目组提出用基于等度连续性的次梯度取代梯度信息的方法,以及用局部光滑函数近似的方法,来保证高效通信算法的可行性;(2)为克服不可必免的数据污染,以及对抗潜在数据攻击的威胁,项目组认为提出在分布式算法中针对传输整合梯度信息的关键步骤,运用MOM估计克服不良数据对梯度信息造成的影响;(3)为了有效利用外部总结性辅助信息,项目组提出加强的经验似然方法、增广广义估计方程方法、相乘似然函数与置信密度方法等框架来有效整合部分个体数据与外部总结性辅助信息结果,并在大数据情形下进一步考虑各辅助信息整合框架的通讯有效的迭代算法等分布式统计推断方法;(4)针对分布式算法数据传递过程中可能存在的隐私泄露问题,项目组提出基于扰动的梯度信息以及扰动的初始值构造的通讯有效算法,达到既能进行有效的统计推断,又能保证数据安全的目的。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Semiparametric additive frailty hazard model for clustered failure time data
集群故障时间数据的半参数加性脆弱危险模型
- DOI:10.1002/cjs.11647
- 发表时间:2020-10
- 期刊:Canadian Journal of Statistics
- 影响因子:--
- 作者:Peng LIU;Shanshan SONG;Yong Zhou
- 通讯作者:Yong Zhou
Linear expectile regression under massive data
海量数据下的线性期望回归
- DOI:10.1016/j.fmre.2021.08.012
- 发表时间:2021-09
- 期刊:Fundamental Research
- 影响因子:6.2
- 作者:Shanshan Song;Yuanyuan Lin;Yong Zhou
- 通讯作者:Yong Zhou
Correlation-based joint feature screening for semi-competing risks outcomes with application to breast cancer data
基于相关性的联合特征筛选半竞争风险结果并应用于乳腺癌数据
- DOI:10.1177/09622802211037071
- 发表时间:2021-09
- 期刊:Statistical Methods in Medical Research
- 影响因子:2.3
- 作者:Mengjiao Peng;Liming Xiang
- 通讯作者:Liming Xiang
一般偏差数据下剩余寿命分位数回归
- DOI:--
- 发表时间:--
- 期刊:数学学报
- 影响因子:--
- 作者:孙桂萍;赵目;周勇
- 通讯作者:周勇
Self-starting process monitoring based on transfer learning. Journal of Quality Technology
基于迁移学习的自启动过程监控。
- DOI:--
- 发表时间:--
- 期刊:Journal of Quality Technology
- 影响因子:2.5
- 作者:Zhijun Wang;Chunjie Wu;Miaomiao Yu;Fugee Tsung
- 通讯作者:Fugee Tsung
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
水稻粒宽基因 GS5的功能标记开发和单倍型鉴定
- DOI:10.16819/j.1001-7216.2016.6038
- 发表时间:2016
- 期刊:中国水稻科学
- 影响因子:--
- 作者:裔传灯;王德荣;蒋伟;李玮;成晓俊;王颖;周勇;梁国华;顾铭洪
- 通讯作者:顾铭洪
水稻粒形基因GS3的功能标记开发与鉴定
- DOI:10.15889/j.issn.1002-1302.2016.12.016
- 发表时间:2016
- 期刊:江苏农业科学
- 影响因子:--
- 作者:裔传灯;李玮;王德荣;蒋伟;王颖;周勇;梁国华;顾铭洪
- 通讯作者:顾铭洪
不同水灰比混凝土自干燥试验
- DOI:10.3880/j.issn.1006-7647.2018.05.012
- 发表时间:2018
- 期刊:水利水电科技进展
- 影响因子:--
- 作者:黄耀英;蔡忍;刘钰;肖磊;周勇
- 通讯作者:周勇
深基坑桩锚支护结构和土体之间协同作用
- DOI:10.16285/j.rsm.2016.2524
- 发表时间:2018
- 期刊:岩土力学
- 影响因子:--
- 作者:周勇;朱亚薇
- 通讯作者:朱亚薇
超细粉颗粒在内循环流化床中的流化特性
- DOI:--
- 发表时间:2015
- 期刊:化学工程与装备
- 影响因子:--
- 作者:张国杰;皮立强;杨兴灿;周勇
- 通讯作者:周勇
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
周勇的其他基金
经济管理中复杂数据和复杂行为的分析方法及其应用
- 批准号:71931004
- 批准年份:2019
- 资助金额:230 万元
- 项目类别:重点项目
金融大数据统计学习理论与方法及在互联网金融中的应用
- 批准号:91546202
- 批准年份:2015
- 资助金额:240.0 万元
- 项目类别:重大研究计划
不可压Navier-Stokes方程的定性研究
- 批准号:10501012
- 批准年份:2005
- 资助金额:14.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}