With the advances of the measuring instruments and the improvement of data collecting and storage capacity, in many fields of applied sciences, such as chemometrics, biometrics, climate, hydrology, environment etc., we can collect the data at finer and finer resolution. Because these data can be approximated as the curves, the data is regarded as functional data. Over the past decade, a lot of literatures have mainly discussed the univariate functional data analysis, but there are very little literatures abour the multivariate functional data. However, in practical applications, the functionaldata that we deal with is multivariate, such as spatial data. Thus, our project is committed to analyse multivariate functional data. The main contents are as follows: (1) Study the estimated problem of the spatial functional linear model under the discrete observations with measurement error; (2) Propose a new multivariate functional linear model-local spatial function linear model and study the estimation method; (3) Extend the univariate functional nonparametric model to multivariate case; (4) Establish a spatial functional logistic regression model, and use this model to analyse the hydrological data and to assess the risk of the flood and drought disasters.
随着测量工具的进步、数据收集和存储能力的提升,在许多应用领域,如化学计量学、生物计量学、气候、水文、环境等,我们能在越来越精细的分辨率下收集数据。由于这些数据可以近似视为曲线而被称为函数型数据。近十年来,大量的文献主要对一元函数型数据进行了统计分析,而关于多元函数型数据的讨论非常少。然而,在实际应用中,我们会遇到许多多元的情况,如空间数据。因而本项目致力于对多元函数型数据进行统计建模。主要研究内容为:(1)在带度量误差的离散观测下,研究空间线性模型的估计问题;(2)提出一个新的多元函数线性模型-局部空间函数线性模型并研究其估计方法;(3)将一元的函数型非参数模型推广到多元的情况;(4)建立空间函数型Logistic回归模型,并将该模型用于水文数据中,建立洪涝干旱灾害的风险评估模型。
近年来,随着测量技术的进步,函数型数据分析成为统计的一个前沿热点问题。本项目主要围绕多元函数型数据研究了:(1)多元函数型数据的统计建模;(2)半参数函数型数据回归模型的推广问题;(3)函数型数据回归模型的稳健估计问题;(4)函数型数据回归模型的缺失和相依扰动问题。取得的研究成果如下:(1)发现了如果真实的斜率函数非常光滑,样条和惩罚样条方法要优于函数型主成分方法,同时惩罚样条方法更具一定的稳健性,而如果斜率函数能够表示成一些特征函数的组合时,函数型主成分方法要优于样条方法;(2)将部分函数型线性模型推广到变系数和广义回归模型下,并基于样条方法获得了估计的收敛速度,其中广义模型能够用于对一些实际数据(如食品分析数据)进行判别分析;(3)针对函数型回归模型估计中常用的降维方法,提出了一个更稳健方法—函数型切片逆回归方法,该方法适用于函数型数据中有异常值的问题,同时部分函数型线性模型提出了稳健的M估计方法,并获得了估计的大样本性质;(4)针对多元函数型数据的半参数模型的均值估计,提出了回归插补和逆概率加权两种估计方法,并研究了大样本性质,发现由于无穷维参数的问题,均值估计的收敛速度达不到一般的参数速度。针对带有相依误差干扰的多元函数型线性模型,提出了广义最小二乘估计,并得到了估计的相合性和渐近正态性质。 . 本项目发表论文8 篇,其中SCI期刊论文 6篇,且有2篇正在整理待发表。参加国内外学术会议5次以上,协助培养博士生1名, 指导毕业硕士生3名。.