Estimating Parameters in Spike-convolution Models and Mixture Models
估计尖峰卷积模型和混合模型中的参数
基本信息
- 批准号:9971698
- 负责人:
- 金额:$ 7.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:1999
- 资助国家:美国
- 起止时间:1999-06-15 至 2002-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
9971698This research links the parametric deconvolution problem in the spike-convolution model with the estimation problem in finite mixture models. It aims to weave together good results on algorithms and asymptotics from both sides, and develop new methodologies, which are implementable in computation and efficient in theory. The first object of this research, the spike-convolution model, is introduced as part of the models proposed for DNA sequencing by the PI and his collaborators. The current sequencing scheme named after Sanger combines three techniques: enzymatic reactions, gel or capillary electrophoresis and fluorescence-based detection. This biochemical procedure produces a four-component vector time series for each DNA fragment. The task of DNA base-calling is to recover the underlying DNA sequence from the above time series. Most of the base-calling errors are caused by the diffusion effect of electrophoresis. It is found that this diffusion effect can be well described by the so-called spike-convolution model. It arises when a sparse Dirac spike train is convolved with a fixed point spread function, and additive noise or measurement error is superimposed. In this model, deconvolution is nothing but a standard parameter estimation problem, where the parameters include the number, locations and heights of the underlying spikes, the baseline and the measurement error variance. The second object of this research, the finite mixture model, is the framework of many statistical analyses like robustness checking, clustering, estimating density functions, etc. However, the estimation of the parameters in mixture models can be very troublesome, especially when many components are involved. It is believed that a broad class of finite mixture models is closely related to the spike-convolution model. No simple solution exists to the estimation problems in these two models because of the complexity. This research proposes to combine the method of trigonometric moments with a two-stage model selection procedure, Gauss-Newton algorithm, or EM algorithm depending on the situations. The numerical and statistical aspects of the new methods and their variants are examined and compared with those of existing methods. The Toeplitz forms constructed from trigonometric moments and their statistical properties play a key role in the proposed methods, and are investigated in full detail.This research studies the newly proposed spike-convolution model and the long-standing finite mixture models from a unified perspective. The former is motivated by the large scale and high throughput DNA sequencing, which is one of the most important aspects of the ongoing Human Genome Project and other genome projects. The lack of satisfactory deconvolution techniques and statistical models has made DNA base-calling---the data analysis part of sequencing---a bottle neck of these projects. An effective deconvolution technique, a target of this research, is a fundamental prerequisite for rapid and reliable DNA base-calling. In fact, similar deconvolution problems arise in many other scientific disciplines like geophysics, spectroscopy, and chromatography. The research results are also expected to enrich the understanding and methodologies of finite mixture models, which have applications to a diversity of fields such as physics, medicine, and biology.
9971698这项研究将尖峰 - 卷积模型中的参数反卷积问题与有限混合模型中的估计问题联系起来。 它的目的是将双方的算法和渐近学算法结合在一起,并开发新方法,这些方法在计算中是可以实现的,并且在理论上有效。 这项研究的第一个对象是Spike-Convolution模型,是PI及其合作者为DNA测序提出的模型的一部分。 当前的测序方案以Sanger命名,结合了三种技术:酶促反应,凝胶或毛细管电泳和基于荧光的检测。 该生化程序为每个DNA片段产生一个四分量矢量时间序列。 DNA基呼叫的任务是从上述时间序列中恢复潜在的DNA序列。 大多数基本呼叫误差是由电泳的扩散效应引起的。 发现这种扩散效应可以通过所谓的尖峰 - 卷积模型很好地描述。 当稀疏的Dirac Spike Train用固定点扩散功能卷曲时,会产生它,并叠加添加噪声或测量误差。 在此模型中,反卷积不过是一个标准参数估计问题,其中参数包括基线尖峰的数字,位置和高度,基线和测量误差方差。 这项研究的第二个对象是有限的混合模型,是许多统计分析的框架,例如鲁棒性检查,聚类,估计密度功能等。但是,混合模型中参数的估计可能非常麻烦,尤其是当许多组件时参与。 据认为,广泛的有限混合模型与尖峰 - 横线模型密切相关。 由于复杂性,这两个模型中没有简单的解决方案。 这项研究建议将三角矩的方法与两阶段模型选择程序,高斯 - 纽顿算法或EM算法相结合,具体取决于情况。 研究了新方法及其变体的数值和统计方面,并将其与现有方法的数字方面进行了比较。 由三角学矩及其统计特性构成的Toeplitz形式在提议的方法中起着关键作用,并进行了全面研究。这项研究从统一的角度来看,新提出的Spike-Convolution模型和长期有限的混合模型。 前者是由大规模和高吞吐量DNA测序的动机,这是正在进行的人类基因组项目和其他基因组项目的最重要方面之一。 缺乏令人满意的反卷积技术和统计模型使DNA基底话 - - 测序的数据分析部分 - 这些项目的瓶颈。 这项研究的一种有效的反向卷积技术是快速可靠的DNA基呼叫的基本先决条件。 实际上,在许多其他科学学科(例如地球物理,光谱和色谱法)等许多其他科学学科中也出现了类似的反向卷积问题。 预计研究结果还将丰富对有限混合模型的理解和方法,这些模型对物理,医学和生物学等各种领域都有应用。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Lei Li其他文献
Optimal model predictive control for path tracking of autonomous vehicle
- DOI:
10.1109/icmtma.2011.481 - 发表时间:
2011-01-01 - 期刊:
- 影响因子:0
- 作者:
Lei Li;Zhurong Jia;Xinchun Jia - 通讯作者:
Xinchun Jia
Fair-Weather Near-Surface Atmospheric Electric Field Measurements at the Zhongshan Chinese Station in Antarctica
中国南极中山站晴天近地表大气电场测量
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Lei Li;Tao Chen;Shuo Ti;Shi;Jiaying Song;Chunting Cai;Yong;W. Li;Jing Luo - 通讯作者:
Jing Luo
Determining degradation and synthesis rates of Arabidopsis proteins using the kinetics of
使用动力学确定拟南芥蛋白质的降解和合成率
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Lei Li;Clark J. Nelson;Cory Solheim;James Whelan;A. Millar;S. Highway - 通讯作者:
S. Highway
Identification of Elymus (Triticeae, Poaceae) and its related genera genomes by RFLP analysis of PCR-amplified Adh genes
通过 PCR 扩增的 Adh 基因的 RFLP 分析鉴定披碱草(小麦科、禾本科)及其相关属基因组
- DOI:
10.1007/s11033-009-9909-4 - 发表时间:
2010-10 - 期刊:
- 影响因子:2.8
- 作者:
QuanLan Liu;NingNing Zhang;Lei Li;Jie Liu - 通讯作者:
Jie Liu
Block matching sparsity regularization-based image reconstruction for incomplete projection data in computed tomography
计算机断层扫描中不完整投影数据的基于块匹配稀疏正则化的图像重建
- DOI:
10.1088/1361-6560/aa9e63 - 发表时间:
2018-02 - 期刊:
- 影响因子:3.5
- 作者:
Ailong Cai;Lei Li;Zhizhong Zheng;Hanming Zhang;Linyuan Wang;Guoen Hu;Bin Yan - 通讯作者:
Bin Yan
Lei Li的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Lei Li', 18)}}的其他基金
PFI-TT: Novel ionic liquid lubricant for next-generation information storage technology
PFI-TT:用于下一代信息存储技术的新型离子液体润滑剂
- 批准号:
2329767 - 财政年份:2023
- 资助金额:
$ 7.99万 - 项目类别:
Continuing Grant
Conference: Funding Proposal for 2022 AAAI Doctoral Consortium
会议:2022年AAAI博士联盟资助提案
- 批准号:
2219627 - 财政年份:2022
- 资助金额:
$ 7.99万 - 项目类别:
Standard Grant
FMSG: Shape-programmable elastic-plastic tubes as building blocks for origami
FMSG:形状可编程的弹塑管作为折纸的构建块
- 批准号:
2036164 - 财政年份:2021
- 资助金额:
$ 7.99万 - 项目类别:
Standard Grant
Water wettability of floating graphene: Mechanism and Application
漂浮石墨烯的水润湿性:机理与应用
- 批准号:
2028826 - 财政年份:2020
- 资助金额:
$ 7.99万 - 项目类别:
Standard Grant
Collaborative Research: Micromechanics of Meniscus-bound Particle Clusters
合作研究:弯月面束缚粒子簇的微观力学
- 批准号:
2031144 - 财政年份:2020
- 资助金额:
$ 7.99万 - 项目类别:
Standard Grant
Collaborative Research: Structure and Thermodynamics of Ionic Liquids at Solid Surfaces: the Return of Water
合作研究:固体表面离子液体的结构和热力学:水的返回
- 批准号:
1904486 - 财政年份:2019
- 资助金额:
$ 7.99万 - 项目类别:
Standard Grant
CAREER: Mechanistic studies of the spore photoproduct lyase
职业:孢子光产物裂合酶的机理研究
- 批准号:
1454184 - 财政年份:2015
- 资助金额:
$ 7.99万 - 项目类别:
Continuing Grant
A Multiphase Printing Process for Freeform Optics Manufacturing
自由曲面光学制造的多阶段打印工艺
- 批准号:
1538439 - 财政年份:2015
- 资助金额:
$ 7.99万 - 项目类别:
Standard Grant
Understanding the Mechanism of Simultaneous Oleophobic/Hydrophilic Behavior: When a Nanometer-Thick Polymer Coating meets a Solid Surface
了解同时疏油/亲水行为的机制:当纳米厚的聚合物涂层遇到固体表面时
- 批准号:
1233161 - 财政年份:2012
- 资助金额:
$ 7.99万 - 项目类别:
Standard Grant
Role of microRNA-related Polymorphisms in Regulating Heterotic Gene Expression
microRNA相关多态性在调节杂种基因表达中的作用
- 批准号:
0922526 - 财政年份:2009
- 资助金额:
$ 7.99万 - 项目类别:
Standard Grant
相似国自然基金
基于走航观测的南极海域夏季湍流热通量特征及参数化研究
- 批准号:42305078
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
城市轨道交通既有减振线路轨道参数识别及组合减振研究
- 批准号:52372328
- 批准年份:2023
- 资助金额:54 万元
- 项目类别:面上项目
脉冲抛物型和双曲型分布参数系统的滑模控制研究
- 批准号:62373119
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于磁-热场映射参数解耦辨识的永磁体健康状态监测方法研究
- 批准号:52307048
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于稀疏空时频表示的低轨导航多径信号参数估计
- 批准号:62303482
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
A Principled Framework for Explaining, Choosing and Negotiating Privacy Parameters of Differential Privacy
解释、选择和协商差异隐私的隐私参数的原则框架
- 批准号:
23K24851 - 财政年份:2024
- 资助金额:
$ 7.99万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Determining the geomagnetic and heliophysical parameters that control increases and decreases in Earth's outer radiation belt
确定控制地球外辐射带增减的地磁和太阳物理参数
- 批准号:
2903408 - 财政年份:2024
- 资助金额:
$ 7.99万 - 项目类别:
Studentship
リーキーパイプラインにおける少数派の参画プロセスの解明
阐明少数参与泄漏管道的过程
- 批准号:
24K06484 - 财政年份:2024
- 资助金额:
$ 7.99万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
公平な数学の小集団活動の実現に向けて-参加者のポジションに着目して-
为实现公平的数学小组活动——关注参与者的立场——
- 批准号:
24H02393 - 财政年份:2024
- 资助金额:
$ 7.99万 - 项目类别:
Grant-in-Aid for Encouragement of Scientists
経営体数減少下で増加する日本農業の海外進出・参入を解明する新たな戦略理論の構築
建立新的战略理论来阐明随着管理实体数量的减少,日本农业不断增加的海外扩张和进入
- 批准号:
23K23718 - 财政年份:2024
- 资助金额:
$ 7.99万 - 项目类别:
Grant-in-Aid for Scientific Research (B)