de bruijnグラフを用いたロングリード用ゲノムアセンブラの開発
使用 de bruijn 图开发长读长基因组组装器
基本信息
- 批准号:22H02598
- 负责人:
- 金额:$ 11.07万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本年度は期初に立てた予定に従い、以下の3点を主に実施した。(1) まず、本研究課題の鍵となる精度の高いリードデータを入力とする、de bruijnグラフアルゴリズムを用いたcontigグラフおよびバブル構造の接合点となるbranchグラフの構築アルゴリズ開発を実施した。この機能は、すでにPlatanus-alleeアセンブラで実装されているアルゴリズムをもとに、今後HiFiリードを入力とできるようにサイズの大きなk-merに対応できるよう、内部構造を全面的に作り替えることで実現した。(2) Longread、Hi-Cデータを用いたcontig, branchグラフのscaffolding, phasing機能の開発を実施した。(1)で得られたグラフに対し、Longread,Hi-Cデータをマッピング、アライメントを行い、そのスコアを用いてcontig, branchグラフの架橋を構築する。この機能自体はPlatanus-alleeにも存在したが、Platanus-alleeではIllumina PE, MPをメインに取り扱っていたためLongreadはあくまでも補助的な位置付けであった。そこでエラー率の比較的高いLongreadを用いて精度高くscaffoldingするためのベンチマークテストなどを多くのケースで実施し、精度向上や今まで無視されてきたrepeat配列を介したグラフ構造の解決アルゴリズムなどの組み込みを実施した。同時にphasing機能の実装も開始した。(3) 上記機能開発におけるベンチマークのための実シークエンスデータの取得を実施した。ゲノムサイズ、ヘテロ接合性、Hi-Cデータの取得しやすさなどを考慮し、魚、植物サンプルを中心にPacBio(CLR, HiFi)、Illumina PE, Hi-Cデータの取得を実施し、ベンチマークに活用した。
今年,根据定于财政年度开始的时间表,我们主要实施了以下三分。 (1)首先,我们开发了一种算法来构建一个分支图,该算法使用de bruijn图算法在重叠群图和气泡结构之间用作接线点,该算法使用了高度准确的读取数据,这是该研究主题的关键。通过完全重塑内部结构以容纳大型K-MER,以便将来可以根据已在Platanus-Allee汇编器中实现的算法来实现此功能。 (2)我们使用LongRead和Hi-C数据为重叠群和分支图开发了脚手架和相位函数。长阅读和HI-C数据与在(1)中获得的图进行映射并对齐,分数用于构造重叠群和分支图的交联。该功能本身存在于Platanus-Allee中,但Platanus-Allee主要处理Illumina PE和MP,因此LongRead只是一个补充位置。因此,我们已经使用LongRead进行了基准测试以准确地脚手架,而LongRead在许多情况下具有相对较高的错误率,并结合了算法,例如通过重复阵列提高准确性和解析图形结构,这些阵列一直被忽略到现在为止。同时,也已经开始实施相集函数。 (3)在上述功能开发中获取实际序列数据以进行基准测试。考虑到HI-C数据的基因组大小,杂合性和易于获取的易用性,我们收购了PACBIO(CLR,HIFI),Illumina PE和HI-C数据,主要来自鱼类和植物样品,并将其用作基准。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
伊藤 武彦其他文献
様々なゲノム解析から見えてきたゲノムの不均一な多様性とその意義
通过各种基因组分析揭示的基因组多样性不均匀及其意义
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Iguchi;Y.;& Kobayashi;K.;伊藤 武彦 - 通讯作者:
伊藤 武彦
イトマキヒトデのモデル生物化に向けて~イトマキヒトデのゲノム構築~
将日本海星转变为模式生物 - 日本海星的基因组构建 -
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
伊藤 武彦;梶谷 嶺;奥野 未来;田中 裕之;豊田 敦;立花 和則;岸本 健雄 - 通讯作者:
岸本 健雄
Disoriented choline metabolism promotes pathologies in the failing heart.
胆碱代谢紊乱会促进衰竭心脏的病变。
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
梶谷 嶺;小椋 義俊;後藤 恭宏;林 哲也;伊藤 武彦;Hirose S;執行正義・Mostafa Abdelrahman・佐藤修正・平川英樹・辻村真衣・寺地徹・豊田敦;清水 逸平 - 通讯作者:
清水 逸平
好アルカリ性放線菌 Nocardiopsis sp. F96 由来 GH ファミリー 18 キチナーゼ ChiF1 および ChiF3 の性質検討
来自嗜碱放线菌诺卡氏菌 F96 的 GH 家族 18 几丁质酶 ChiF1 和 ChiF3 的表征。
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
遠山 絹華;三須 大樹;梶谷 嶺;遠藤 きみ子;深沢 徹也;八波 利恵;伊藤 武彦; 福居 俊昭;中村 聡 - 通讯作者:
中村 聡
TGF-betaにより発現誘導される転写共役因子VGLL3によるEMT制御機構の解析.
转录共激活因子 VGLL3 的 EMT 控制机制分析,其表达受 TGF-β 诱导。
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
田中 良樹;梶谷 嶺;豊田 敦;後藤 友二;久保田 宗一郎;伊藤 武彦;山口憲孝. - 通讯作者:
山口憲孝.
伊藤 武彦的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('伊藤 武彦', 18)}}的其他基金
de bruijnグラフを用いたロングリード用ゲノムアセンブラの開発
使用 de bruijn 图开发长读长基因组组装器
- 批准号:
23K23861 - 财政年份:2024
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Pore-Cデータを活用した多倍体ゲノムアセンブル手法の開発
使用 Pore-C 数据开发多倍体基因组组装方法
- 批准号:
23K18093 - 财政年份:2023
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
異文化接触下における留学生の時間的展望
跨文化接触下国际学生的时间视角
- 批准号:
10871028 - 财政年份:1998
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Exploratory Research
有機溶剤(シンナー等)乱用のモデル動物の作成とその特性に関する研究
有机溶剂(稀释剂等)滥用模型动物的制作及其特性研究
- 批准号:
10770168 - 财政年份:1998
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
日本語と韓国語の複雑な構文の文処理方略とその発達
日语和韩语复杂句法的句子处理策略及其发展
- 批准号:
01710072 - 财政年份:1989
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
実験心理言語学的方法による日本語文法獲得の交差言語的研究
使用实验心理语言学方法进行日语语法习得的跨语言研究
- 批准号:
63710081 - 财政年份:1988
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
交差言語的観点による日本語文理解の獲得過程の実験心理言語学的研究
跨语言学视角下日语句子理解习得过程的实验心理语言学研究
- 批准号:
61710089 - 财政年份:1986
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
de bruijnグラフを用いたロングリード用ゲノムアセンブラの開発
使用 de bruijn 图开发长读长基因组组装器
- 批准号:
23K23861 - 财政年份:2024
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Hi-C法と類似配列カタログによる染色体長ギャップレスゲノムアセンブリ手法の開発
使用 Hi-C 方法和相似序列目录开发染色体长度无间隙基因组组装方法
- 批准号:
22KJ0650 - 财政年份:2023
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Secure and efficient substring searchable symmetric encryption using advanced data structure
使用先进数据结构的安全高效的子串可搜索对称加密
- 批准号:
20K11808 - 财政年份:2020
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of Efficient Methods for Optimizing the Structure of Networked Systems Based on Various Measures
基于多种措施开发优化网络系统结构的有效方法
- 批准号:
15K00035 - 财政年份:2015
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Synthesis and analysis of graph structures for interconnection networks of computers and their applications
计算机互联网络图结构综合分析及其应用
- 批准号:
21500003 - 财政年份:2009
- 资助金额:
$ 11.07万 - 项目类别:
Grant-in-Aid for Scientific Research (C)