文字列圧縮と組合せ論による大規模データ管理・処理技法の開発
使用字符串压缩和组合学开发大规模数据管理和处理技术
基本信息
- 批准号:18F18120
- 负责人:
- 金额:$ 0.9万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2018
- 资助国家:日本
- 起止时间:2018-10-12 至 2021-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The focus of this research was set on (a) practical and dynamic trie data structures, (b) the computation of the grammar compression Re-Pair in small space, and (c) advancements for the bijective Burrows-Wheeler transform (BBWT), a variant of the Burrows-Wheeler transform (BWT) well received in theory as well as in practice for indexing string data.(a) We have devised a novel approach for compact hashing, which is the most memory-efficient approach in practice when working with a huge number of integer keys of a bounded domain. Based on this approach, we have proposed dynamic trie data structures working with path-decomposition or with trie compaction.(b) Re-Pair, a grammar with high compression ratios, is difficult to compute within limited amount of memory. Here, we could find a quadratic time algorithm computing Re-Pair with almost no additional space. We also devised an index data structure build upon a grammar representing the Lyndon tree. This index exploits several properties of the Lyndon words to improve the running time of the currently fastest grammar index from a quadratic factor on the pattern length to a linear one.(c) Finally, we could build an indexing data structure on top of the BBWT, compute the BBWT in-place or transform the BWT into the BBWT, and finally build the BBWT in linear time.Asides from that, we could find space-efficient factorization algorithms for the non-overlapping LZ77 factorization and the LZ78 substring compression problem. These algorithms work in near-linear time with space asymptotic to the input text length in bits.
这项研究的重点放在(a)实用和动态的TRIE数据结构上,(b)在较小空间中进行语法压缩重新编写的计算,以及(c)在Burrows-wheeler Transform(BWT)中,在理论中构成了一定的数据(a Excisting for Index for Data),burrows-wheeler转换(BBWT)的变化是一定的一范围的一项and-nex contrest(bbwt),以及一定的数据(a)。哈希(Hashing),这是使用有限域的大量整数键时,这是实践中最有效的方法。基于这种方法,我们提出了与路径分解或Trie压实一起工作的动态TRIE数据结构。(b)重新分配是一种具有高压缩比的语法,很难在有限的内存范围内计算。在这里,我们可以找到一个二次时间算法计算重新测序,几乎没有其他空间。我们还设计了一个索引数据结构,建立在代表Lyndon树的语法上。该指数利用了林登单词的几个属性,以改善当前最快的语法指数的运行时间,从图案长度上的二次因素到线性。(c)最后,我们可以在BBWT上建立一个索引数据结构非重叠LZ77分解和LZ78底带压缩问题的空间有效分解算法。这些算法在接近线性的时间内起作用,空间渐近造成了对输入文本长度的位。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Re-Pair in Small Space
小空间重新配对
- DOI:10.3390/a14010005
- 发表时间:2020
- 期刊:
- 影响因子:2.3
- 作者:Dominik Koeppl;Tomohiro I;Isamu Furuya;Yoshimasa Takabatake;Kensuke Sakai;Keisuke Goto,
- 通讯作者:Keisuke Goto,
Dynamic Path-Decomposed Tries
动态路径分解尝试
- DOI:10.1145/3418033
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Tsuruta Kazuya;Koppl Dominik;Kanda Shunsuke;Nakashima Yuto;Inenaga Shunsuke;Bannai Hideo;Takeda Masayuki;Shunsuke Kanda and Dominik Koeppl and Yasuo Tabei and Kazuhiro Morita and Masao Fuketa
- 通讯作者:Shunsuke Kanda and Dominik Koeppl and Yasuo Tabei and Kazuhiro Morita and Masao Fuketa
Bidirectional Text Compression in External Memory
外部存储器中的双向文本压缩
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Patrick Dinklage;Jonas Ellert;Johannes Fischer;Dominik Koeppl;Manuel Penschuck
- 通讯作者:Manuel Penschuck
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
稲永 俊介其他文献
負電荷脂質を含有する油滴小球への脂溶性薬物担持と物性評価
含负电荷脂质油滴上的脂溶性药物负载及物理性质评价
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
稲永 俊介;宗 慶太郎;武岡 真司;土田 英俊 - 通讯作者:
土田 英俊
Serpentine minerals from Irikura, Oita Prefecture, Japan
产自日本大分县入仓的蛇纹石矿物
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
中島 祐人;稲永 俊介;坂内 英夫;竹田 正幸;加藤隆文;長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅;延寿 里美 - 通讯作者:
延寿 里美
日向沖南海トラフ前弧域の浅部活構造
日向附近南海海槽弧前区的浅层活动构造
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
中島 祐人;稲永 俊介;坂内 英夫;竹田 正幸;加藤隆文;長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅;延寿 里美;加藤隆文;加藤隆文;山口飛鳥・新井和乃・池原研・金松敏也・福地里菜・中村恭之・宇佐美和子・奥津なつみ・清家弘治・芦寿一郎;加藤隆文;山口飛鳥・福地里菜・濱橋真理・清水真由子・江口大賀・金川久一;Takafumi Kato;加藤隆文;芦寿一郎・山口飛鳥・福地里菜・大出晃弘・奥津なつみ・田淵優・池原研 - 通讯作者:
芦寿一郎・山口飛鳥・福地里菜・大出晃弘・奥津なつみ・田淵優・池原研
An Authentication Protocol with Anonymity against Service Providers and the Central Manager
针对服务提供商和中央管理器的匿名身份验证协议
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
中村 徹;稲永 俊介;馬場 謙介;池田 大輔;安浦 寛人;Toru Nakamura;Shunsuke Inenaga;K. Baba;Daisuke Ikeda;H. Yasuura - 通讯作者:
H. Yasuura
延岡衝上断層ボーリングコア中の断層帯の化学組成分布
延冈逆冲断层钻孔核心断层带化学成分分布
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
中島 祐人;稲永 俊介;坂内 英夫;竹田 正幸;加藤隆文;長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅 - 通讯作者:
長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅
稲永 俊介的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('稲永 俊介', 18)}}的其他基金
広義文字列のアルゴリズムと組合せ論
宽字符串算法和组合数学
- 批准号:
23K24808 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
感度と圧縮率を両立するデータ圧縮法の創出とその限界解明
创建同时实现灵敏度和压缩率的数据压缩方法,并阐明其局限性
- 批准号:
23K18466 - 财政年份:2023
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
広義文字列のアルゴリズムと組合せ論
宽字符串算法和组合数学
- 批准号:
22H03551 - 财政年份:2022
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似国自然基金
面向NP难问题多种求解算法的皇冠分解技术研究
- 批准号:62372066
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
针对人工表面等离激元器件多尺度电磁隐身问题的高效DGTD-HDGTD混合时域算法的研究
- 批准号:62301133
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
图机器学习的理论、模型与算法设计
- 批准号:62376007
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
面向子集选择的演化多模态多目标优化算法研究
- 批准号:62376115
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
资源受限下集成学习算法设计与硬件实现研究
- 批准号:62372198
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
CAREER: Blessing of Nonconvexity in Machine Learning - Landscape Analysis and Efficient Algorithms
职业:机器学习中非凸性的祝福 - 景观分析和高效算法
- 批准号:
2337776 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Continuing Grant
CAREER: From Dynamic Algorithms to Fast Optimization and Back
职业:从动态算法到快速优化并返回
- 批准号:
2338816 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Continuing Grant
CAREER: Structured Minimax Optimization: Theory, Algorithms, and Applications in Robust Learning
职业:结构化极小极大优化:稳健学习中的理论、算法和应用
- 批准号:
2338846 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Continuing Grant
CRII: SaTC: Reliable Hardware Architectures Against Side-Channel Attacks for Post-Quantum Cryptographic Algorithms
CRII:SaTC:针对后量子密码算法的侧通道攻击的可靠硬件架构
- 批准号:
2348261 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Standard Grant
CRII: AF: The Impact of Knowledge on the Performance of Distributed Algorithms
CRII:AF:知识对分布式算法性能的影响
- 批准号:
2348346 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Standard Grant