Universal Data Compression by Digram
通过 Digram 进行通用数据压缩
基本信息
- 批准号:09650404
- 负责人:
- 金额:$ 0.7万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project was performed during the 1997-1998 fiscal years for developing and realizing a high-speed efficient noiseless data compression algorithm based on digram string matching, We have obtained the following results :1. The update algorithm of the dictionary is similar to that of LZMW code. In LZMW code, all the strings in the dictionary are unique, while our code could store the same string multiple times. Thus, ours can not out-perform LZMW code in compression rate. However, since the design of the algorithm is recursive in nature, the implementation is far easier and the coding speed is far faster than those of LZMW.2. The algorithm registers longer strings in the early stage of encoding. As the result, the performance of compression improves very quickly. Therefore, it is better suited for the compression of sequence at practical length.3. We found that it is not enough to encode the position in the dictionary by the commonly used integer encoding. We need to assign the codeword length decided by the probability of the occurrence. Since the size of the alphabet increases according to the increase of input sequence length, we have the so called "the modeling of the source with big alphabet" problem. Therefore we developed the estimation algorithm of smooth probability distribution.Those results are expected to contribute as a basic technology for the future lossless compression schemes.
该项目在1997-1998财年期间进行,旨在开发和实现基于二字母串匹配的高速高效无噪声数据压缩算法,我们获得了以下成果: 1.字典的更新算法与LZMW代码类似。在LZMW代码中,字典中的所有字符串都是唯一的,而我们的代码可以多次存储相同的字符串。因此,我们的代码在压缩率方面无法超越 LZMW 代码。然而,由于该算法的设计本质上是递归的,因此实现起来要容易得多,编码速度也远快于LZMW.2。该算法在编码的早期阶段注册较长的字符串。结果,压缩性能提高得非常快。因此,它更适合于实际长度的序列压缩。 3.我们发现通过常用的整数编码来对字典中的位置进行编码是不够的。我们需要分配由出现概率决定的码字长度。由于字母表的大小随着输入序列长度的增加而增加,因此存在所谓的“大字母表源的建模”问题。因此我们开发了平滑概率分布的估计算法。这些结果有望作为未来无损压缩方案的基础技术。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
松岡隆仁,志記潤二,伊藤秀一: "折れ線モデルを利用した確率分布の推定とデータ圧縮" 第21回情報理論とその応用シンポジウム予稿集. 1. 217-220 (1998)
Takahito Matsuoka、Junji Shiki、Shuichi Ito:“使用折线模型估计概率分布和数据压缩”第 21 届信息论及其应用研讨会论文集 1. 217-220 (1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
松岡 隆仁: "折れ線モデルを利用した確率分布の推定とデータ圧縮" 第21回情報理論とその応用シンポジウム予稿集. 1. 217-220 (1998)
Takahito Matsuoka:“使用折线模型估计概率分布和数据压缩”第 21 届信息论及其应用研讨会论文集。1. 217-220 (1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
朱 蓉: "MDL原理を用いた領域分割法による画像の無歪みデータ圧縮" 第20回情報理論とその応用シンポジウム予稿集. 2. 621-624 (1997)
朱荣:“利用MDL原理的区域分割方法进行图像的无失真数据压缩”第20届信息论及其应用研讨会论文集2. 621-624(1997)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
奥田 敬: "文書集合からの重要語の抽出について" 第20回情報理論とその応用シンポジウム予稿集. 1. 245-248 (1997)
Takashi Okuda:“论从一组文档中提取重要单词”第 20 届信息论及其应用研讨会论文集 1. 245-248 (1997)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Wen Chen,Shuichi Itoh,Junji Shiki: "Introduction to Image Coding by Integer Wavelet" 第21回情報理論とその応用シンポジウム予稿集. 2. 815-818 (1998)
陈文,伊藤秀一,志木淳二:“整数小波图像编码导论”第21届信息论及其应用研讨会论文集2. 815-818(1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
ITOH Shuichi其他文献
ITOH Shuichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
汽车共享效率提升策略及其福利影响研究:消费者行为、出行模式竞争与匹配阻塞
- 批准号:72362015
- 批准年份:2023
- 资助金额:28 万元
- 项目类别:地区科学基金项目
数字技术与制度要素匹配下数字社会创业行为机理与成长模式研究
- 批准号:72372169
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
面向大规模时态图的模式匹配与关键节点辨识理论与方法研究
- 批准号:62302451
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于多种结构模式的多层复杂网络匹配与识别理论及其应用研究
- 批准号:62303052
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
时间模式复用连续变量量子态远程传输的模式匹配研究
- 批准号:12304402
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
SHF: Medium: Efficient and Scalable Pattern Matching via Hardware-Software Co-Design
SHF:中:通过软硬件协同设计实现高效且可扩展的模式匹配
- 批准号:
2313062 - 财政年份:2023
- 资助金额:
$ 0.7万 - 项目类别:
Continuing Grant
Comprehensive Evaluation of Algorithms for Indeterminate Pattern-Matching
不确定模式匹配算法的综合评价
- 批准号:
569128-2022 - 财政年份:2022
- 资助金额:
$ 0.7万 - 项目类别:
Postgraduate Scholarships - Doctoral
Faster Run-Length Compressed String Indexing for Pattern Matching
用于模式匹配的更快的运行长度压缩字符串索引
- 批准号:
575477-2022 - 财政年份:2022
- 资助金额:
$ 0.7万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
Development of optimal time-space algorithms on pattern matching problems
模式匹配问题的最优时空算法的发展
- 批准号:
19K20208 - 财政年份:2019
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Event Detection Platform (using pattern matching analytics)
事件检测平台(使用模式匹配分析)
- 批准号:
720636 - 财政年份:2015
- 资助金额:
$ 0.7万 - 项目类别:
GRD Development of Prototype