Universal Data Compression by Digram

通过 Digram 进行通用数据压缩

基本信息

  • 批准号:
    09650404
  • 负责人:
  • 金额:
    $ 0.7万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 1998
  • 项目状态:
    已结题

项目摘要

This project was performed during the 1997-1998 fiscal years for developing and realizing a high-speed efficient noiseless data compression algorithm based on digram string matching, We have obtained the following results :1. The update algorithm of the dictionary is similar to that of LZMW code. In LZMW code, all the strings in the dictionary are unique, while our code could store the same string multiple times. Thus, ours can not out-perform LZMW code in compression rate. However, since the design of the algorithm is recursive in nature, the implementation is far easier and the coding speed is far faster than those of LZMW.2. The algorithm registers longer strings in the early stage of encoding. As the result, the performance of compression improves very quickly. Therefore, it is better suited for the compression of sequence at practical length.3. We found that it is not enough to encode the position in the dictionary by the commonly used integer encoding. We need to assign the codeword length decided by the probability of the occurrence. Since the size of the alphabet increases according to the increase of input sequence length, we have the so called "the modeling of the source with big alphabet" problem. Therefore we developed the estimation algorithm of smooth probability distribution.Those results are expected to contribute as a basic technology for the future lossless compression schemes.
该项目是在1997 - 1998财政年度进行的,用于开发和实现基于Digram字符串匹配的高速无噪声数据压缩算法,我们获得了以下结果:1。字典的更新算法与lzmw代码的更新算法相似。在LZMW代码中,字典中的所有字符串都是唯一的,而我们的代码可以多次存储相同的字符串。因此,我们的压缩率无法以较高的lzmw代码胜过。但是,由于该算法的设计本质上是递归的,因此实现更容易,并且编码速度远高于LZMW.2的速度。该算法在编码的早期阶段记录了更长的字符串。结果,压缩的性能很快提高。因此,它更适合于在实际长度上压缩序列3。我们发现,通过常用的整数编码编码字典中的位置是不够的。我们需要分配由事件的概率决定的编码长度。由于字母的大小根据输入序列长度的增加而增加,因此我们具有所谓的“具有大字母的源建模”问题。因此,我们开发了平滑概率分布的估计算法。预计这些结果将成为未来无损压缩方案的基本技术。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
松岡隆仁,志記潤二,伊藤秀一: "折れ線モデルを利用した確率分布の推定とデータ圧縮" 第21回情報理論とその応用シンポジウム予稿集. 1. 217-220 (1998)
Takahito Matsuoka、Junji Shiki、Shuichi Ito:“使用折线模型估计概率分布和数据压缩”第 21 届信息论及其应用研讨会论文集 1. 217-220 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松岡 隆仁: "折れ線モデルを利用した確率分布の推定とデータ圧縮" 第21回情報理論とその応用シンポジウム予稿集. 1. 217-220 (1998)
Takahito Matsuoka:“使用折线模型估计概率分布和数据压缩”第 21 届信息论及其应用研讨会论文集。1. 217-220 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
朱 蓉: "MDL原理を用いた領域分割法による画像の無歪みデータ圧縮" 第20回情報理論とその応用シンポジウム予稿集. 2. 621-624 (1997)
朱荣:“利用MDL原理的区域分割方法进行图像的无失真数据压缩”第20届信息论及其应用研讨会论文集2. 621-624(1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
奥田 敬: "文書集合からの重要語の抽出について" 第20回情報理論とその応用シンポジウム予稿集. 1. 245-248 (1997)
Takashi Okuda:“论从一组文档中提取重要单词”第 20 届信息论及其应用研讨会论文集 1. 245-248 (1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Wen Chen,Shuichi Itoh,Junji Shiki: "Introduction to Image Coding by Integer Wavelet" 第21回情報理論とその応用シンポジウム予稿集. 2. 815-818 (1998)
陈文,伊藤秀一,志木淳二:“整数小波图像编码导论”第21届信息论及其应用研讨会论文集2. 815-818(1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ITOH Shuichi其他文献

ITOH Shuichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

基于多种结构模式的多层复杂网络匹配与识别理论及其应用研究
  • 批准号:
    62303052
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
数字技术与制度要素匹配下数字社会创业行为机理与成长模式研究
  • 批准号:
    72372169
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
面向大规模时态图的模式匹配与关键节点辨识理论与方法研究
  • 批准号:
    62302451
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
汽车共享效率提升策略及其福利影响研究:消费者行为、出行模式竞争与匹配阻塞
  • 批准号:
    72362015
  • 批准年份:
    2023
  • 资助金额:
    28 万元
  • 项目类别:
    地区科学基金项目
时间模式复用连续变量量子态远程传输的模式匹配研究
  • 批准号:
    12304402
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

SHF: Medium: Efficient and Scalable Pattern Matching via Hardware-Software Co-Design
SHF:中:通过软硬件协同设计实现高效且可扩展的模式匹配
  • 批准号:
    2313062
  • 财政年份:
    2023
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Continuing Grant
Comprehensive Evaluation of Algorithms for Indeterminate Pattern-Matching
不确定模式匹配算法的综合评价
  • 批准号:
    569128-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
Faster Run-Length Compressed String Indexing for Pattern Matching
用于模式匹配的更快的运行长度压缩字符串索引
  • 批准号:
    575477-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
Development of optimal time-space algorithms on pattern matching problems
模式匹配问题的最优时空算法的发展
  • 批准号:
    19K20208
  • 财政年份:
    2019
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Event Detection Platform (using pattern matching analytics)
事件检测平台(使用模式匹配分析)
  • 批准号:
    720636
  • 财政年份:
    2015
  • 资助金额:
    $ 0.7万
  • 项目类别:
    GRD Development of Prototype
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了