Research on fundamental compression technology to promote the utilization of compressed data
基础压缩技术研究促进压缩数据利用
基本信息
- 批准号:21K11758
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究の目的は,圧縮されたデータに対して統計および知識処理を効率よく行う圧縮処理体系の基盤を築くことである.ここで「効率よい」とは,次の三つの観点において優れていることである.第一には,データをどれだけコンパクトに表現できるかという圧縮率の観点である.第二には,処理時間とメモリ消費量をどれだけ抑えられるかという計算量の観点である.第三には,圧縮後のデータ自体が,後の情報検索やデータ解析の際にどのくらい利用しやすいかというデータ活用の観点である.これまで,データ活用の観点から,非定型の文字列データに対する圧縮データ上でのキーワード検索や部分系列の頻度計測などは議論されてきた.一方で,表データやログデータのように数値データを多く含み構造化されたデータに対して,データ圧縮を積極的に用いたデータ活用方法についてほとんど議論されていない.申請者らはこれまでに,データストリームに対する頻出アイテム系列発見のための省メモリアルゴリズムについて開発を行い,第177回アルゴリズム研究会にて発表を行っている.この技術は,絶えず流れ込むデータ(データストリーム)中に頻出する部分系列を発見するためのものである.センサーログなどの数値データはデータストリーム型であり,これに対して頻出するパターンを任意の長さで検出することができる.本年度は,これまで得られた知見を基に,数値データの圧縮表現に関する調査を開始した.
本研究的目的是建立一个压缩处理系统的基础,该系统可以对压缩数据进行有效的统计和知识处理。这里,“高效”是指在以下三个方面表现优异。第一个是压缩率,即数据表达的紧凑程度。第二个考虑因素是可以完成的计算量,以减少处理时间和内存消耗。第三个考虑因素是压缩数据本身用于后续信息检索和数据分析的容易程度。到目前为止,从数据利用的角度,已经讨论了非标准字符串数据的压缩数据的关键字搜索和部分序列的频率测量。另一方面,对于包含大量数值数据(例如表数据和日志数据)的结构化数据主动使用数据压缩的数据利用方法却很少讨论。申请人目前已经开发出一种节省内存的算法,用于发现数据流中的频繁项序列,并在第 177 算法研究组上进行了展示。该技术用于发现不断流动的数据(数据流)中频繁出现的子序列。传感器日志等数值数据采用数据流的形式,可以检测任意长度的频繁出现的模式。今年,我们根据迄今为止获得的知识开始了数值数据压缩表示的研究。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
喜田 拓也其他文献
長大な拡張文字列パターンに対するGPU による高速な文字列照合
GPU 驱动的快速字符串匹配,适用于大型扩展字符串模式
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
笹川 裕人;喜田 拓也;有村 博紀 - 通讯作者:
有村 博紀
Ku-Band Long Distance Site-Diversity (SD) Characteristics Using New Measuring System
使用新测量系统的 Ku 波段长距离站点分集 (SD) 特性
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
南 敏朗;池田 大輔;喜田 拓也;K.Fujisaki et al. - 通讯作者:
K.Fujisaki et al.
Arc-annotation付きテキストに対するパタ-ン照合アルゴリズム
带有弧形标注的文本模式匹配算法
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Kazuhito Hagio;Shuichi Mitarai;Akira Ishino;and Masayuki Takeda.;Hideo Bannai 他3名;Hisashi Tsuji他2名;Shunsuke Inenaga 他2名;Zdenek Tronicek 他1名;Yusuke Ishida 他3名;Heikki Hyyro 他2名;Hiroshi Sakamoto;Tetsuya Maita (他1名);石田 祐介(他3名);喜田 拓也 - 通讯作者:
喜田 拓也
喜田 拓也的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('喜田 拓也', 18)}}的其他基金
背景知識を考慮した文字列照合に関する研究
考虑背景知识的字符串匹配研究
- 批准号:
17700024 - 财政年份:2005
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
半構造化データに対する文字列処理の高速化に関する研究
加速半结构化数据字符串处理的研究
- 批准号:
14780224 - 财政年份:2002
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
データ圧縮に基づく文字列処理の高速化に関する研究
基于数据压缩的加速字符串处理的研究
- 批准号:
00J00410 - 财政年份:2000
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
大規模IoT時系列データストリームを活用したプロセス最適化システムの開発
利用大规模物联网时间序列数据流开发流程优化系统
- 批准号:
24KJ1618 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Research on Stream Processing Systems Enhanced by Deep Learning
深度学习增强的流处理系统研究
- 批准号:
23K16888 - 财政年份:2023
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
動的に変わる集合に対する類似検索のスケッチを利用した高速化
使用动态变化集的草图加速相似性搜索
- 批准号:
21K11901 - 财政年份:2021
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
確率的イベントストリームにおけるリアルタイムな系列パターンマイニング手法の開発
随机事件流实时序列模式挖掘方法的开发
- 批准号:
20K19804 - 财政年份:2020
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
IoTビッグデータの要因分析に基づく将来イベント予測
基于物联网大数据因子分析的未来事件预测
- 批准号:
19J11125 - 财政年份:2019
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows