記憶容量が乏しい組み込み計算環境上でのXML検索処理手法の研究

存储容量有限的嵌入式计算环境下XML搜索处理方法研究

基本信息

项目摘要

今年度は、これまでに研究を行ってきた、記憶容量の乏しい環境のもとで大規模XMLデータを扱うための圧縮ツールについてさらに研究を行った。われわれがこれまでに開発した圧縮ツールでは、大規模XMLデータを圧縮して保存し、その一部のみを検索によって抜き出して使用したい場合には、データ全体をいったん解凍してから検索をするのではなく、圧縮した状態のまま検索を行い、必要な部分のみを解凍することができる。これは、データを複数のコンテナと呼ばれる単位に分割して、コンテナ毎に圧縮することで実現される。このコンテナ分割を行う際、同時に抜き出して使用されることが多いデータはできるだけ同じコンテナに入れられるようにコンテナへの分割を行えば、検索時に解凍する必要があるコンテナの個数が減り、さらに効率が改善できる。このような、データの検索時に同時にアクセスされる可能性が高いデータ同士を一箇所に集めて保存する考え方は、従来のデータベース技術におけるディスク上へのデータの配置に関して、これまでに研究されており、データのクラスタリングと呼ばれる。そこで、今年度は、われわれは、このクラスタリングの手法をわれわれの圧縮ツールにも応用し、より効率のよい圧縮ツールを開発した。この手法では、データの圧縮時に、どのような検索がどの程度の頻度で行われるかの情報を与えると、この情報に基づいて、検索時に解凍される必要のあるコンテナ数の期待値が最小になるような、データのコンテナへの分割を行う。これにより、圧縮率は平均するとわずかに悪化するものの、検索時の効率が大きく向上した。
今年,我们对迄今为止一直在研究的压缩工具进行了进一步的研究,用于在记忆力差的环境中处理大规模XML数据。在到目前为止我们开发的压缩工具中,如果您想压缩和存储大规模XML数据,并仅通过搜索来提取其中的一部分,而不是解压缩整个数据然后搜索,则可以在压缩时进行搜索并仅拉开必要的部分。这是通过将数据分为称为多个容器并将其压缩到容器中的单位来实现的。执行此容器划分时,如果经常同时提取和使用的数据可以放在同一容器中,则将在搜索过程中需要取消拉链的容器数量,从而进一步提高效率。收集和存储数据的概念可能会在搜索数据时同时访问,到目前为止,在一个地方已经研究了有关传统数据库技术中磁盘上数据的布置的研究,并称为数据群集。因此,今年,我们将此聚类技术应用于压缩工具,并开发了一种更有效的压缩工具。在此技术中,当数据被压缩时,如果提供了有关搜索的频率和频率(基于此信息)的信息,则将数据分配为容器,以便最小化搜索过程中需要取消拉链的容器数量的预期值。尽管压缩率平均稍差一些,但这显着提高了搜索过程中的效率。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
非XMLデータに対するXPath検索のためのラッパーのインターフェイスの設計
设计用于非 XML 数据上的 XPath 搜索的包装器接口
Answering XPath Queries over Networks by Sending Minimal Views
  • DOI:
    10.1016/b978-012088469-8.50008-5
  • 发表时间:
    2004-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keishi Tajima;Yoshiki Fukui
  • 通讯作者:
    Keishi Tajima;Yoshiki Fukui
Cache Design for Transcoding Proxy Caching
  • DOI:
    10.1007/978-3-540-30141-7_28
  • 发表时间:
    2004-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keqiu Li;Hong Shen;Keishi Tajima
  • 通讯作者:
    Keqiu Li;Hong Shen;Keishi Tajima
ROM上のXMLデータに対するメモリ使用量の少ない検索処理
ROM 上 XML 数据的低内存使用搜索处理
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田島 敬史其他文献

Optimizing the Execution Time for Checking the Consistency of XML Documents
优化检查 XML 文档一致性的执行时间
XML用木パターン検索言語XPath解説
XPath 的解释,一种用于 XML 的树模式搜索语言
モバイル機器での小画面上での表データ表示インターフェイス
移动设备小屏表格数据展示界面
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    徳田隆志;田島敬史;田島 敬史
  • 通讯作者:
    田島 敬史
Collaboration-based verification of object-oriented models (in Japanese)
面向对象模型的基于协作的验证(日语)
レビューページ例からの属性抽出に基づくレビューページ検索
基于评论页面示例属性提取的评论页面搜索

田島 敬史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田島 敬史', 18)}}的其他基金

Webおよびクラウドからの偏りを排した情報収集手法
消除网络和云端偏见的信息收集方法
  • 批准号:
    23K28095
  • 财政年份:
    2024
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Methods for Bias-Free Information Gathering from Web and Crowds
从网络和人群中无偏见信息收集的方法
  • 批准号:
    23H03405
  • 财政年份:
    2023
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
AND-ORグラフを用いるデータモデルとその操作系,制約記述系に関する研究
使用AND-OR图的数据模型及其操作系统和约束描述系统的研究
  • 批准号:
    18650021
  • 财政年份:
    2006
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
データベースにおけるセキュリティ検査のためのプログラム解析技術
数据库安全检查的程序分析技术
  • 批准号:
    10780192
  • 财政年份:
    1998
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
空間データベースにおけるアクセス管理機構およびビユ-機構
空间数据库中的访问控制和查看机制
  • 批准号:
    09230213
  • 财政年份:
    1997
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

広義文字列のアルゴリズムと組合せ論
宽字符串算法和组合数学
  • 批准号:
    22H03551
  • 财政年份:
    2022
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
String Indexing Based on Space-Optimal Grammar Compression and Its Application to Knowledge Discovery from Stream Data
基于空间最优语法压缩的字符串索引及其在流数据知识发现中的应用
  • 批准号:
    18K18111
  • 财政年份:
    2018
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of a compressed information processing infrastructure for converting stream data into knowledge
开发用于将流数据转换为知识的压缩信息处理基础设施
  • 批准号:
    17H01791
  • 财政年份:
    2017
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of kinship estimation methods on country-wide-size genome database for familial disease analyses
开发用于家族性疾病分析的全国基因组数据库的亲属关系估计方法
  • 批准号:
    17K20023
  • 财政年份:
    2017
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
大規模データにおける高速検索可能な動的圧縮文字列辞書の研究
实现大规模数据高速搜索的动态压缩字符串字典研究
  • 批准号:
    17J07555
  • 财政年份:
    2017
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了