ユビキタス環境におけるダブル配列を用いた検索データベースの圧縮法に関する研究
普适环境下双数组搜索数据库压缩方法研究
基本信息
- 批准号:17700116
- 负责人:
- 金额:$ 0.9万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
ダブル配列をトライの深さごとに分割し,その分割したブロックの開始位置からの距離をBASE値とすることにより圧縮する手法のデータ構造とアルゴリズムを提案した.本手法を用いて,現在までに研究されている圧縮手法をさらに圧縮できることを確認した.1.トライの深さごとにブロックに分割を行った.各ブロックのBASE値を,次のブロックの開始位置からの距離とすることにより,各BASE値を小さくすることができ,BASE配列を圧縮することができた.2.分割したブロックのサイズが異なることに着目し,ダブル配列の2式を次のブロックとの大きさの割合をBASE値にかける次の式に変更することにより.さらにBASE値を小さく出来た.t=s*r[d] + BASE[d][s] + CODE[c]t - s*r[d] = CHECK[d+1][t]ここでrは次のブロックとの大きさの割合.dは,トライの深さを表す.3.1,2の手法を実現したまま,CHECK値に遷移した文字を格納し,CHECK配列を圧縮できることを確認した.4.上記のアルゴリズムをコンピュータ上で実現し,できるだけBASEの値が小さくなるように,試行錯誤を繰り返し,キーの追加アルゴリズムを改善した.5.特許記事から抽出した数百万件に及ぶキー集合を登録し圧縮率を求めた.また,従来のダブル配列,17年度の手法との圧縮率,速度の比較実験を行った.
我们提出了一种通过将双数组划分为特里结构深度并使用距每个划分块的起始位置的距离作为BASE值来压缩双数组的数据结构和算法,我们证实正在研究的压缩方法可以进一步压缩1。我们将试验分为每个深度的块,每个块的 BASE 值为。通过设置距块起始位置的距离,可以使每个BASE值变小,从而可以压缩BASE数组。 2. 2代入下面的公式,将BASE值乘以下一个块的大小比例,我们可以进一步减小BASE值。t=s*r[d] + 基址[d][s] + 代码[c]t - s*r[d] = CHECK[d+1][t]这里,r是大小与下一个块的比例。d代表try的深度。在实现3.1和2的方法时,过渡到CHECK值的字符是确认CHECK数组可以被压缩。4.上述算法在计算机上执行。为了尽可能降低BASE值,我们通过反复试错改进了密钥添加算法。 5.我们注册了一组从专利文章中提取的数百万个密钥并计算了压缩率。与传统双阵列方法和2017方法的压缩比和速度进行比较。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A compact static double-array keeping character codes
保存字符代码的紧凑静态双数组
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:Susumu Yata
- 通讯作者:Susumu Yata
A Method of Extracting and Evaluating Good and Bad Reputations for Natural Language Expressions
一种提取和评估自然语言表达好坏声誉的方法
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Masao Fuketa
- 通讯作者:Masao Fuketa
A Sentence Classification Technique by Using Intention Association Expressions
一种利用意图关联表达式的句子分类技术
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Yuki Kadoya
- 通讯作者:Yuki Kadoya
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
泓田 正雄其他文献
Twitter ユーザの反応に基づく話題の信憑性評価
根据 Twitter 用户反应评估主题的可信度
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
西村 聡一郎;森田 和宏;泓田 正雄 - 通讯作者:
泓田 正雄
泓田 正雄的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
中世漢字字書・語彙辞書統合データベースの構築による和訓の段階的構造の解明
通过建立中世纪汉字书籍和词汇词典的综合数据库来阐明日语汉字的逐步结构
- 批准号:
23K00552 - 财政年份:2023
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
辞書資料による音象徴語根の史的データベース作成
使用字典数据创建声音符号根的历史数据库
- 批准号:
21K00556 - 财政年份:2021
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
『色葉字類抄』の語彙研究および総合データベースの構築
《伊吕波鲁书》词汇研究及综合数据库建设
- 批准号:
21H00529 - 财政年份:2021
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
古代日本語における格標示体系の総合的解明を目指した斜格データベースの構築
构建倾斜格数据库,全面阐明古代日语格标记系统
- 批准号:
21K13014 - 财政年份:2021
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Construction and applied research of the database of high-quality Japanese example sentences available for the development of dictionary websites and applications
可供词典网站及应用开发的优质日语例句数据库建设及应用研究
- 批准号:
21H00535 - 财政年份:2021
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)