XMLで表現されるマルチメディアデータの効果的検索法に関する研究

XML表达的多媒体数据的有效搜索方法研究

基本信息

  • 批准号:
    12780309
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2001
  • 项目状态:
    已结题

项目摘要

これまで提案されてきた文書検索は,文書全体を検索単位としてそれに含まれている文字列を特徴として扱っていた.しかし,近年,XML文書のような構造を持った文書やPDF, MPEG-7のような複数のメディアを扱った文書が多くなり,それに伴ってそれら文書を検索する際に従来の文書検索技術をそのまま適用することが難しいという問題が発生していた.本研究では,従来の文書検索のように一つの文書から一つの特徴量を抽出するのではなく,文書からは複数のさまざまな特徴量が抽出できると考え,XML文書検索の場合は文書内容とその構造から,PDFやMPEG-7文書検索の場合はその文書に含まれるそれぞれのメディアのコンテンツから特徴量を抽出し,それらを最適な単位で検索する手法を提案した.具体的には,XML文書検索の場合,XML文書の特徴量を最も忠実に抽出できる単位が存在するので,その単位を文書構造から推定する手法を確立した.また同時に,抽出された単位と利用者の入力した問合せの類似度計算の手法を提案し,その計算手法をXML文書検索に適用することで10%程度の検索精度の向上した.さらに,PDF文書検索の場合は,抽出された複数のメディアの特徴量を等価に扱わなければ双方の特徴を利用した検索が実現できないため,それら特徴量の正規化手法の提案を行った.この手法が確立されたことで,昨年度提案した複数特徴量を統合した検索手法の検索精度が最大25%程度向上した.
到目前为止,已经提出的文档搜索使用整个文档作为搜索单元的特征,并使用其中包含的字符串来表征。但是,近年来,随着许多与MPEG-7等多种媒体打交道的文档,具有XML文档,PDF等结构等结构的文档,因此出现的问题是,很难将常规文档搜索技术应用于搜索此类文档。在这项研究中,可以从文档中提取多个不同的功能数量,而不是从传统文档搜索中提取一项功能。在XML文档搜索的情况下,我们提出了一种从PDF或MPEG-7文档中包含的每个媒体的内容和结构中提取特征数量的方法,并在最佳单元中搜索它们。具体而言,在XML文档搜索的情况下,X用于从每个媒体的内容中提取特征数量。由于有一些单位可以最忠实地提取ML文档的功能数量,因此我们已经建立了一种从文档结构中估算单元的方法。同时,我们提出了一种计算提取单元和用户输入的查询之间相似性的方法,并通过将计算方法应用于XML文档搜索,我们将搜索准确性提高了约10%。此外,在PDF文档搜索的情况下,使用这两个功能搜索而无需平等处理多个提取介质的特征数量,因此我们为这些功能提出了一种归一化方法。通过建立此方法,将去年提出的多个特征数量结合的搜索方法的搜索准确性提高了25%。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Y.Suzuki et al.: "Extraction and Integration of XML Document Features on Wireless Environment"Proc.of the First International Workshop on Wireless Information Systems. (2002)
Y.Suzuki 等人:“无线环境下 XML 文档特征的提取和集成”Proc. of the First International Workshop on Wireless Information Systems。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
波多野 賢治, 渡邉 正裕 他: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 40・SIG3(TOD10). 47-59 (2001)
Kenji Hatano、Masahiro Watanabe 等:“使用信息检索技术自动提取部分文档结构”日本信息处理学会会刊:数据库 40・SIG3(TOD10)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Hatano et al.: "Extraction of Partial XML Documents Using IR-based Structure and Contents Analysis"Proc.of the International Workshop on Data Semantics in Web Information Systems. 189-202 (2001)
K.Hatano 等人:“使用基于 IR 的结构和内容分析提取部分 XML 文档”Web 信息系统数据语义国际研讨会的会议记录。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toshiyuki Amagasa,Minoru Nakai,Kenji Hatano,Masatoshi Yoshikawa,and Shunsuke Uemura: "Keyword Assignment to Images Using Sliding Windows"Proceedings of the 2000 ADBIS-DASFAA Symposium on Advances in Databases and Information Systems. 1-10 (2000)
Toshiyuki Amagasa、Minoru Nakai、Kenji Hatano、Masatoshi Yoshikawa 和 Shunsuke Uemura:“使用滑动窗口为图像分配关键字”2000 年 ADBIS-DASFAA 数据库和信息系统进展研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
鈴木 優, 波多野 賢治 他: "複数のメディアで構成された電子文書の検索手法"情報処理学会論文誌:データベース. 40・SIG10(TOD11). 11-21 (2001)
Yu Suzuki、Kenji Hatano 等:“由多种媒体组成的电子文档的搜索方法”日本信息处理协会交易:数据库 40・SIG10(TOD11)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

波多野 賢治其他文献

XML情報検索のための動的な索引管理手法の一提案
一种用于XML信息检索的动态索引管理方法的建议
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    欅 惇志;宮崎 純;波多野 賢治;山本 豪志朗;加藤 博一
  • 通讯作者:
    加藤 博一
The Economic and Political Preferences of Japanese Homemakers
日本家庭主妇的经济和政治偏好
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 優介;駒水 孝裕 ;波多野 賢治;Tomoko Matsumoto; Kenneth McElwain; Kensuke Okada; Junko Kato
  • 通讯作者:
    Tomoko Matsumoto; Kenneth McElwain; Kensuke Okada; Junko Kato
The synchronous vs. asynchronous NoC routers: an apple-to-apple comparison between synchronous and transition signaling asynchronous designs
同步与异步 NoC 路由器:同步和转换信令异步设计之间的逐个比较
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    久米 出;中村 匡秀;波多野 賢治;柴山 悦哉;Masashi Imai; Thiem Van Chu; Kenji Kise; Tomohiro Yoneda
  • 通讯作者:
    Masashi Imai; Thiem Van Chu; Kenji Kise; Tomohiro Yoneda
固有表現タグおよびPOSタグによる交換制約付きデータ拡張手法
使用命名实体标签和POS标签的具有交换约束的数据扩展方法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    寺本 優香;駒水 孝裕 ;波多野 賢治
  • 通讯作者:
    波多野 賢治
データの複雑性を考慮した不均衡データに対するリサンプリング手法
考虑数据复杂度的不平衡数据重采样方法
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    笹田 大翔;馬場 睦也;木村 優介;波多野 賢治
  • 通讯作者:
    波多野 賢治

波多野 賢治的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('波多野 賢治', 18)}}的其他基金

異種データセット間におけるエンティティ同定とその活用に関する研究
异构数据集中的实体识别及其利用研究
  • 批准号:
    23K28383
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Study on Entity Identification and Utilization in Cross-Dataset
跨数据集中的实体识别与利用研究
  • 批准号:
    23H03694
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
高精度XML文書検索システムの問合せ処理高速化に関する研究
高精度XML文档检索系统查询加速处理研究
  • 批准号:
    16700103
  • 财政年份:
    2004
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
部分着目型XML情報検索システムの開発とその利用に関する研究
偏焦点XML信息检索系统的开发与使用研究
  • 批准号:
    14780325
  • 财政年份:
    2002
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

文書内容に応じて否認可能性のレベルを制御可能な新たな電子署名技術の提案
提出一种新的电子签名技术,可以根据文档内容控制否认级别
  • 批准号:
    24K20776
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
A Translational Research Approach to Healthy Technology Usage in Language-Minority Families with Young Children
有幼儿的语言少数群体家庭健康技术使用的转化研究方法
  • 批准号:
    10822222
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
BLRD Research Career Scientist Award Application
BLRD 研究职业科学家奖申请
  • 批准号:
    10481027
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
BLRD Research Career Scientist Award Application
BLRD 研究职业科学家奖申请
  • 批准号:
    10593106
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    22H03904
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了