図とテキストの協調的構造解析に基づく文書画像からのハイパーメディア構造の抽出

基于图文协同结构分析的文档图像超媒体结构提取

基本信息

  • 批准号:
    06780357
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

1.参照形態の分析・分類文書のテキストから図,表,写真,テキストへの参照の形態を分析した。その結果,参照形態は,(1)直接的参照,(2)順序による参照,(3)配置による参照,(4)文脈による参照,(5)近接による参照の5種類に分類できること,またこれらを組み合わせた参照もあることが分かった。2.複数頁を対象とした文書画像理解システムの構築技術論文のハイパーメディア化には,技術論文の全頁を対象とする処理が必要である。このとき,図,表など頁内の位置が不定なものの分離抽出法,文書の全頁を対象とした論理構造の抽出法が問題となる。本研究では,(1)文学認識の結果を用いて図表のキャプションを抽出した後,キャプションの位置を手がかりに図表の本体を抽出する手法,(2)全頁に含まれる文字列を読み順にソ-トし,その結果を構文解析して論理構造を抽出する手法を開発した。また,これらの2手法に基づいて,技術論文の全頁を処理可能な文書画像理解システムを構築した。3.概念図理解システムの構築技術論文にしばしば含まれる概念図を対象に,図理解システムを構築した。本システムの特徴は,図に記述された概念,および概念間の関係という高次の情報を抽出する点にある。抽出された概念は,キーワードとして登録され,テキストとの参照構造の抽出に用いられる。4.参照構造の抽出とハイパーメディア化参照形態(1),(2),(5)を対象に,参照構造を抽出する手法を開発した。具体的には,(a)図表を図表番号に基づいてテキストとリンクする処理,(b)章,節を参照するテキストを,章,節の本体とリンクする処理,(c)著者照会文と写真を,頁領域における両者の近さに基づいてリンクする処理などを実現した また,図,表、写真の画像,本文の文字認識結果,および抽出したリンクを入力とし,HTML形式のデータを得るシステムを開発し,Mosaicなどのブラウザで表示可能とした。
1、参考文献形式的分析与分类 我们对文献中的文字引用图形、表格、照片、文字的形式进行了分析。结果,我们发现引用的形式可以分为五种:(1)直接引用,(2)顺序引用,(3)排列引用,(4)上下文引用,(5)引用事实证明,也有结合的参考。 2.针对多页面的文档图像理解系统的构建为了将技术论文转换为超媒体,需要对技术论文的所有页面进行处理。这时的问题是如何分离和提取页面内位置不确定的图形、表格等,以及如何从文档的所有页面中提取逻辑结构。在本研究中,我们开发了(1)一种利用文学识别结果提取图形和表格的标题,然后以标题位置为线索提取图形正文的方法;方法解析结果并提取逻辑结构。此外,基于这两种方法,我们构建了一个可以处理技术论文所有页面的文档图像理解系统。 3.概念图理解系统的构建我们针对论文中经常包含的概念图构建了一个图理解系统。该系统的特点是提取高级信息,例如图中描述的概念以及概念之间的关系。提取的概念被注册为关键字并用于从文本中提取参考结构。 4.参考结构的提取和超媒体化针对参考表格(1)、(2)和(5)开发了一种提取参考结构的方法。具体来说,(a)根据图号将图形和表格与文本链接的过程,(b)将涉及章节和章节的文本与章节主体链接的过程,以及(c)链接的过程实现了诸如根据页面区域中的邻近程度链接照片等处理。我们还开发了一个系统,通过输入图形、表格、照片、文本识别结果和提取的链接等图像来获取HTML格式的数据,这些数据可以在Mosaic等浏览器中显示。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
黄瀬浩一: "構文・意味解析を用いた文字認識後処理法" 電子情報通信学会論文誌 D-II. J77-D-II. 2199-2209 (1994)
Koichi Kise:“使用句法和语义分析的字符识别后处理方法”电子、信息和通信工程师协会汇刊 D-II 2199-2209 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Noriyoshi Yoneda: "A Method of Understanding Conceptual Diagrams" Proceedings of IAPR Workshop on Maclune Vision Applications. 334-337 (1994)
Noriyoshi Yoneda:“理解概念图的方法”IAPR Maclune 视觉应用研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
黄瀬浩一: "印刷文書のハイパーテキスト化に関する一考察" 平成6年電気関係学会関西支部連合大会論文集. G275- (1994)
Koichi Kise:“将印刷文档转换为超文本的研究”1994 年电气工程学会关西分会会议记录 G275- (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
黄瀬浩一: "幾何問題の理解と解決を目的とした図と文の統合理解" 電気学会論文誌C. 114-C. 1201-1207 (1994)
Koichi Kise:“为了理解和解决几何问题而对图表和句子的综合理解”,日本电气工程师学会汇刊 C. 114-C.1201-1207 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
秋吉裕二: "空白の構造に基づく文書画像の領域分割" 電子情報通信学会技術研究報告パターン認識・理解研究会. PRU94(PRU94-101). 31-38 (1995)
Yuji Akiyoshi:“基于空白结构的文档图像区域分割”IEICE 技术报告模式识别和理解研究组。PRU94(PRU94-101)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

黄瀬 浩一其他文献

学習補助のための視点情報に基づく文書アノテーション
基于视点信息的文档注释,用于辅助学习
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大社 綾乃;Kai Kunze;Olivier Augereau;黄瀬 浩一
  • 通讯作者:
    黄瀬 浩一
VR空間操作コマンドとしてのアイジェスチャUIの特性分析
VR空间操控命令眼部手势UI特性分析
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    湯浅 成章;Andrew Vargo;黄瀬 浩一;夏目達也,内村裕也,Christian Arzate Cruz,柴田史久,木村朝子
  • 通讯作者:
    夏目達也,内村裕也,Christian Arzate Cruz,柴田史久,木村朝子
英語空所補充問題の自動生成
自动生成英文填空题
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森瀧 瑞希;湯浅 成章;Andrew W. Vargo;黄瀬 浩一
  • 通讯作者:
    黄瀬 浩一
習慣添付型マイクロラーニングの提案
习惯附着型微学习提案
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中井 拓海;Andrew Vargo;黄瀬 浩一
  • 通讯作者:
    黄瀬 浩一
LLAHによるリアルタイム文書画像検索の日本語文書への拡張
使用 LLAH 将实时文档图像搜索扩展到日语文档
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中居 友弘;黄瀬 浩一;岩村 雅一
  • 通讯作者:
    岩村 雅一

黄瀬 浩一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('黄瀬 浩一', 18)}}的其他基金

「読み」を読み,読まれて知る:センシングと生成AIを用いた対話する読書の創出
阅读并通过被阅读而了解:利用感知和生成人工智能创建交互式阅读
  • 批准号:
    24K02962
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Human-centered ways to connect intelligence: Japanese-German-French approach to human learning enhancement and implications through generative AI
以人为本的连接智能的方法:日本、德国、法国通过生成人工智能增强人类学习的方法及其影响
  • 批准号:
    23KK0188
  • 财政年份:
    2023
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Fund for the Promotion of Joint International Research (International Collaborative Research)
International Collaborative Research on Intelligence Augmentation of Human Learning
人类学习智能增强的国际合作研究
  • 批准号:
    20KK0235
  • 财政年份:
    2020
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
ImPen:画像の検索・位置決めと再構成による新しいペン型インタフェース
ImPen:一种新的类似笔的界面,具有图像搜索、定位和重建功能
  • 批准号:
    21650026
  • 财政年份:
    2009
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
データハイディングに基づく認識可能な印刷文書の生成と電子文書への変換
基于数据隐藏生成可识别的印刷文档并转换为电子文档
  • 批准号:
    11780312
  • 财政年份:
    1999
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
電子図書館構築のための文書データ入力支援システムの高機能化
完善电子图书馆建设文档数据输入支持系统的功能
  • 批准号:
    09780391
  • 财政年份:
    1997
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
文書画像の統合理解による電子図書館構築支援方式の検討
基于文档图像综合理解的电子图书馆建设支持方法的思考
  • 批准号:
    08780403
  • 财政年份:
    1996
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
文書画像の統合理解によるハイパーテキスト化と知的検索
通过对文档图像的综合理解进行超文本转换和智能搜索
  • 批准号:
    07780372
  • 财政年份:
    1995
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
印刷文書のハイパーテキスト化を指向した文書画像の統合理解に関する研究
旨在将印刷文档转化为超文本的文档图像综合理解研究
  • 批准号:
    05780323
  • 财政年份:
    1993
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Try of bidirectional substitution with visual creation ancestry and auditory creation ancestry
视觉创造系与听觉创造系双向替代的尝试
  • 批准号:
    25580045
  • 财政年份:
    2013
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
A research on Information Semiotics and Hyper-archive Platform
信息符号学与超档案平台研究
  • 批准号:
    23300092
  • 财政年份:
    2011
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
An Experimental Study on the Structure of Hypertrails: With Focus on the Interaction with Learners' Knowledge Structure
超轨迹结构的实验研究:关注与学习者知识结构的交互
  • 批准号:
    22700828
  • 财政年份:
    2010
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
A Study on the Possibility of History Hypermedia Teaching Software in School
学校历史超媒体教学软件的可能性研究
  • 批准号:
    20700633
  • 财政年份:
    2008
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
イタリア人日本語学習者のための新しい日本語文法辞典の編纂
为意大利日语学习者编写的新日语语法词典
  • 批准号:
    08F08737
  • 财政年份:
    2008
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了