An Information Retrieval using Conceptual Index Term for Technical Papers
技术论文概念索引词的信息检索
基本信息
- 批准号:09480076
- 负责人:
- 金额:$ 7.1万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In this research, we proposed a new Information Retrieval (IR) method using semantic information from technical papers. The proposed method is suitable for use in Digital Libraries (DL). Users of Digital Libraries need to retrieve information which meets their semantic requirements. An important problem is the reduction of retrieval errors caused by differences in requests among individual users. To solve this problem, we used some techniques of natural language processing, and dictionaries that describe the relations between words and concepts.To extract semantic information of technical papers, we applied morphological analysis program for text data derived from images of technical papers as OCR results. After morphological analysis, we extract only nouns and examine their distribution of word appearance frequency for later use. We also extract concepts of nouns with EDR concept dictionary and calculate their distribution of concept appearance frequency. Combining the distribution of word appearance frequency and that of concept appearance frequency, we get the concepts which correspond with the subject of technical papers. One of the key ideas of this research is handling concept as concept paths which include the relations among concepts. This helps abstraction of concepts of the subjects of technical paper. Experimental results show effectiveness of the proposed method. We also realized a prototype system of conceptual information retrieval. We focused on technical papers written in Japanese in this paper. As EDR dictionary also has concept dictionary of English words, we can apply our method to technical papers written in English easily. One of the characteristics of EDR concept dictionary is that expression of concepts are in common with Japanese words and English words. This will help cross lingual information retrieval.
在这项研究中,我们使用技术论文的语义信息提出了一种新的信息检索(IR)方法。所提出的方法适用于数字库(DL)。数字图书馆的用户需要检索满足其语义要求的信息。一个重要的问题是减少了由于单个用户的请求差异而引起的检索错误。为了解决这个问题,我们使用了一些自然语言处理的技术,以及描述单词和概念之间关系的字典。为提取技术论文的语义信息,我们将形态分析程序应用于技术论文图像的文本数据,作为OCR结果。经过形态学分析,我们仅提取名词并检查其单词外观频率的分布以供以后使用。我们还提取使用EDR概念字典的名词的概念,并计算出其概念外观频率的分布。结合了单词外观频率和概念外观频率的分布,我们得到了与技术论文主题相对应的概念。这项研究的关键思想之一是将概念作为概念路径处理,其中包括概念之间的关系。这有助于抽象技术论文主题的概念。实验结果表明该方法的有效性。我们还意识到了概念信息检索的原型系统。我们专注于本文用日语编写的技术论文。由于EDR字典还具有英语单词的概念词典,因此我们可以轻松地将我们的方法应用于用英语编写的技术论文。 EDR概念词典的特征之一是,概念的表达与日语单词和英语单词共同。这将有助于跨语言信息检索。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
C.Horii, M.Imai, K.Chihara: "An Information Retrival using Conceptual Index Term for Technical Pores on Digital Libraries" Proc.of ISDL 97. 205-208 (1997)
C.Horii、M.Imai、K.Chihara:“数字图书馆技术孔概念索引术语的信息检索”Proc.of ISDL 97. 205-208 (1997)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Rei Suzuki, Kideki Sunahara, Masakazu Imai, Kunihiro Chihara: "Building Digital Library System-NAIST Challenge-" Proceedings of International Symposium on Research,Development & Practice in Digital Libraries.(1997)
Rei Suzuki、Kideki Sunahara、Masakazu Imai、Kunihiro Chihara:“构建数字图书馆系统-NAIST挑战-”研究、发展国际研讨会论文集
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
C.Hori, M.Imai and K.Chihara: "Concept Information Retrieval of Technical Papers for Digital Libraries" Proc.Of Advances in Digital Library. (To appear). (1999)
C.Hori、M.Imai 和 K.Chihara:“数字图书馆技术论文的概念信息检索”Proc.Of 数字图书馆进展。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
C.Hori, M.Imai and K.Chihara: "An Information Retrieval using Conceptual Index Term for Technical Paper on Digital Libraries" Proc.Of ISDL'97. 205-208 (1997)
C.Hori、M.Imai 和 K.Chihara:“使用数字图书馆技术论文概念索引术语进行信息检索”Proc.Of ISDL97。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
C.Horii, M.Imai, K.Chihara: "Concepts Information Retrieval of Technical Papers for Digital libraries" Proc. of Advance in Digital Library. (To appear). (1999)
C.Horii、M.Imai、K.Chihara:“数字图书馆技术论文的概念信息检索”Proc。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
NAKAMURA Takayuki其他文献
Sentence Simplification with Core Vocabulary
利用核心词汇简化句子
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Agge Celestin;HOSHINO Moriyuki;Takumi Maruyama and Kazuhide Yamamoto - 通讯作者:
Takumi Maruyama and Kazuhide Yamamoto
複製技術時代の書物のアイデンティティ - 末広鉄腸『二十三年未来記』の場合(上)
复制技术时代的书籍身份——以末广哲的《23年未来记》为例(其一)
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Agge Celestin;HOSHINO Moriyuki;Takumi Maruyama and Kazuhide Yamamoto;SAKUMA Yutaka;SAKUMA Yutaka;佐久間寛;佐久間寛;NAKAMURA Takayuki;NAKAMURA Takayuki;佐久間寛;鈴木広光;佐久間寛;鈴木広光;佐久間寛;鈴木広光;鈴木広光 - 通讯作者:
鈴木広光
複製技術時代の書物のアイデンティティ―末広鉄腸『二十三年未来記』の場合(中)―
复制技术时代书籍的身份:以末广哲町的《23年未来记》为例(中)
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Agge Celestin;HOSHINO Moriyuki;Takumi Maruyama and Kazuhide Yamamoto;SAKUMA Yutaka;SAKUMA Yutaka;佐久間寛;佐久間寛;NAKAMURA Takayuki;NAKAMURA Takayuki;佐久間寛;鈴木広光;佐久間寛;鈴木広光;佐久間寛;鈴木広光 - 通讯作者:
鈴木広光
活字文献学考:書体意識の生まれるところ
印刷文学研究:字体意识从何而来
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Agge Celestin;HOSHINO Moriyuki;Takumi Maruyama and Kazuhide Yamamoto;SAKUMA Yutaka;SAKUMA Yutaka;佐久間寛;佐久間寛;NAKAMURA Takayuki;NAKAMURA Takayuki;佐久間寛;鈴木広光;佐久間寛;鈴木広光 - 通讯作者:
鈴木広光
タイのロヒンギャ―国軍・人身売買・メディア
泰国的罗兴亚人 - 军事、人口贩卖、媒体
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Aggee Celestin;HOSHINO Moriyuki;鈴木佑記;松村圭一郎;松村圭一郎;SAKUMA Yutaka;SAKUMA Yutaka;佐久間寛;鈴木佑記 - 通讯作者:
鈴木佑記
NAKAMURA Takayuki的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('NAKAMURA Takayuki', 18)}}的其他基金
A Cross-linguistic and Cross-regional Study of the Formation of Transatlantic Literature in Paris during the Interwar Period
两次世界大战期间巴黎跨大西洋文学形成的跨语言、跨地域研究
- 批准号:
19K00482 - 财政年份:2019
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Study on Seamless Target Modeling System for Three Dimensional Vision System
三维视觉系统无缝目标建模系统研究
- 批准号:
23500243 - 财政年份:2011
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A TSUNAMI RESONATOR FOR REDUCTION OFFLOOD DAMAGE ALONG INNER BAY OF RIA COAST
用于减少 RIA 海岸内湾洪水损害的海啸谐振器
- 批准号:
22560514 - 财政年份:2010
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Novel Data mining method for next-generation robots
下一代机器人的新型数据挖掘方法
- 批准号:
20500181 - 财政年份:2008
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
PROTECTIVE EFFECT OF HUMAN THIOREDOXIN AGAINST WARM ISCHEMIA REPERFUSION INJURY OF THE LUNG
人硫氧还蛋白对肺热缺血再灌注损伤的保护作用
- 批准号:
17591467 - 财政年份:2005
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A method of spatial arrangement of offshore breakwaters for effective wave attenuation and changing currents
有效衰减波浪和改变水流的近海防波堤空间布置方法
- 批准号:
02650362 - 财政年份:1990
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
A method of spatial array of offshore breakwaters for effective wave attenuation
有效消波的近海防波堤空间阵列方法
- 批准号:
63550376 - 财政年份:1988
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似国自然基金
数字图书馆情境下基于可解释深度学习的图像检索研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
穿青人、蔡家人和亻革家人文化遗产的数字图书馆建设
- 批准号:71864007
- 批准年份:2018
- 资助金额:28.1 万元
- 项目类别:地区科学基金项目
面向词汇功能的学术文本语义识别与知识图谱构建
- 批准号:71473183
- 批准年份:2014
- 资助金额:66.0 万元
- 项目类别:面上项目
基于多源信息融合的元数据自动抽取方法研究
- 批准号:61202232
- 批准年份:2012
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
数字图书馆社区的知识聚合与服务研究
- 批准号:71273197
- 批准年份:2012
- 资助金额:58.0 万元
- 项目类别:面上项目
相似海外基金
Computational Photography Project for Pill Identification (C3PI)
药丸识别计算摄影项目 (C3PI)
- 批准号:
8174192 - 财政年份:2010
- 资助金额:
$ 7.1万 - 项目类别:
HIGH THROUGHPUT, HIGH CONTENT MOLECULAR LIBRARIES SCREENING
高通量、高内涵分子库筛选
- 批准号:
8169400 - 财政年份:2010
- 资助金额:
$ 7.1万 - 项目类别:
HIGH THROUGHPUT, HIGH CONTENT MOLECULAR LIBRARIES SCREENING
高通量、高内涵分子库筛选
- 批准号:
7956782 - 财政年份:2009
- 资助金额:
$ 7.1万 - 项目类别:
HealthMap: Knowledge Management for Emerging Infectious Disease Intelligence
HealthMap:新发传染病情报的知识管理
- 批准号:
8138357 - 财政年份:2009
- 资助金额:
$ 7.1万 - 项目类别:
HealthMap: Knowledge Management for Emerging Infectious Disease Intelligence
HealthMap:新发传染病情报的知识管理
- 批准号:
8325815 - 财政年份:2009
- 资助金额:
$ 7.1万 - 项目类别: