論文表題の一般化による科学技術論文の階層的詳細分類
通过概括论文标题对科技论文进行层次化详细分类
基本信息
- 批准号:10878060
- 负责人:
- 金额:$ 1.22万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:1998
- 资助国家:日本
- 起止时间:1998 至 1999
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は、階層的に整理された専門用語集を用いて表題を解析することにより、科学技術論文を階層的かつ詳細に分類することを実現することであった。本年度は、昨年度作成した表題解析による論文分類システムの改良を行った。本システムは、表題を標準化するモジュール(標準化モジュール)と、標準化された表題に対して専門用語集を利用して分類コードを割り当てるコード割当モジュールから構成されている。分類コードとしては、主分類コード(専門用語集として使用した岩波情報科学辞典の用語の木コード)の他に、論文と主分類コードの意味的な関係を表す5種類の補助分類コードを用いた。標準化モジュールは、文字列処理と単語列処理の2つの処理を繰り返すことにより、論文表題を標準化する。コード割当モジュールは、表記のゆれや各種の変形に対応できるように、専門用語と表題の柔軟な照合を行い、見つかった専門用語に基づいて分類コードを割り当てる。この2つのモジュールにおいて、論文表題の言い換え研究の成果を利用したが、システムの精度はそれほど向上しなかった。実験における本システムの精度は、79%であった。以上、この2年間の研究により、表題解析による科学技術論文の自動分類は、ある程度実現不可能であることがわかった。しかしながら、この方法だけでは、十分な分類精度を達成できなかった。
本研究的目的是通过使用分层组织的技术术语词汇表分析标题,实现科技论文的分层和详细分类。今年,我们在去年创建的标题分析的基础上改进了文章分类系统。该系统由一个标准化标题的模块(标准化模块)和一个代码分配模块组成,该代码分配模块使用技术术语表将分类代码分配给标准化标题。作为分类代码,除了主分类代码(岩波信息科学词典中的术语树代码,用作技术术语表)之外,我们还使用了五种辅助分类代码来表达论文和论文之间的语义关系。主要分类代码。标准化模块通过重复字符串处理和字符串处理两个过程来标准化论文标题。代码分配模块对技术术语和标题进行灵活匹配,以适应符号的变化和各种转换,并根据找到的技术术语分配分类代码。在这两个模块中,我们使用了对文章标题进行释义的研究成果,但系统的准确性并没有显着提高。该系统在实验中的准确率为79%。如上所述,近两年的研究表明,通过标题分析对科技论文进行自动分类在一定程度上是不可行的。然而,仅靠这种方法无法达到足够的分类精度。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
今井 俊: "表題解析による科学技術論文の詳細分類" 情報処理学会第57回全国大会講演論文集. 3. 211-212 (1998)
Shun Imai:“使用标题分析对科学技术论文进行详细分类”第 57 届日本信息处理学会全国会议记录(1998 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
佐藤 理史: "論文表題を言い換える"情報処理学会論文誌. 40・7. 2937-2945 (1999)
Satoshi Sato:“重新表述论文标题”,日本信息处理学会汇刊 40・7 2937-2945(1999)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
佐藤理史: "論文表題を言い換える" 情報処理学会研究報告. 98・82. 179-186 (1998)
佐藤聪:“改写论文标题”日本信息处理学会研究报告 98・82(1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
佐藤 理史其他文献
再帰反射による空中結像(AIRR)の原理と応用
逆反射航空成像(AIRR)的原理和应用
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
加納 隼人;佐藤 理史;松崎 拓也;山本 裕紹 - 通讯作者:
山本 裕紹
日本語の文の平均像を体現した文を探す (1) 文の特徴量の抽出
搜索体现日语句子平均形象的句子(1)提取句子特征
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
刀山 将大;佐藤 理史;近藤 秀;吉田 達平 - 通讯作者:
吉田 達平
エンタメ小説における会話文の発話意図分析 ―発話文表現文型辞書の改良に向けてー
娱乐小说会话句的言语意图分析——面向言语表达模式词典的改进——
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
夏目 和子;佐藤 理史 - 通讯作者:
佐藤 理史
佐藤 理史的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('佐藤 理史', 18)}}的其他基金
テキストを実行可能なプログラムに変換するための基本技術の探究
探索将文本转换为可执行程序的基本技术
- 批准号:
22K19811 - 财政年份:2022
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
話者の特徴や個性を感じさせる発話文の生成機構
一种生成话语的机制,可以让人了解说话者的特征和个性
- 批准号:
21H03497 - 财政年份:2021
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
オンラインニュース見出しの言語構造および情報構造の解明
阐明在线新闻标题的语言和信息结构
- 批准号:
18650032 - 财政年份:2006
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Exploratory Research
実世界の関連性を投影した語彙空間の構築
建立反映现实世界关系的词汇空间
- 批准号:
16016249 - 财政年份:2004
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
内部構造に着目した連想の分類と機械的実現法
注重内部结构的关联分类与机械实现
- 批准号:
15650026 - 财政年份:2003
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Exploratory Research
ウェブを情報源とした用語辞典の自動編集
使用网络作为信息源自动编辑术语表
- 批准号:
14019050 - 财政年份:2002
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
ウェブを情報源とした用語辞典の自動編集
使用网络作为信息源自动编辑术语表
- 批准号:
13224055 - 财政年份:2001
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)
ワールドワイドウェブからの用語説明の自動抽出
从万维网上自动提取术语描述
- 批准号:
12878058 - 财政年份:2000
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Exploratory Research
対話からの知識獲得に関する研究
对话知识获取研究
- 批准号:
07221208 - 财政年份:1995
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
情報のダイジェスティングに関する研究
信息消化研究
- 批准号:
07680389 - 财政年份:1995
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
トピックモデルを適用した歯学系専門語彙集の作成
使用主题模型创建专业牙科词汇
- 批准号:
21K00686 - 财政年份:2021
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
琉球和文学の注釈研究とそれを活かした教材開発
琉球日本文学注解研究及教材开发
- 批准号:
17K02419 - 财政年份:2017
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Technology Transfer System based on Creation of Work Records and Procedures using Speech and Language Processing Technologies
基于使用语音和语言处理技术创建工作记录和程序的技术转让系统
- 批准号:
17H01977 - 财政年份:2017
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Using the knowledge and expertise of interpreters in German language learning
在德语学习中利用口译员的知识和专业知识
- 批准号:
15K02746 - 财政年份:2015
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a Basic Colloquial Expression Dictionary Based on a Science and Engineering Corpus
基于理工科语料库的基础口语表达词典的研制
- 批准号:
23652113 - 财政年份:2011
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research