ワールドワイドウェブからの用語説明の自動抽出
从万维网上自动提取术语描述
基本信息
- 批准号:12878058
- 负责人:
- 金额:$ 1.34万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は、与えられた用語に対して、(1)その用語が説明されているウェブページを見つけ出し、(2)そのページから用語の説明だけを抜き出し、(3)それらを整理して提示するシステムを実現することである。昨年度の研究で、プロトタイプシステムを実現することができたので、今年度は、各部の改良と調整を行なった。【a.ペ-ジ収集の改良】これまではページ収集にGooとInfoseekを利用していたが、これに加えてLycosを利用し、収集するページを増やした。【b.用語説明の抽出】これまでは、形態素解析結果に基づき用語を定義する文(用語定義文)を判定し、用語を説明する段落(用語説明)を抽出していた。文を構文解析し、その結果に基づき定義文を判定するプログラムを作成し、この部分の改良を試みたが、結果は芳しくなかった。【c.用語説明のグループ化】プログラムの一部を変更し、グループ化モジュールの高速化を実現した。2年間の研究により、ウェブを仮想的な辞書・辞典化することができることを実証した。これにより、当初の目的を達成できたと考える。しかしながら、精度(品質)と速度については、さらなる改善が必要である。なお、本システムのアーキテクチャが他の言語に対しても有効であることを実証するために、英語に対してほぼ同様のシステムを実現し、動作することを確認した。
本研究的目的是(1)找到解释该术语的网页,(2)从该页面仅提取该术语的解释,以及(3)组织它们。目标是实现所提出的系统。在去年的研究中,我们能够创建一个原型系统,所以今年我们对各个部分进行了改进和调整。 [a.改进的页面收集] 到目前为止,我们一直使用Goo和Infoseek来收集页面,但除此之外,我们还使用Lycos来增加我们收集的页面数量。 [b.提取术语解释] 到目前为止,已经根据词法分析的结果确定了定义术语的句子(术语定义句子),并提取了解释术语的段落(术语解释)。我试图通过创建一个解析句子并根据结果确定定义句子的程序来改进这部分,但结果并不好。 [c. 术语解释的分组] 更改了部分程序以加快分组模块的速度。通过两年的研究,我们已经证明将网络变成虚拟词典是可能的。至此,我们相信我们已经实现了最初的目标。然而,在准确性(质量)和速度方面还需要进一步改进。此外,为了证明该系统的架构对其他语言也有效,我们为英语实现了一个几乎类似的系统,并确认其有效。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Satoshi Sato: "Automated Editing of Hypertext Resume from the World Wide Web"Proc.of 2001 Symposium on Applications and the Internet (SAINT-01). 15-22 (2001)
Satoshi Sato:“来自万维网的超文本简历的自动编辑”Proc.of 2001 年应用程序和互联网研讨会 (SAINT-01)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
桜井裕,佐藤理史: "ワールドワイドウェブを利用した用語検索"情報処理学会研究報告(自然言語処理研究会NL-137). 2000・53. 23-29 (2000)
Yutaka Sakurai、Satoshi Sato:“使用万维网进行术语搜索”日本信息处理学会研究报告(自然语言处理研究组 NL-137)2000・53(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
佐藤理史, 佐藤円: "情報の自動編集とWITプロジェクト"電子図書館-デジタル情報の流通と図書館の未来(日本図書館情報学研究委員会編、勉誠出版). 131-149 (2002)
Satoshi Sato,Yen Sato:“自动信息编辑和WIT项目”数字图书馆-数字信息的分发和图书馆的未来(日本图书情报科学研究委员会编辑,辨精出版)131-149(2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
佐藤 理史其他文献
再帰反射による空中結像(AIRR)の原理と応用
逆反射航空成像(AIRR)的原理和应用
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
加納 隼人;佐藤 理史;松崎 拓也;山本 裕紹 - 通讯作者:
山本 裕紹
日本語の文の平均像を体現した文を探す (1) 文の特徴量の抽出
搜索体现日语句子平均形象的句子(1)提取句子特征
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
刀山 将大;佐藤 理史;近藤 秀;吉田 達平 - 通讯作者:
吉田 達平
エンタメ小説における会話文の発話意図分析 ―発話文表現文型辞書の改良に向けてー
娱乐小说会话句的言语意图分析——面向言语表达模式词典的改进——
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
夏目 和子;佐藤 理史 - 通讯作者:
佐藤 理史
佐藤 理史的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('佐藤 理史', 18)}}的其他基金
テキストを実行可能なプログラムに変換するための基本技術の探究
探索将文本转换为可执行程序的基本技术
- 批准号:
22K19811 - 财政年份:2022
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
話者の特徴や個性を感じさせる発話文の生成機構
一种生成话语的机制,可以让人了解说话者的特征和个性
- 批准号:
21H03497 - 财政年份:2021
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
オンラインニュース見出しの言語構造および情報構造の解明
阐明在线新闻标题的语言和信息结构
- 批准号:
18650032 - 财政年份:2006
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Exploratory Research
実世界の関連性を投影した語彙空間の構築
建立反映现实世界关系的词汇空间
- 批准号:
16016249 - 财政年份:2004
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
内部構造に着目した連想の分類と機械的実現法
注重内部结构的关联分类与机械实现
- 批准号:
15650026 - 财政年份:2003
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Exploratory Research
ウェブを情報源とした用語辞典の自動編集
使用网络作为信息源自动编辑术语表
- 批准号:
14019050 - 财政年份:2002
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
ウェブを情報源とした用語辞典の自動編集
使用网络作为信息源自动编辑术语表
- 批准号:
13224055 - 财政年份:2001
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)
論文表題の一般化による科学技術論文の階層的詳細分類
通过概括论文标题对科技论文进行层次化详细分类
- 批准号:
10878060 - 财政年份:1998
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Exploratory Research
対話からの知識獲得に関する研究
对话知识获取研究
- 批准号:
07221208 - 财政年份:1995
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
情報のダイジェスティングに関する研究
信息消化研究
- 批准号:
07680389 - 财政年份:1995
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
情報のダイジェスティングに関する研究
信息消化研究
- 批准号:
07680389 - 财政年份:1995
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)