ウェブを情報源とした用語辞典の自動編集

使用网络作为信息源自动编辑术语表

基本信息

  • 批准号:
    13224055
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 无数据
  • 项目状态:
    已结题

项目摘要

本年度は、主に、ウェブから関連用語を収集する方法を中心に研究を行なった。`まず、2つの用語間の関係として、10種類(同義、類似・対比、上位概念、下位概念、全体、部分、並列、用途・環境、因果、複合語)の関係を設定した。次に、テキスト中からこれらの関係にある用語対を抽出するために、10種類の関係それぞれに対して、その関係を示唆する典型的な文型を調査・整理した。これらの文型と文とを照合して、上記の関係にある用語対を自動抽出することを実現するために、構文テンプレートと呼ぶ文型の記述法を定義し、これと構文解析した文とを比較する照合器(パターンマッチャー)を作成した。関連用語を収集アルゴリズムとして、次のようなブートストラップ型のアルゴリズムを実装した。(1)初期用語集合Gを与える。(2)Gの中の用語が少なくとも1語存在するような文をウェブから収集する。(3)上記の構文テンプレートを用いて、関連用語を抽出する。(4)得られた新しい語の中から一般的な語を除去したものを用語集合Gに追加する。(5)(2)以下を繰り返す。上記の方法による関連用語収集を「生物学」の領域を対象に実験を行なった。10個の用語を初期用語集合とし、上記のループを2回実行した結果、128語の新しい用語が収集され、そのうち、97語(76%)が適切な関連用語であった。一旦、不適切な用語が用語集合に混入すると、その影響が次回のループで拡大して精度が下がるため、今後、この点を改善する必要がある。
今年我们主要研究了从网络上收集相关术语的方法。 “首先,我们在两个术语之间建立了 10 种关系(同义词、相似/对比、上位概念、下位概念、整体、部分、平行、用法/环境、因果关系和复合词)。接下来,为了从文本中提取这些关系中的术语对,我们研究并组织了典型的句子模式,这些句子模式为 10 种关系类型中的每一种提供了建议。为了整理这些句子类型和句子并自动提取具有上述关系的术语对,我们定义了一种称为句法模板的描述句子类型的方法,并将其与我创建的模式匹配器来执行此操作的解析句子进行比较。我们使用相关术语作为收集算法实现了以下引导类型算法。 (1) 给出初始术语集G。 (2)从网络中收集至少存在G中的一个术语的句子。 (3) 使用上述语法模板提取相关术语。 (4)从得到的新词中去除常用词,加入到术语集G中。 (5)(2) 重复以下步骤。利用上述方法进行了实验,收集了“生物学”领域的相关术语。使用初始的 10 个术语集运行上述循环两次后,我们收集了 128 个新术语,其中 97 个 (76%) 是相关术语。一旦不合适的术语混入术语集中,其影响力会在下一个循环中被放大,准确度会下降,因此未来需要改进。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

佐藤 理史其他文献

再帰反射による空中結像(AIRR)の原理と応用
逆反射航空成像(AIRR)的原理和应用
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    加納 隼人;佐藤 理史;松崎 拓也;山本 裕紹
  • 通讯作者:
    山本 裕紹
日本語の文の平均像を体現した文を探す (1) 文の特徴量の抽出
搜索体现日语句子平均形象的句子(1)提取句子特征
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    刀山 将大;佐藤 理史;近藤 秀;吉田 達平
  • 通讯作者:
    吉田 達平
ダイレクト広告コピー文の分析と自動生成
直接广告文案分析及自动生成
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平良 裕汰朗;佐藤 理史;宮田 玲;今頭 伸嘉
  • 通讯作者:
    今頭 伸嘉
エンタメ小説における会話文の発話意図分析 ―発話文表現文型辞書の改良に向けてー
娱乐小说会话句的言语意图分析——面向言语表达模式词典的改进——
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    夏目 和子;佐藤 理史
  • 通讯作者:
    佐藤 理史
述語取り立て形式の整理と文生成器への実装
组织谓词集合格式并在句子生成器中实现
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 遼;夏目 和子;佐藤 理史;松崎 拓也;佐藤理史
  • 通讯作者:
    佐藤理史

佐藤 理史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('佐藤 理史', 18)}}的其他基金

テキストを実行可能なプログラムに変換するための基本技術の探究
探索将文本转换为可执行程序的基本技术
  • 批准号:
    22K19811
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
話者の特徴や個性を感じさせる発話文の生成機構
一种生成话语的机制,可以让人了解说话者的特征和个性
  • 批准号:
    21H03497
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
オンラインニュース見出しの言語構造および情報構造の解明
阐明在线新闻标题的语言和信息结构
  • 批准号:
    18650032
  • 财政年份:
    2006
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
実世界の関連性を投影した語彙空間の構築
建立反映现实世界关系的词汇空间
  • 批准号:
    16016249
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
内部構造に着目した連想の分類と機械的実現法
注重内部结构的关联分类与机械实现
  • 批准号:
    15650026
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
ウェブを情報源とした用語辞典の自動編集
使用网络作为信息源自动编辑术语表
  • 批准号:
    14019050
  • 财政年份:
    2002
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ワールドワイドウェブからの用語説明の自動抽出
从万维网上自动提取术语描述
  • 批准号:
    12878058
  • 财政年份:
    2000
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
論文表題の一般化による科学技術論文の階層的詳細分類
通过概括论文标题对科技论文进行层次化详细分类
  • 批准号:
    10878060
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
対話からの知識獲得に関する研究
对话知识获取研究
  • 批准号:
    07221208
  • 财政年份:
    1995
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
情報のダイジェスティングに関する研究
信息消化研究
  • 批准号:
    07680389
  • 财政年份:
    1995
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

雑談での聞き手との共通基盤構築に関わる表現・ストラテジーに関する調査とその応用
闲聊中与听者建立共同基础的表达方式及策略研究及其应用
  • 批准号:
    20K00714
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
The function of emotional references in regulating interpersonal relationships in early and middle childhood: A study on the development of children's understanding of others
情绪参照在幼儿和中期调节人际关系中的作用:儿童理解他人发展的研究
  • 批准号:
    20K03329
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Extracting relationship between two terms in biomedical literature
提取生物医学文献中两个术语之间的关系
  • 批准号:
    538978-2019
  • 财政年份:
    2019
  • 资助金额:
    --
  • 项目类别:
    University Undergraduate Student Research Awards
Understanding the Gains from Wage Rigidity in a Currency Union with Default Risk: Focusing on the Relationship between Terms of Trade and Fiscal Balance
了解具有违约风险的货币联盟中工资刚性的收益:关注贸易条件与财政平衡之间的关系
  • 批准号:
    19K01755
  • 财政年份:
    2019
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Rethinking on coprincipal from the viewpoint of speech act theories
言语行为理论视角下对共主的再思考
  • 批准号:
    19K13541
  • 财政年份:
    2019
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了