Approach to inverse sequence alignment with conditional random fields and its application to information extraction

条件随机场逆序列比对方法及其在信息提取中的应用

基本信息

  • 批准号:
    18700148
  • 负责人:
  • 金额:
    $ 2.43万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2006
  • 资助国家:
    日本
  • 起止时间:
    2006 至 2008
  • 项目状态:
    已结题

项目摘要

条件付き確率場の近似法である平均化パーセプトロン学習を用いて逆系列アラインメント(inverse parametric sequence alignment)問題を解くための手法を提案した.逆系列アラインメントとはすなわち,与えられた訓練データから編集コストモデルを学習する問題である.応用として生物学文書(英語)および日本語(百科辞典および新聞記事)からの並列句検出および範囲同定に適用し,既存法に比べて高い精度を得た.タグ付け(教師データ)が不十分な場合でも対処するために2種類のヒューリスティックを提案し,その有効性を実証した.
逆参数序列对齐是使用平均感知器学习来执行的,这是条件随机场的近似方法。逆序列对齐是从给定的训练数据中学习编辑成本模型的问题。它可以应用于生物文档(英语)和日语(百科全书),我们将其应用于报纸文章中的并行短语检测和范围识别,并获得了比现有的方法。我们提出了两种类型的启发式方法来处理标记(训练数据)不足的情况,我们已经证明了其有效性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
機械学習と系列アラインメントを応用した日本語並列句解析
应用机器学习和序列比对的日语平行短语分析
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大熊秀治;新保仁;原一夫;松本裕治
  • 通讯作者:
    松本裕治
アラインメントと機械学習を応用した並列句解析:医学生物学論文からの情報抽出に向けて
应用对齐和机器学习的并行短语分析:从医学和生物论文中提取信息
A family of dissimilarity measures between nodes generalizing both the shortest-path and the commute-time distances
  • DOI:
    10.1145/1401890.1401984
  • 发表时间:
    2008-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Luh Yen;M. Saerens;Amin Mantrach;M. Shimbo
  • 通讯作者:
    Luh Yen;M. Saerens;Amin Mantrach;M. Shimbo
アラインメントと機械学習を応用した並列句解析 : 医学生物学論文からの情報抽出に向けて
应用对齐和机器学习的并行短语分析:从医学和生物论文中提取信息
コミュニティを考慮したカーネル引用解析
考虑社区的内核引用分析
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

SHIMBO Masashi其他文献

SHIMBO Masashi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('SHIMBO Masashi', 18)}}的其他基金

Machine learning problems as retrieval in high dimensional space
高维空间检索的机器学习问题
  • 批准号:
    19H04173
  • 财政年份:
    2019
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
New development in hubness-aware metric learning in high dimensional data
高维数据中中心感知度量学习的新进展
  • 批准号:
    15H02749
  • 财政年份:
    2015
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Link Analysis Approaches to Natural Language Processing and Text Mining
自然语言处理和文本挖掘的链接分析方法
  • 批准号:
    21500141
  • 财政年份:
    2009
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

組織に蓄積された訓練情報を活用した訓練項目・達成指標抽出システム技術の開拓
开发利用组织中积累的培训信息提取培训项目和成果指标的系统技术
  • 批准号:
    24K15243
  • 财政年份:
    2024
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
静的局所環境の学習によるタンパク質動的構造情報の抽出
通过学习静态局部环境提取蛋白质动态结构信息
  • 批准号:
    23K24942
  • 财政年份:
    2024
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    23K25158
  • 财政年份:
    2024
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
新開発「RIKEN-LMS」で挑む南極深層アイスコアからの天文情報抽出
使用新开发的“RIKEN-LMS”从南极洲深层冰芯提取天文信息
  • 批准号:
    24H00255
  • 财政年份:
    2024
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
異なる規模の空間的異質性を抽出する:地理情報分析に基づく地域の特徴把握に向けて
提取不同尺度的空间异质性:基于地理信息分析理解区域特征
  • 批准号:
    23K20972
  • 财政年份:
    2024
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了