新聞記事の要約のためのテンプレートの自動抽出に関する研究
报纸文章摘要模板自动提取研究
基本信息
- 批准号:08780336
- 负责人:
- 金额:$ 0.7万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1996
- 资助国家:日本
- 起止时间:1996 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
従来から抄録や要約に関する様々な研究がおこなわれているが,これらの多くは,主に一つの記事(文書)の内容を要約することに重点を置いているため,新聞やニュースのような一つのイベントに対して複数の記事が存在するテキストに適用した場合,複数の記事によって表される情報(時間的なイベントの変化など)をうまく要約することができないという問題がある.そこで、ある話題の記事に対して重要と考えられる項目をあらかじめテンプレートとして用意しておき、それを用いて抽出した各記事のデータから要約を作り出すことが考えられる.このような考え方をもとにした要約処理の研究はなされつつあるが、現段階では,テンプレートの作成は話題ごとに人手によっておこなわれている.本研究では,新聞記事を対象とし,要約のためのテンプレートを,ある話題に関する記事集合から自動的に抽出することを目的とする.本研究で提案するテンプレートの自動抽出手法では,テンプレートの形式を、「動詞+格要素(その格に望ましい意味カテゴリ名を含む)」の意味的に類似した集合という形で表し,「話題で重要な表現=話題に固有な表現」という仮定のもとに,対象の話題の記事の出現頻度とランダムに集めたサンプル記事の出現頻度をもとに計算した重要度という値を用いてテンプレートを抽出する.本手法を、日本経済新聞の4つの話題(地震,交通事故,火災,記者会見)に適用し,作成したテンプレートを用いて実験をおこなった結果,話題で重要と考えられるテンプレートが抽出され,本テンプレートを,ある話題において重要でない記事を取り除くフィルタ的な利用が可能であることが確認した.
迄今为止,已经进行了各种关于摘要和摘要的研究,但其中大多数都集中于总结单个文章(文档)的内容,因此它们不适合应用于报纸或新闻文章等文章。一个事件存在多篇文章,存在无法很好地概括多篇文章所表达的信息(例如事件随时间的变化)的问题。可以想象,准备一个对于某个主题的文章来说重要的项目的模板,然后使用该模板根据从每篇文章中提取的数据创建摘要。基于此想法的摘要处理研究正在进行中,但是在此阶段,为每个主题手动创建模板。在这项研究中,我们专注于报纸文章并创建了用于总结的模板本文的目的是从一组文章中自动提取特定主题的动词。本研究提出的自动模板提取方法使用模板格式为“动词+格元素(带有格所需的语义类别名称)”基于“主题中重要的表达=特定于主题的表达”的假设,将目标主题的文章和随机收集的样本文章的出现频率以语义相似的“包括”集合的形式表示。使用根据出现频率计算出的称为重要性的值来提取模板。该方法应用于日本经济新闻中的四个主题(地震、交通事故、火灾和新闻发布会),创建的模板是由于使用该方法进行实验,提取了被认为对某个主题重要的模板,并证实该模板可以像过滤器一样使用,以删除对某个主题不重要的文章。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
徳永 健伸其他文献
徳永 健伸的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('徳永 健伸', 18)}}的其他基金
コンピュータとの対話による言語学習者の生産語彙能力評定の自動化
通过与计算机交互自动评估语言学习者的生产性词汇技能
- 批准号:
21K18358 - 财政年份:2021
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
関連する複数のテキストを対象とした要約生成技術に関する研究
多相关文本摘要生成技术研究
- 批准号:
09480062 - 财政年份:1997
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
確率理論に基づく文書の自動分類に関する研究
基于概率论的文档自动分类研究
- 批准号:
07780309 - 财政年份:1995
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
言語データを用いた自然言語処理用シソ-ラスの自動構築に関する研究
利用语言数据自动构建自然语言处理词库的研究
- 批准号:
06780301 - 财政年份:1994
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
推敲を考慮した自然言語生成のための文法の形式化に関する研究
考虑阐述的自然语言生成语法形式化研究
- 批准号:
05780280 - 财政年份:1993
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
推敲に基づく日本語生成に関する研究
基于精化的日语生成研究
- 批准号:
03750264 - 财政年份:1991
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
高品質機械翻訳のための日本語文生成に関する研究
高质量机器翻译的日语句子生成研究
- 批准号:
02750253 - 财政年份:1990
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
組織に蓄積された訓練情報を活用した訓練項目・達成指標抽出システム技術の開拓
开发利用组织中积累的培训信息提取培训项目和成果指标的系统技术
- 批准号:
24K15243 - 财政年份:2024
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
新開発「RIKEN-LMS」で挑む南極深層アイスコアからの天文情報抽出
使用新开发的“RIKEN-LMS”从南极洲深层冰芯提取天文信息
- 批准号:
24H00255 - 财政年份:2024
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
静的局所環境の学習によるタンパク質動的構造情報の抽出
通过学习静态局部环境提取蛋白质动态结构信息
- 批准号:
23K24942 - 财政年份:2024
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
- 批准号:
23K25158 - 财政年份:2024
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
異なる規模の空間的異質性を抽出する:地理情報分析に基づく地域の特徴把握に向けて
提取不同尺度的空间异质性:基于地理信息分析理解区域特征
- 批准号:
23K20972 - 财政年份:2024
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (B)