面向复杂问题的汉语阅读理解研究
项目介绍
AI项目解读
基本信息
- 批准号:61673248
- 项目类别:面上项目
- 资助金额:61.0万
- 负责人:
- 依托单位:
- 学科分类:F03.自动化
- 结题年份:2020
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2020-12-31
- 项目参与者:杨陟卓; 张虎; 钱揖丽; 郭鑫; 赵红燕; 赵红红; 寻丽娜; 段庆龙;
- 关键词:
项目摘要
Machine reading and comprehension is one of the ultimate tasks in NLP, which has been used to evaluate a machine in text understanding. Most of the current researches are based on some datasets (e.g. MCTest), in whichthe texts andthe questions are easy, and fail to capture the complexity and ambiguity of natural language. Therefore, the relative approaches cannot be successfully used in real natural language. In this project, our goal is teaching machines to read, comprehend and answer complex questions under the same conditions as humans. We will focus on sentence semantic analysis, especially implicit information resolution, discourse analysis based on semantic segments。We will seek to find a question answering approach using semantic information of lexicons, sentences and discourses to address the different expressions of the same meaning in questionsand texts. We also seek to develop a model based deep neutral networks to answer complex questions. We believe our works in this project will provide new solutions and ideas for machine reading comprehension.
阅读理解是NLP领域的一项高级复杂任务,是机器理解文本能力的重要反映,其研究对促进自然语言理解的发展有重要意义。但目前研究所基于的语料(如:MCTest)内容与问题都比较简单,不能反映自然语言的歧义性和复杂性,因此所提模型很难顺利应用到复杂多变的真实语料中。本项目旨在面向人类真实阅读场景,研究面向阅读理解复杂问题解答的深层语言分析技术,探讨句子语义信息分析,尤其是隐含信息的显式化;研究基于语义片段进行语篇宏观信息分析的方法;并在此基础上,研究一种融合词义、句义、语篇信息的解题策略,以克服问题表述与原文存在的语义鸿沟;针对复杂的问答题,探讨基于神经网络推理模型的解答方案。为汉语阅读理解提供新的研究思路和方法。
结项摘要
机器阅读理解可以客观地反映语言智能技术取得的进展,其研究对促进自然语言理解的发展具有重要意义。虽然系统目前在一些数据集上已取得较好结果,但机器对语言的理解能力与人的预期还相差很远,一个重要原因就是数据集挑战性不够,使得模型缺乏解决复杂问题的能力。因此,本项目面向人类真实阅读场景复杂问题的解答技术,从以下几方面进行研究:.在阅读理解核心技术方面,针对问题理解、篇章理解、问题解答开展研究。(1)通过识别问题类型、问题主题和问题焦点,并引入重要词字典释义、Hownet义原等手段加强问题理解;(2)使用层级篇章表示加强篇章理解;(3)针对句子融合、文本生成等答案生成技术进行研究。.在复杂问题解答方面,主要围绕近几年北京高考阅读理解典型题目进行研究。(1)针对词义辨析题,提出了基于支持度计算的解决策略。(2)针对词义解释题,采用基于VAE-Transformer框架的解答策略,更好地捕捉对词语意义具有不同贡献的上下文信息。(3)针对观点评述题,提出基于篇章主题分析的解决策略。(4)针对问答题,提出基于候选句抽取-句子融合的解答框架,句子融合模块采用整数线性规划策略,兼顾信息量、问题关联度与句子流畅度。.在可解释评价方面,主要针对数据集可解释性不足,无法评价模型回答问题的中间过程进行研究。基于高考阅读理解题目构建了一个更具挑战性的数据集,通过在数据集中标注额外信息,要求系统输出这些信息来实现对系统中间推理过程的可解释评价。具体引入标注了三种信息:回答问题所需的证据句、不正确选项的错误原因、回答问题所需的推理能力。.本项目聚焦复杂问题解答技术,大量的实验表明,在问题理解、篇章理解、融合与生成、可解释评价方面提出的方法取得了明显有效的成果。通过本项目的研究,不仅可以促进汉语阅读理解技术的进步,而且进一步深刻洞察了机器在语义推理与答案生成方面的缺陷与关键问题,为未来深入开展汉语阅读理解技术的研究,推进自然语言理解技术的全面发展奠定了坚实的基础。
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(2)
基于时间片段和主题片段的时间关系识别
- DOI:--
- 发表时间:2017
- 期刊:山东大学学报(理学版)
- 影响因子:--
- 作者:赵红红;谭红叶;寻丽娜;王蓉
- 通讯作者:王蓉
基于代表性答案选择与注意力机制的短答案自动评分
- DOI:--
- 发表时间:2019
- 期刊:中文信息学报
- 影响因子:--
- 作者:谭红叶;午泽鹏;卢宇;段庆龙;李茹;张虎
- 通讯作者:张虎
Automatic short answer grading by encoding student responses via a graph convolutional network
通过图卷积网络对学生的回答进行编码,自动简答评分
- DOI:10.1080/10494820.2020.1855207
- 发表时间:2020-12
- 期刊:Interactive Learning Environments
- 影响因子:5.4
- 作者:Hongye Tan;Chong Wang;Qinglong Duan;Yu Lu;Hu Zhang;Ru Li
- 通讯作者:Ru Li
面向多类型问题的阅读理解方法研究
- DOI:--
- 发表时间:2020
- 期刊:中文信息学报
- 影响因子:--
- 作者:谭红叶;屈保兴
- 通讯作者:屈保兴
汉语阅读理解中词义判断题的解答研究
- DOI:--
- 发表时间:2018
- 期刊:计算机科学
- 影响因子:--
- 作者:谭红叶;吴宇飞
- 通讯作者:吴宇飞
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
中文分词中歧义切分处理策略
- DOI:--
- 发表时间:--
- 期刊:山西大学学报,2007.5,30(2):163-167
- 影响因子:--
- 作者:郑家恒;张剑锋;谭红叶
- 通讯作者:谭红叶
基于知识脉络的科技论文推荐
- DOI:--
- 发表时间:2016
- 期刊:山东大学学报(理学版)
- 影响因子:--
- 作者:谭红叶;要一璐;梁颖红
- 通讯作者:梁颖红
面向高考阅读理解鉴赏题语言风格判别方法
- DOI:--
- 发表时间:2017
- 期刊:中文信息学报
- 影响因子:--
- 作者:陈鑫;王素格;李德玉;谭红叶;陈千;王元龙
- 通讯作者:王元龙
汉语阅读理解词义判断题解答研究
- DOI:--
- 发表时间:--
- 期刊:计算机科学
- 影响因子:--
- 作者:谭红叶;武宇飞
- 通讯作者:武宇飞
基于不一致的汉语句法树库潜在错误查找
- DOI:--
- 发表时间:2015
- 期刊:山东大学学报(理学版)
- 影响因子:--
- 作者:谭红叶;赵健;陈千
- 通讯作者:陈千
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
谭红叶的其他基金
面向汉语考试阅读理解的推理与答案生成技术研究
- 批准号:
- 批准年份:2020
- 资助金额:58 万元
- 项目类别:面上项目
基于自动选择标注对象的汉语时间语义信息处理方法研究
- 批准号:61100138
- 批准年份:2011
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}