中英文论文中的中国作者姓名消歧研究
项目介绍
AI项目解读
基本信息
- 批准号:71473236
- 项目类别:面上项目
- 资助金额:59.0万
- 负责人:
- 依托单位:
- 学科分类:G0403.科技管理与政策
- 结题年份:2018
- 批准年份:2014
- 项目状态:已结题
- 起止时间:2015-01-01 至2018-12-31
- 项目参与者:郭玉; 俞征鹿; 高继平; 凌锋; 贾佳; 高晓培; 田瑞强; 岳晓旭;
- 关键词:
项目摘要
For any work of literature, a fundamental issue is to identify the individual(s) who wrote it, and conversely, to identify all of the works that belong to a given individual. Attribution would seem to be a simple process and yet it represents a major, unsolved problem for information science. It is more difficult to identify the Chinese author's English name. This project focuses on Chinese author name disambiguation who wrote Chinese and English Papers. We analysis papers and authorship characteristics, combined with the nature of the characteristics of the existing algorithms, design of machine learning algorithms. Specific analysis include: based on the unique characteristics of author name disambiguation, propose the evolution of the field and co-author network of author name disambiguation, integrating existing Chinese information to assist the English of author name disambiguation, especially identify the different data sets but the author have the same name in English, to reduce the scale of same name in English. The project is the research focus of the field of information science, bibliometrics, web search, natural language processing and information extraction in recent years. Solution of the problem to the literature data retrieval and evaluation based on bibliometrics advance to the micro-individual level, can provide data to support the personnel evaluation, preventing the phenomenon of academic false and academic fraud, has a wide application background and development prospects.
作者姓名消歧是科技评价、科学计量学、数字图书馆、信息检索等领域当前急需但是尚未解决的基本问题之一。越来越多的中国学者同时发表中、英文论文,但是中国作者的英文姓名音译、简写后重名现象更加严重,中国作者中、英姓名消歧就更加复杂和困难。本项目提出寻找拥有共同中文姓名或共同英文姓名的中国作者所发表论文的真正作者智能算法。该算法主要包括中、英文论文中基于唯一性特征的作者姓名消歧算法,改进的合著网络和作者领域演化的姓名消歧算法等。在进行英文姓名消歧时,集成利用中文论文信息,减少英文同名数据集的规模,提高姓名消歧效率。这些问题大多数是对此领域的新探索,对于发展和完善作者姓名消歧的理论与方法有较大的意义。该问题的解决可以把基于科学计量学的评价和文献检索推进到微观的个人层面,可以为学科发展、科研评价、产出分析、机构测度、人才评价、成果管理、信息搜索等提供更准确的数据支撑,具有广泛的应用背景和发展前景。
结项摘要
作者姓名消歧是科技评价、科学计量学、数字图书馆、信息检索等领域当前急需但是尚未解决的基本问题之一。本项目定位于寻找拥有共同中文姓名或共同英文姓名的中国作者所发表论文的真正作者的自动算法。项目组首先基于自建的“中国科技论文统计与引文数据库”构建了发文最多的50位作者姓名的论文(863864篇)、引文数据库(5843292条)。针对论文作者这一固定、较为封闭的群体,设计中英文姓名对照辞典及中国人名汉语拼音字母拼写法,在语料库的基础上设计与实现论文作者姓名中英自动翻译模型,规避了复姓、多音字、生僻字等一些复杂情况。设计唯一性特征辨识法进行初步消歧形成论文种子集合,唯一性特征辨识法综合了单一性唯一性特征Email以及复合相对唯一性特征研究机构。针对论文元数据中各字段缺失情况非常严重,会导致算法失效现象,通过构建字段辨识度贡献度评价体系并设计组合的唯一性指标,建立了一个基于BP神经网络的作者重名辨识算法。构建了指标评价体系和优先级框架,建立了一系列合适的分类规则。在唯一性特征基础上,根据合作者、机构、摘要、关键词、标题的层次聚类进行姓名消歧。采用凝聚的层次聚类方法AGNES算法,设计聚类停止节点决策方法对合著、学科演化等进行聚类分析。分别利用作者的信息特征、文章主题、作者合作网络的聚类分析实现中英文数据的对接,然后通过综合模糊评价指标的设计实现对人员信息的有效融合和准确消歧。并在专家社会关系、人才评价、图书评价、国际科技合作、高校排行、期刊评价、科研诚信等领域开展实证研究。
项目成果
期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(6)
专利数量(0)
我国科研诚信研究发展概述:科学计量学视角
- DOI:10.13943/j.issn1671-4547.2017.06.04
- 发表时间:2017
- 期刊:国防科技
- 影响因子:--
- 作者:袁军鹏;淮孟姣;潘云涛;许震
- 通讯作者:许震
科研项目负责人的信用评价指标体系建设研究
- DOI:--
- 发表时间:2017
- 期刊:数据分析与知识发现
- 影响因子:--
- 作者:淮孟姣;潘云涛;袁军鹏
- 通讯作者:袁军鹏
一种面向社会关系的同行评议方法
- DOI:--
- 发表时间:2017
- 期刊:科技管理研究
- 影响因子:--
- 作者:王贤慧;袁军鹏
- 通讯作者:袁军鹏
技术领域中的专利知识群分析——以SIPOD中的H04L领域为例
- DOI:10.16353/j.cnki.1000-7490.2015.06.017
- 发表时间:2015
- 期刊:情报理论与实践
- 影响因子:--
- 作者:高继平;丁堃;潘云涛;袁军鹏
- 通讯作者:袁军鹏
零被引研究文献的知识图谱分析──历史发展脉络、主体和高频主题
- DOI:10.13833/j.cnki.is.2016.03.018
- 发表时间:2016
- 期刊:情报科学
- 影响因子:--
- 作者:胡泽文;武夷山;袁军鹏
- 通讯作者:袁军鹏
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于Apriori算法的多循环关联规则挖掘综述
- DOI:--
- 发表时间:--
- 期刊:计算机科学
- 影响因子:--
- 作者:袁军鹏;朱东华
- 通讯作者:朱东华
技术监测指标研究及其实证分析
- DOI:--
- 发表时间:--
- 期刊:科学学研究
- 影响因子:--
- 作者:朱东华;袁军鹏
- 通讯作者:袁军鹏
面向科研立项评估的技术监测和技术机会分析研究
- DOI:--
- 发表时间:--
- 期刊:科研管理
- 影响因子:--
- 作者:朱东华;袁军鹏;李石柱
- 通讯作者:李石柱
世界期刊年龄的多角度比较与分析基于乌利希期刊指南数据
- DOI:--
- 发表时间:--
- 期刊:科学学研究
- 影响因子:--
- 作者:魏瑞斌;武夷山;袁军鹏
- 通讯作者:袁军鹏
学术期刊的引用认同分析以Scientometrics为例
- DOI:--
- 发表时间:--
- 期刊:情报杂志
- 影响因子:--
- 作者:王丽;袁军鹏;王娜;潘云涛
- 通讯作者:潘云涛
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}