面向功能挖掘的代码主题建模技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61472007
  • 项目类别:
    面上项目
  • 资助金额:
    80.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0203.软件理论、软件工程与服务
  • 结题年份:
    2018
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2018-12-31

项目摘要

Developers need to comprehend the functional concerns of a software system and the corresponding implementations in source code, before they reuse the source code. Recently, topic modeling-based source code comprehension has become one of the research hotspots. Most previous approaches take source code as plain text written in natural languages, and reuse the topic modeling techniques designed for plain text, which neglect the distinct characteristics of source code. It is difficult to determine the semantics of the topics mined from source code, and there are different categories of topics mixed together. Consequently, it is difficult for the developers to comprehend and apply the topics. In this project, we conduct research on topic modeling techniques for mining functional concerns from source code, which is focused on functional topics. Firstly, based on topic modeling techniques for plain text, we carry out improvements utilizing the characteristics of source code to construct new topic modeling techniques that are more suitable for source code, and we conduct research on categorizing topics mined from source code and identifying functional concerns. Then, we propose a new model to describe the topics and its associated artifacts. Based on the model, we further research specific techniques for describing the semantics of functional topics and establishing relationships among topics and its associated artifacts. Finally, we study mechanisms for developers to apply topics in software comprehension, software categorization, domain analysis, etc., implement the prototype system, and evaluate the effectiveness of our approach with open source software data and enterprise practices.
代码复用中,开发人员需要理解软件的功能及其代码实现。近年来,基于主题建模技术的代码理解方法成为研究热点之一。现有工作大多将代码作为普通文本,直接利用针对普通文本的主题建模技术,缺少对代码特点的考虑;并且挖掘出的主题语义不明确,多种类型主题混杂在一起,开发人员难以理解与应用。 本项目以功能性主题为核心,研究面向功能挖掘的代码主题建模技术。首先,在针对普通文本的主题建模技术基础上,结合软件代码静态结构与动态行为特点进行改进,提出适合代码的主题建模技术,并研究区分不同类型主题及识别功能性主题的技术;进而,构建主题及其关联实体描述模型,在此基础上研究描述功能性主题语义的技术,并建立主题-主题之间、主题-关联实体之间关联关系。最后,研究基于主题的代码理解、软件分类、领域分析等应用技术,并研制相应的原型系统,利用开源软件数据和企业实践进行技术验证。

结项摘要

代码复用中,开发人员需要理解软件的功能及其代码实现。基于主题建模技术的代码理解方法已成为近年来研究热点之一。现有工作大多将代码作为普通文本,直接利用针对普通文本的主题建模技术,缺少对代码特点的考虑;并且挖掘出的主题语义不明确,多种类型主题混杂在一起,开发人员难以理解与应用。本项目针对上述问题,以功能性主题为核心,研究了面向功能挖掘的代码主题建模技术。.本项目从互联网上收集了不同类别、不同规模的开源软件项目资源,针对这些资源进行了主题建模技术方面的研究。首先,针对所收集的软工数据高维稀疏的特征,以及其结构化、半结构化的特征,重点开展了主题建模技术的改进方法研究,以及基于改进张量分解技术的稀疏数据处理方法。在针对普通文本的主题建模技术基础上,结合软件代码静态结构与动态行为特点进行了改进,对现有的主题建模技术进行了改进与扩展,使其可以处理多关联关系以及属性值情况的软工数据。.进而,研究了主题建模技术的计算机制、参数设定、主题词权重判定、主题描述自动生成等工作,并结合软件知识图谱构造技术,研究了主题-主题之间、主题-关联实体之间关联关系的构建技术,构建了主题及其关联实体描述模型,在此基础上研究了描述功能性主题语义的技术,研究了基于主题建模技术的代码主题摘要自动生成方法。将所提炼的功能性主题作为知识图谱中的成分加入其中,构建了一个具有可扩展性的、更适合代码特点的主题及其关联实体描述模型,基于此模型,研究了智能检索与问答技术。.最后,基于上述研究,设计并实现了一个基于扩展主题模型的多源数据分析平台,通过所采集的开源项目数据验证了方法的有效性,并将研究成果应用到神州数码等软件企业中,验证了原型工具的实际应用效果。.本项目共发表论文10篇,发布专利2项申请专利1项,获得软件著作权2项,培养1名博士生、4名硕士生,5名本科生。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(3)
面向开源软件项目的软件知识图谱构建方法
  • DOI:
    doi:10.3778/j.issn.1673-9418.1609026
  • 发表时间:
    2017
  • 期刊:
    计算机科学与探索
  • 影响因子:
    --
  • 作者:
    李文鹏;王建彬;林泽琦;赵俊峰;邹艳珍;谢冰
  • 通讯作者:
    谢冰
一种基于图数据库的代码结构解析与搜索方法
  • DOI:
    doi:10.7544/issn1000-1239.2016.20148325
  • 发表时间:
    2016
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    林泽琦;赵俊峰;谢冰
  • 通讯作者:
    谢冰
Mining Patterns of Disease Progression: A Topic-Model-Based Approach
挖掘疾病进展模式:基于主题模型的方法
  • DOI:
    10.1016/j.medj.2021.04.013
  • 发表时间:
    2016
  • 期刊:
    Studies in health technology and informatics
  • 影响因子:
    --
  • 作者:
    Lingxiao Zhang;Junfeng Zhao;Yasha Wang;Bing Xie
  • 通讯作者:
    Bing Xie
基于LDA的软件代码主题摘要自动生成方法
  • DOI:
    10.11896/j.issn.1002-137x.2017.04.008
  • 发表时间:
    2017
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    李文鹏;赵俊峰;谢冰
  • 通讯作者:
    谢冰
基于可扩展主题建模技术的多源数据分析框架
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机科学与探索
  • 影响因子:
    --
  • 作者:
    唐爽;张灵箫;赵俊峰;谢冰;邹艳珍
  • 通讯作者:
    邹艳珍

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

鄂尔多斯盆地直罗组—安定组沉积期原始边界恢复
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    地质学报
  • 影响因子:
    --
  • 作者:
    赵俊峰;3) School of Petroleum Resources;Xi’an Shiyou Univ;4) Geophysical Research Institute of Bureau of Geo;5) Tianjin Branch;CNOOC;Tianjin;300452;刘池洋;梁积伟;王晓梅;喻林;黄雷;刘永涛;ZHAO Junfeng1);LIU Chiyang1);LIANG Jiwei2);WANG Xi;2) Open Laboratory of Mineralization
  • 通讯作者:
    2) Open Laboratory of Mineralization
基于HTK 的宁夏银川方言普通话语音识别系统
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    农业网络信息
  • 影响因子:
    --
  • 作者:
    赵俊峰;诸叶平
  • 通讯作者:
    诸叶平
南华北地区上古生界热演化史恢复
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    石油与天然气地质
  • 影响因子:
    --
  • 作者:
    赵俊峰;刘池洋;刘永涛;何争光;毛伟;朱斌;Zhao Junfeng1;2;Liu Chiyang1;2;Liu Yongtao3;He Zhe;2.School of Geosciences;Northwest University;Xi’an;3.Institute of CNPC BGP INC.;Zhuozhou;Hebei 072751
  • 通讯作者:
    Hebei 072751
富烃凹陷特征及其形成研究现状与问题
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    地学前缘
  • 影响因子:
    --
  • 作者:
    刘池洋;赵俊峰;马艳萍;王建强;熊林芳;陈建军;毛光周;张东东;邓煜
  • 通讯作者:
    邓煜
鄂尔多斯盆地北部侏罗系直罗组沉积特征与演化
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    古地理学报
  • 影响因子:
    --
  • 作者:
    薛锐;赵俊峰;闫占冬;杨瑶;赵旭东;赵中平
  • 通讯作者:
    赵中平

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

赵俊峰的其他基金

知识增强的“急危重症”智能辅助诊疗模型与技术
  • 批准号:
    62172011
  • 批准年份:
    2021
  • 资助金额:
    60 万元
  • 项目类别:
    面上项目
Web Service QoS的多维多尺度模型及评估、预测方法的研究
  • 批准号:
    60803011
  • 批准年份:
    2008
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码