基于自然语言理解和深度学习的类库规约的自动生成研究
项目介绍
AI项目解读
基本信息
- 批准号:61802166
- 项目类别:青年科学基金项目
- 资助金额:27.0万
- 负责人:
- 依托单位:
- 学科分类:F0203.软件理论、软件工程与服务
- 结题年份:2021
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2021-12-31
- 项目参与者:潘敏学; 司徒凌云; 王豫; 徐同同; 朱博伦; 刘拨杰; 刘毅达; 丁顺杰; 朱亚伟;
- 关键词:
项目摘要
Modern software systems are becoming increasingly complex, relying on a lot of third-party library support. Library behaviors are hence an integral part of software behaviors. Using libraries incorrectly can introduce potential software defects. .In order to ensure the reliability of the software, the client code that uses libraries must be analyzed when we verify the software. And in order to analyze the client code, we must have library specifications which play a significant role in many analysis techniques. Unfortunately, the library source code tends to be prohibitively large and has sophisticated implementation, making it really difficult to analyze. Moreover, the source code is often beyond reach. Consequently, efficiently and exactly generating specifications for libraries is an urgent issue. The proposed project aims to automatically generate library specifications from documentation which concisely describes the functionalities of the functions by leveraging techniques like natural language processing and statistical machine translation. However, the documentation is incomplete in some cases, which means we cannot generate specifications for such functions. As we know, there is a massive volume of code in the open-source community and the code contains the details of using libraries. Thus the project strives to mine the open-source code to generate library specifications via rule learning and long short term memory networks to complement and perfect the specifications generated from the documentation.
类库已经成为软件开发过程中必不可少的资源,类库的行为已经成为软件行为中不可分割的一部分,错误地使用类库将引入潜在的软件缺陷。为了保障软件系统的可靠性,在对软件系统进行分析验证时,必须对使用类库的客户代码进行分析验证,而对客户代码进行分析需要使用类库的规约,类库的规约在很多程序分析验证技术中都扮演着不可或缺的重要角色。然而,类库的源代码通常规模庞大、逻辑复杂,难以进行分析,有时甚至无法获取,因此,如何高效而准确地自动生成类库规约成为迫切需要解决的重要问题。本课题拟基于类库文档中包含的丰富而有效的信息,通过使用自然语言处理、统计机器翻译等技术进行分析来自动生成类库的规约。然而,类库文档可能存在信息不完整的情况,而开源社区中的海量代码包含了类库的使用细节,因此,本课题拟通过规则学习、长短期记忆神经网络等技术对开源代码进行学习来生成类库的规约,补充和完善所生成的类库规约。
结项摘要
无论是传统的软件系统还是智能软件系统,其可靠性和安全性都至关重要,因此,本项目的主要目标是提高软件系统的可靠性和安全性。具体而言,本项目从四个方面来增强软件的可靠性:第一,通过自动生成类库规约和智能家居系统的行为规约来辅助软件系统的分析验证,从而提高系统的可靠性。我们的方法为5个开源项目的511个函数生成了1145个程序规约,这些规约有效地提高了静态污点分析、自动化测试用例的生成等软件工程任务的效率和有效性;为智能家居的481个生活实例生成了形式化规约从而辅助系统的验证,提高了系统的安全性。第二,通过为代码元素自动传播得到代码注释来帮助发现代码缺陷,从而提高软件质量,我们的方法为5个开源项目生成了41573条新注释,正确性达88%,根据注释检测出37个代码缺陷,其中30个代码缺陷已经被开发人员确认并修复;第三,通过对深度神经网络开发中可能出现的工程性错误导致的模型缺陷进行检测和自动修复,从而提高智能软件的质量,对6个数据集,495个模型的评估表明我们的方法可以有效地检测出所有潜在问题,检测率达到100%,并且没有误报,另外可以修复其中97.33%的问题,平均提高47.08%的准确率;我们的方法还可以有效地提高所有模型的公平性,同时保持稳定的效用;第四,使用扩展的IFML模型对安卓应用进行测试来提高安卓应用的可靠性,通过对10个开源安卓应用进行测试,我们的方法可以达到68%的代码覆盖,并且发现了8个代码缺陷。本项目中大部分工作已经开源代码和数据。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(8)
专利数量(0)
Effective testing of Android apps using extended IFML models
使用扩展 IFML 模型有效测试 Android 应用
- DOI:10.1016/j.jss.2019.110433
- 发表时间:2020-01
- 期刊:Journal of Systems and Software
- 影响因子:3.5
- 作者:Pan Minxue;Lu Yifei;Pei Yu;Zhang Tian;Zhai Juan;Li Xu;ong
- 通讯作者:ong
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
元谋干热河谷冲沟沟头径流水动力学特性及产沙效应初探
- DOI:--
- 发表时间:2012
- 期刊:水土保持学报
- 影响因子:--
- 作者:熊东红;杨丹;翟娟;李佳佳;苏正安;董一帆;史亮涛
- 通讯作者:史亮涛
数值稳定性相关漏洞隐患的自动化检测方法
- DOI:10.13328/j.cnki.jos.005503
- 发表时间:2018
- 期刊:软件学报
- 影响因子:--
- 作者:沈维军;汤恩义;陈振宇;陈鑫;李彬;翟娟
- 通讯作者:翟娟
数值稳定性相关安全漏洞隐患的自动化检测方法
- DOI:--
- 发表时间:--
- 期刊:软件学报
- 影响因子:--
- 作者:沈维军;汤恩义;陈振宇;陈鑫;李彬;翟娟
- 通讯作者:翟娟
波长色散X射线荧光光谱法快速测定大气PM2.5中Cu和Zn的含量
- DOI:--
- 发表时间:2016
- 期刊:光谱学与光谱分析
- 影响因子:--
- 作者:王广西;李丹;葛良全;陈诚;赖万昌;翟娟;兰勇;胡杰;龙飞
- 通讯作者:龙飞
Multisim在核电子学虚拟仿真实验中的应用
- DOI:--
- 发表时间:2018
- 期刊:实验室研究与探索
- 影响因子:--
- 作者:杨强;刘军;翟娟;张庆贤;刘秋实
- 通讯作者:刘秋实
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}