SaTC: CORE: Medium: Large-Scale Data Driven Anomaly Detection and Diagnosis from System Logs

SaTC:核心:中:大规模数据驱动的系统日志异常检测和诊断

基本信息

  • 批准号:
    1801446
  • 负责人:
  • 金额:
    $ 110万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-01 至 2023-07-31
  • 项目状态:
    已结题

项目摘要

Detecting unusual and anomalous behavior in computer systems is a critical part of ensuring they are secure and trustworthy. System logs, which record actions taken by programs, are a promising source of data for such anomaly detection. However, existing practices and tools for doing log analysis require deep expertise, as well as heavy human involvement in both defining and interpreting possible anomalies, which limits their scalability and effectiveness. This project's goal is to improve the state of the art around log-based anomaly detection by developing a framework called DeepLog through (a) advancing natural language processing techniques to extract structured information from a wide variety of log files to support analysis across different data sources and across time, (b) developing new methods to model legitimate workflows and log event sequences over time, (c) adapting machine learning methods to identify deviations from those workflows that represent potential anomalies, and (d) creating tools for system administrators to help them diagnose possible security issues more effectively and efficiently. The work will be integrated into a freely available software package to benefit both other researchers and practicing system administrators and used to support both classroom and research-based educational activities at the investigators' institutions.Toward log parsing, the team will adapt named entity recognition methods to parse unstructured logs as well as structured logs where the structure is not pre-defined by, e.g., regular expressions, into structured key-value pairs of log event types and parameters. This data can be seen as a multi-dimensional feature space whose contents are constrained by the execution of the underlying programs and thus reflects a hidden structure that defines the set of valid, non-anomalous execution sequences. To help articulate this hidden structure, the team will develop long-short-term-memory (LSTM)-based neural network models that use both the key and value elements to extract semantically meaningful subsequences of program behavior from data extracted from system runs known to be normal. Once these models are developed using known-good training data, they can be applied to anomaly detection by flagging for consideration new log entries that are unexpected given the current state of the system, logs, and model; they can also be used to infer the underlying workflows and hidden structures described earlier. These models will be improved through that online learning methods, administrators' feedback about the seriousness of reported anomalies, and generative adversarial training models which create execution sequences that, though anomalous, hew closely to the hidden structures embedded in the logs and the LSTM-based models.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
检测计算机系统中的异常行为是确保其安全和值得信赖的关键部分。记录程序所采取的操作的系统日志是此类异常检测的有前途的数据源。 然而,用于进行日志分析的现有实践和工具需要深厚的专业知识,以及大量人员参与定义和解释可能的异常,这限制了其可扩展性和有效性。 该项目的目标是通过开发一个名为 DeepLo​​g 的框架来提高基于日志的异常检测的技术水平:(a) 先进的自然语言处理技术从各种日志文件中提取结构化信息以支持跨不同数据源的分析随着时间的推移,(b) 开发新方法来建模合法工作流程并随时间记录事件序列,(c) 采用机器学习方法来识别与代表潜在异常的工作流程的偏差,以及 (d) 为系统管理员创建工具来帮助他们诊断可能的安全问题更加有效和高效。 这项工作将被集成到一个免费的软件包中,以使其他研究人员和执业系统管理员受益,并用于支持研究人员机构的课堂和基于研究的教育活动。对于日志解析,该团队将采用命名实体识别方法将非结构化日志以及结构未通过正则表达式等预定义的结构化日志解析为日志事件类型和参数的结构化键值对。 该数据可以看作是一个多维特征空间,其内容受到底层程序执行的约束,因此反映了定义有效、非异常执行序列集的隐藏结构。 为了帮助阐明这种隐藏结构,该团队将开发基于长短期记忆(LSTM)的神经网络模型,该模型使用键和值元素从已知的系统运行中提取的数据中提取程序行为的语义有意义的子序列。正常一点。 一旦使用已知良好的训练数据开发了这些模型,它们就可以通过标记考虑新的日志条目来应用于异常检测,这些日志条目在给定系统、日志和模型的当前状态下是意外的;它们还可以用于推断前面描述的底层工作流程和隐藏结构。 这些模型将通过在线学习方法、管理员对报告的异常严重性的反馈以及生成对抗训练模型来改进,这些模型创建执行序列,尽管异常,但密切关注嵌入在日志和基于 LSTM 中的隐藏结构该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Year of Automated Anomaly Detection in a Datacenter
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rufaida Ahmed;J. Porter;Abubaker Abdelmutalab;R. Ricci
  • 通讯作者:
    Rufaida Ahmed;J. Porter;Abubaker Abdelmutalab;R. Ricci
Right for the Right Reason: Evidence Extraction for Trustworthy Tabular Reasoning
正确的理由:为可信的表格推理提取证据
Learning Constraints for Structured Prediction Using Rectifier Networks
  • DOI:
    10.18653/v1/2020.acl-main.438
  • 发表时间:
    2020-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xingyuan Pan;Maitrey Mehta;Vivek Srikumar
  • 通讯作者:
    Xingyuan Pan;Maitrey Mehta;Vivek Srikumar
Augmenting Neural Networks with First-order Logic
  • DOI:
    10.18653/v1/p19-1028
  • 发表时间:
    2019-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tao Li;Vivek Srikumar
  • 通讯作者:
    Tao Li;Vivek Srikumar
Structured Tuning for Semantic Role Labeling
  • DOI:
    10.18653/v1/2020.acl-main.744
  • 发表时间:
    2020-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tao Li;Parth Anand Jawale;M. Palmer;Vivek Srikumar
  • 通讯作者:
    Tao Li;Parth Anand Jawale;M. Palmer;Vivek Srikumar
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Robert Ricci其他文献

Avoiding the Ordering Trap in Systems Performance Measurement
避免系统性能测量中的排序陷阱
Most Cited Computer Networks Articles
被引用最多的计算机网络文章
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Luigi Atzori;Antonio Iera;Giacomo Morabito;Michele Nitti;Wenye Wang;Zhuo Lu;M. Berman;Jeffrey S. Chase;Lawrence Landweber;Akihiro Nakao;Max Ott;Dipankar Raychaudhuri;Robert Ricci;I. Seskar;S. Sicari;A. Rizzardi;L. Grieco;A. Coen
  • 通讯作者:
    A. Coen

Robert Ricci的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Robert Ricci', 18)}}的其他基金

Collaborative Research: SII-NRDZ: ASPIRE: Advanced SPectrum Initiative for Research and Experimentation
合作研究:SII-NRDZ:ASPIRE:高级光谱研究和实验计划
  • 批准号:
    2232474
  • 财政年份:
    2022
  • 资助金额:
    $ 110万
  • 项目类别:
    Cooperative Agreement
CCRI: Planning-C: TopoCloud: A New Community Testbed With Unique Network Topology Flexibility
CCRI:Planning-C:TopoCloud:具有独特网络拓扑灵活性的新社区测试平台
  • 批准号:
    2213823
  • 财政年份:
    2022
  • 资助金额:
    $ 110万
  • 项目类别:
    Standard Grant
CloudLab Phase III: Expanding the Frontiers of Cloud Computing Through World-Class Community Infrastructure
CloudLab 第三阶段:通过世界一流的社区基础设施拓展云计算的前沿
  • 批准号:
    2027208
  • 财政年份:
    2020
  • 资助金额:
    $ 110万
  • 项目类别:
    Cooperative Agreement
CloudLab Phase II: Community Infrastructure To Expand the Frontiers of Cloud Computing Research
CloudLab 第二阶段:拓展云计算研究前沿的社区基础设施
  • 批准号:
    1743363
  • 财政年份:
    2017
  • 资助金额:
    $ 110万
  • 项目类别:
    Cooperative Agreement
CloudLab: Flexible Scientific Infrastructure to Support Fundamental Advances in Cloud Architectures and Applications
CloudLab:灵活的科学基础设施支持云架构和应用程序的根本性进步
  • 批准号:
    1419199
  • 财政年份:
    2014
  • 资助金额:
    $ 110万
  • 项目类别:
    Cooperative Agreement
The Sixteenth GENI Engineering Conference
第十六届GENI工程大会
  • 批准号:
    1304751
  • 财政年份:
    2013
  • 资助金额:
    $ 110万
  • 项目类别:
    Standard Grant
MRI: Development of Apt, A Testbed Instrument with Adaptable Profiles for Network and Computational Science
MRI:Apt 的开发,一种具有适用于网络和计算科学的适应性配置文件的测试台仪器
  • 批准号:
    1338155
  • 财政年份:
    2013
  • 资助金额:
    $ 110万
  • 项目类别:
    Standard Grant
CI-ADDO-EN: Enhancing Emulab for Virtualization and Clouds
CI-ADDO-EN:增强虚拟化和云的 Emulab
  • 批准号:
    1059440
  • 财政年份:
    2011
  • 资助金额:
    $ 110万
  • 项目类别:
    Standard Grant
Instructor's Reference Manual for Discovery Chemistry
发现化学教师参考手册
  • 批准号:
    9254016
  • 财政年份:
    1993
  • 资助金额:
    $ 110万
  • 项目类别:
    Standard Grant

相似国自然基金

中等质量丰中子核区的新核结构模型方法
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    18 万元
  • 项目类别:
    专项基金项目
伏隔核D1/D2共表达中等多棘神经元在孤独症小鼠社交奖赏障碍中的作用及机制研究
  • 批准号:
    81901381
  • 批准年份:
    2019
  • 资助金额:
    20.5 万元
  • 项目类别:
    青年科学基金项目
星系中心的中等质量黑洞研究
  • 批准号:
    11473062
  • 批准年份:
    2014
  • 资助金额:
    90.0 万元
  • 项目类别:
    面上项目
过渡区中等质量原子核结构的配对壳模型研究
  • 批准号:
    11305101
  • 批准年份:
    2013
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
中等和大质量黑洞的潮汐瓦解及其吸积与辐射
  • 批准号:
    10873015
  • 批准年份:
    2008
  • 资助金额:
    42.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: SaTC: CORE: Medium: Using Intelligent Conversational Agents to Empower Adolescents to be Resilient Against Cybergrooming
合作研究:SaTC:核心:中:使用智能会话代理使青少年能够抵御网络诱骗
  • 批准号:
    2330940
  • 财政年份:
    2024
  • 资助金额:
    $ 110万
  • 项目类别:
    Continuing Grant
Collaborative Research: SaTC: CORE: Medium: Differentially Private SQL with flexible privacy modeling, machine-checked system design, and accuracy optimization
协作研究:SaTC:核心:中:具有灵活隐私建模、机器检查系统设计和准确性优化的差异化私有 SQL
  • 批准号:
    2317232
  • 财政年份:
    2024
  • 资助金额:
    $ 110万
  • 项目类别:
    Continuing Grant
Collaborative Research: SaTC: CORE: Medium: Differentially Private SQL with flexible privacy modeling, machine-checked system design, and accuracy optimization
协作研究:SaTC:核心:中:具有灵活隐私建模、机器检查系统设计和准确性优化的差异化私有 SQL
  • 批准号:
    2317233
  • 财政年份:
    2024
  • 资助金额:
    $ 110万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Medium: Increasing user autonomy and advertiser and platform responsibility in online advertising
SaTC:核心:中:增加在线广告中的用户自主权以及广告商和平台责任
  • 批准号:
    2318290
  • 财政年份:
    2024
  • 资助金额:
    $ 110万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Medium: Testing the causal influence of social media on well-being and animosity
SaTC:核心:中:测试社交媒体对幸福感和敌意的因果影响
  • 批准号:
    2334148
  • 财政年份:
    2024
  • 资助金额:
    $ 110万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了