BIGDATA: F: Collaborative Research: Collective Mining of Vertical Social Communities

BIGDATA:F:协同研究:垂直社交社区的集体挖掘

基本信息

  • 批准号:
    1838145
  • 负责人:
  • 金额:
    $ 42.79万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-09-15 至 2024-08-31
  • 项目状态:
    已结题

项目摘要

A large fraction of internet social media content is found in thousands of specialized communities that are hosted by news outlets, typically in the form of reader forums or comments on news articles. The users of the such a site are said to form a vertical social community (VSC), because they deeply engage with a single media source. While each VSC is tiny compared to broad communities such as Facebook, they are important because they expose how different segments of society feel about various world events. This can be a very useful resource for downstream intelligence and predictive analytics. However, current web crawlers cannot effectively access VSCs. Thus their data is invisible to search engines, and remains hidden from analytics tools. The goals of this project are to enable effective access to vertical social communities coalesced at news reports online, and to mine their comments and debates. This project will provide researchers with tools to collect data from these communities and analyze them. The educational component of the project includes the involvement of graduate and undergraduate student training and research and the incorporation of research projects and results in courses.The researchers will develop algorithms to unearth the content generated at thousands of vertical social communities and make their content transparently accessible to data management and analytics tools. The researchers will develop novel deep learning techniques for content detection, and build a novel scalable end-to-end system for real-time access and collective mining of these communities, capable of handling large parallel data streams based on shifting ideas. The specific algorithms will include user population estimation, bootstrap communication patterns for automatic crawling of content, and fine-grained sentiment analysis for intelligence and predictive analytics. Software tools will be made available to researchers in academe and industry. Distribution of free, open-source software for implementing the techniques developed will enhance existing research infrastructure.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在数千个由新闻媒体主持的专业社区中发现了很大一部分的互联网社交媒体内容,通常是以读者论坛的形式或新闻文章的评论。据说该网站的用户形成了垂直社会社区(VSC),因为它们与单个媒体来源深入互动。 尽管与Facebook等广泛社区相比,每个VSC都很小,但它们很重要,因为它们揭示了社会对各种世界活动的不同感受。对于下游智能和预测分析,这可能是非常有用的资源。 但是,当前的Web爬网无法有效访问VSC。因此,它们的数据对于搜索引擎是看不见的,并且仍然隐藏在分析工具中。 该项目的目标是使在线新闻报道中合并的垂直社会社区有效访问,并挖掘他们的评论和辩论。该项目将为研究人员提供从这些社区收集数据并分析它们的工具。 该项目的教育组成部分包括研究生和本科生培训和研究的参与以及研究项目的合并和课程的合并。研究人员将开发算法,以发掘成千上万个垂直社会社区生成的内容,并使他们的内容可透明地访问用于数据管理和分析工具。研究人员将开发出新颖的深度学习技术来进行内容检测,并建立一个新颖的可扩展端到端系统,以实时访问和这些社区的集体采矿,能够根据变化的想法处理大型平行数据流。特定的算法将包括用户人口估计,自动爬行内容的引导性通信模式以及用于智能和预测分析的细粒情感分析。软件工具将提供给学术界和行业的研究人员。分发免费的开源软件用于实施开发的技术将增强现有的研究基础架构。该奖项反映了NSF的法定任务,并且使用基金会的知识分子优点和更广泛的影响审查标准,被认为值得通过评估来获得支持。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
MultiLayerET: A Unified Representation of Entites and Topics Using Multilayer Graphs
MultiLayerET:使用多层图的实体和主题的统一表示
On the Usefulness of Personality Traits in Opinion-oriented Tasks
  • DOI:
    10.26615/978-954-452-072-4_062
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Marjan Hosseinia;E. Dragut;Dainis Boumber;Arjun Mukherjee
  • 通讯作者:
    Marjan Hosseinia;E. Dragut;Dainis Boumber;Arjun Mukherjee
Pro/Con: Neural Detection of Stance in Argumentative Opinion
赞成/反对:论证性意见中立场的神经检测
On the dynamics of user engagement in news comment media
论新闻评论媒体的用户参与动态
  • DOI:
    10.1002/widm.1342
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    He, Lihong;Han, Chao;Mukherjee, Arjun;Obradovic, Zoran;Dragut, Eduard
  • 通讯作者:
    Dragut, Eduard
Improving Evidence Retrieval with Claim-Evidence Entailment
  • DOI:
    10.26615/978-954-452-072-4_174
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fan Yang;E. Dragut;Arjun Mukherjee
  • 通讯作者:
    Fan Yang;E. Dragut;Arjun Mukherjee
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Eduard Dragut其他文献

Eduard Dragut的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Eduard Dragut', 18)}}的其他基金

Proto-OKN Theme 1: Knowledge Graph to Support Evaluation and Development of Climate Models
Proto-OKN 主题 1:支持气候模型评估和开发的知识图
  • 批准号:
    2333789
  • 财政年份:
    2023
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Cooperative Agreement
NSF Convergence Accelerator Track F: America's Fourth Estate at Risk: A System for Mapping the (Local) Journalism Life Cycle to Rebuild the Nation's News Trust
NSF 融合加速器轨道 F:美国第四产业面临风险:绘制(本地)新闻生命周期图以重建国家新闻信任的系统
  • 批准号:
    2137846
  • 财政年份:
    2021
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: Extracting and Linking AI Artifacts
III:媒介:协作研究:提取和链接人工智能工件
  • 批准号:
    2107213
  • 财政年份:
    2021
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Continuing Grant
BIGDATA: Collaborative Research: F: Streaming Architecture for Continuous Entity Linking in Social Media
BIGDATA:协作研究:F:社交媒体中连续实体链接的流架构
  • 批准号:
    1546480
  • 财政年份:
    2016
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Standard Grant

相似国自然基金

数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
  • 批准号:
    72372084
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
颅颌面手术机器人辅助半面短小牵张成骨术的智能规划与交互协作研究
  • 批准号:
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
面向自主认知与群智协作的多智能体制造系统关键技术研究
  • 批准号:
    52305539
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
大规模物联网多协作绿色信息感知和智慧响应决策一体化方法研究
  • 批准号:
    62371149
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
多UAV协作的大规模传感网并发充电模型及其服务机制研究
  • 批准号:
    62362017
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
  • 批准号:
    2034479
  • 财政年份:
    2020
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
  • 批准号:
    2027516
  • 财政年份:
    2020
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Practical Analysis of Large-Scale Data with Lyme Disease Case Study
BIGDATA:F:协作研究:莱姆病案例研究大规模数据的实际分析
  • 批准号:
    1934319
  • 财政年份:
    2019
  • 资助金额:
    $ 42.79万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了