面向数据挖掘的轨迹数据结构化表示研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61772138
  • 项目类别:
    面上项目
  • 资助金额:
    63.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0202.系统软件、数据库与工业软件
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

In the applications of trajectory data mining, structural representation of unstructured trajectory data is a novel research area. Structural representations of trajectory data make it possible to adopt general data mining algorithms, which brings both effectiveness and efficiency to trajectory data mining tasks. There are some existing works on structural representation. For example, unstructured documents can be represented into fixed-dimension vectors in text mining field. However, the data handled is quite different from the trajectory data, which makes it hard to adopt those existing approaches. In this project, according to the data characteristics w.r.t. different data mining tasks, we first categorize the trajectory data into three classes, i.e., spatiotemporal, topological and semantic. Aiming at the data characteristics in each category, we then specifically design each model to represent the trajectory by a fixed-dimension vector or tensor. Because it is a structural representation, data mining task can now be independent on the feature representation. Meanwhile since the time complexity of the measure computation in vector space is quite small, the computation cost will also be largely reduced when mining large volume trajectory data.
在轨迹数据挖掘的应用中,非结构化轨迹数据的结构化表示是一个崭新的研究问题;在对轨迹进行结构化后,可以运用通用的数据挖掘算法,从而更高效地挖掘轨迹数据。已有的非结构化数据的结构化表示的技术,如文本挖掘领域,其研究对象与轨迹的特性具有很大的区别,使得已有技术无法在轨迹数据中起到效果。本项目根据轨迹数据挖掘所需要的信息特征将轨迹数据的表示归纳为三类:时空表示、拓扑表示和语义表示。针对每一类表示对应的数据挖掘任务,分别设计相应的方法将轨迹表示成固定维度的特征向量或张量,作为一种规范化的特征表示,实现特征表示与挖掘任务的职责分离;同时结构化向量空间中的度量计算代价很小,可大大降低海量轨迹数据挖掘的计算开销。

结项摘要

将非结构化的原始轨迹数据进行结构化表示是轨迹数据挖掘领域一个崭新的研究方向。在对轨迹进行结构化后,可以运用通用的机器学习算法进行更高效地数据分析和预测。本课题对轨迹数据所具有的信息特征进行归纳,针对不同的任务场景和问题需求设计了对应的轨迹表示方法,具体可以分为时空表示、拓扑表示和语义表示。这些轨迹表示方法可以将轨迹转化成固定维度的向量或者张量,作为轨迹的一种规范化的特征表示,从而广泛适用于各类下游应用和模型输入中。具体包括:(1)在轨迹的时空表示上,我们提出了一个新颖的轨迹表示方法,通过神经网络将轨迹映射到向量空间,并约束向量保持轨迹间的距离关系,最终在真实轨迹数据集上相较于已有工作提升了10%的准确率。我们还提出了多源轨迹表示模型。它通过多源数据融合和多尺度的卷积神经网络提取多层次的轨迹特征,得到丰富全面的轨迹信息表示。在真实数据上的地图生成实验显示,我们的方法可以提升5%以上的准确率。(2)在轨迹的拓扑表示上,我们提出了基于双向长短时记忆网络的轨迹表示模型,用于捕捉轨迹的整体拓扑特征。在行程时间估计问题上,我们的方法在真实数据集上可以将预估误差控制在13.3%,远好于其他已有工作。(3)在轨迹的语义表示上,我们提出了城市语义图谱模型,得到表示时空语义特征的轨迹张量,有效刻画了群体的出行模式。我们在上海市千万级别数据集中提取出了四千余条具有出行语义的群体迁移模式。本项目以如何将非结构化的轨迹数据有效结构化表示这一关键科学问题为研究对象,从时空、拓扑和语义三个角度完备地探索了结构化表示形式,并且各自提出了针对性的崭新技术方案。本项目的研究拓宽了轨迹的表示形式,提供了简洁统一的结构化表示,并且丰富了轨迹数据在数据科学领域的应用。.项目期间,录用和发表CCF A类论文9篇。培养博士生2名,硕士生7名,一篇博士学位论文获上海市计算机学会优秀博士学位论文、ACM China Council SIGMOD Chapter Doctoral Dissertation Award 和ACM China Council SIGSPATIAL Chapter Doctoral Dissertation Award。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(1)
会议论文数量(7)
专利数量(10)
路网空间下基于马尔可夫决策过程的异常车辆轨迹检测算法
  • DOI:
    10.11897/sp.j.1016.2018.01928
  • 发表时间:
    2018
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    毛江云;吴昊;孙未未
  • 通讯作者:
    孙未未
Extract Human Mobility Patterns Powered by City Semantic Diagram
提取由城市语义图支持的人类流动模式
  • DOI:
    10.1109/tkde.2020.3026235
  • 发表时间:
    2022-08
  • 期刊:
    IEEE Transactions on Knowledge and Data Engineering
  • 影响因子:
    8.9
  • 作者:
    Zhangqing Shan;Weiwei Sun;Baihua Zheng
  • 通讯作者:
    Baihua Zheng
基于循环神经网络的轨迹压缩算法
  • DOI:
    10.11896/jsjkx.191000194
  • 发表时间:
    2020
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    励益韬;孙未未
  • 通讯作者:
    孙未未
OPTICS与离线批处理在轨迹聚类中的应用
  • DOI:
    10.19678/j.issn.1000-3428.0054309
  • 发表时间:
    2020
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    郭雨;陈金勇;张新宇;李梁;孙未未
  • 通讯作者:
    孙未未
CLSTERS: A General System for Reducing Errors of Trajectories Under Challenging Localization Situations
CLSTERS:一种在具有挑战性的定位情况下减少轨迹误差的通用系统
  • DOI:
    10.1145/3130981
  • 发表时间:
    2017-09-01
  • 期刊:
    Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies
  • 影响因子:
    --
  • 作者:
    Hao Wu;Weiwei Sun;Wei Zhou
  • 通讯作者:
    Wei Zhou

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于文档合并的XML无线数据广播调度算法
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    吴晶晶;毛鼎鼎;朱良;张璞;孙未未
  • 通讯作者:
    孙未未
基于位置的好友查询系统
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    刘未末;陈坤杰;杜江帆;孙未未
  • 通讯作者:
    孙未未
空间数据库中一种自适应的缓存替换策略
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    陈坤杰;孙未未;朱良;刘未末
  • 通讯作者:
    刘未末
无线数据广播环境下路网最近邻居节点的查询
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    毛鼎鼎;孙未未;陈楚南;吴晶晶;刘未末;荆一楠
  • 通讯作者:
    荆一楠
基于图嵌入框架的路网最优路径查询算法
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    陈楚南;孙未未;陈翀
  • 通讯作者:
    陈翀

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

孙未未的其他基金

轨迹预训练模型研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    61 万元
  • 项目类别:
    面上项目
XML格式数据的无线广播技术研究
  • 批准号:
    61073001
  • 批准年份:
    2010
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
无线网络环境中数据广播技术研究
  • 批准号:
    60503035
  • 批准年份:
    2005
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码