面向数据挖掘的轨迹数据结构化表示研究
项目介绍
AI项目解读
基本信息
- 批准号:61772138
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:F0202.系统软件、数据库与工业软件
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:郑骁庆; 荆一楠; 王智慧; 单张卿; 吴昊; 冯国栋; 章瀚元; 韩韵衡; 李隋凯;
- 关键词:
项目摘要
In the applications of trajectory data mining, structural representation of unstructured trajectory data is a novel research area. Structural representations of trajectory data make it possible to adopt general data mining algorithms, which brings both effectiveness and efficiency to trajectory data mining tasks. There are some existing works on structural representation. For example, unstructured documents can be represented into fixed-dimension vectors in text mining field. However, the data handled is quite different from the trajectory data, which makes it hard to adopt those existing approaches. In this project, according to the data characteristics w.r.t. different data mining tasks, we first categorize the trajectory data into three classes, i.e., spatiotemporal, topological and semantic. Aiming at the data characteristics in each category, we then specifically design each model to represent the trajectory by a fixed-dimension vector or tensor. Because it is a structural representation, data mining task can now be independent on the feature representation. Meanwhile since the time complexity of the measure computation in vector space is quite small, the computation cost will also be largely reduced when mining large volume trajectory data.
在轨迹数据挖掘的应用中,非结构化轨迹数据的结构化表示是一个崭新的研究问题;在对轨迹进行结构化后,可以运用通用的数据挖掘算法,从而更高效地挖掘轨迹数据。已有的非结构化数据的结构化表示的技术,如文本挖掘领域,其研究对象与轨迹的特性具有很大的区别,使得已有技术无法在轨迹数据中起到效果。本项目根据轨迹数据挖掘所需要的信息特征将轨迹数据的表示归纳为三类:时空表示、拓扑表示和语义表示。针对每一类表示对应的数据挖掘任务,分别设计相应的方法将轨迹表示成固定维度的特征向量或张量,作为一种规范化的特征表示,实现特征表示与挖掘任务的职责分离;同时结构化向量空间中的度量计算代价很小,可大大降低海量轨迹数据挖掘的计算开销。
结项摘要
将非结构化的原始轨迹数据进行结构化表示是轨迹数据挖掘领域一个崭新的研究方向。在对轨迹进行结构化后,可以运用通用的机器学习算法进行更高效地数据分析和预测。本课题对轨迹数据所具有的信息特征进行归纳,针对不同的任务场景和问题需求设计了对应的轨迹表示方法,具体可以分为时空表示、拓扑表示和语义表示。这些轨迹表示方法可以将轨迹转化成固定维度的向量或者张量,作为轨迹的一种规范化的特征表示,从而广泛适用于各类下游应用和模型输入中。具体包括:(1)在轨迹的时空表示上,我们提出了一个新颖的轨迹表示方法,通过神经网络将轨迹映射到向量空间,并约束向量保持轨迹间的距离关系,最终在真实轨迹数据集上相较于已有工作提升了10%的准确率。我们还提出了多源轨迹表示模型。它通过多源数据融合和多尺度的卷积神经网络提取多层次的轨迹特征,得到丰富全面的轨迹信息表示。在真实数据上的地图生成实验显示,我们的方法可以提升5%以上的准确率。(2)在轨迹的拓扑表示上,我们提出了基于双向长短时记忆网络的轨迹表示模型,用于捕捉轨迹的整体拓扑特征。在行程时间估计问题上,我们的方法在真实数据集上可以将预估误差控制在13.3%,远好于其他已有工作。(3)在轨迹的语义表示上,我们提出了城市语义图谱模型,得到表示时空语义特征的轨迹张量,有效刻画了群体的出行模式。我们在上海市千万级别数据集中提取出了四千余条具有出行语义的群体迁移模式。本项目以如何将非结构化的轨迹数据有效结构化表示这一关键科学问题为研究对象,从时空、拓扑和语义三个角度完备地探索了结构化表示形式,并且各自提出了针对性的崭新技术方案。本项目的研究拓宽了轨迹的表示形式,提供了简洁统一的结构化表示,并且丰富了轨迹数据在数据科学领域的应用。.项目期间,录用和发表CCF A类论文9篇。培养博士生2名,硕士生7名,一篇博士学位论文获上海市计算机学会优秀博士学位论文、ACM China Council SIGMOD Chapter Doctoral Dissertation Award 和ACM China Council SIGSPATIAL Chapter Doctoral Dissertation Award。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(1)
会议论文数量(7)
专利数量(10)
路网空间下基于马尔可夫决策过程的异常车辆轨迹检测算法
- DOI:10.11897/sp.j.1016.2018.01928
- 发表时间:2018
- 期刊:计算机学报
- 影响因子:--
- 作者:毛江云;吴昊;孙未未
- 通讯作者:孙未未
Extract Human Mobility Patterns Powered by City Semantic Diagram
提取由城市语义图支持的人类流动模式
- DOI:10.1109/tkde.2020.3026235
- 发表时间:2022-08
- 期刊:IEEE Transactions on Knowledge and Data Engineering
- 影响因子:8.9
- 作者:Zhangqing Shan;Weiwei Sun;Baihua Zheng
- 通讯作者:Baihua Zheng
基于循环神经网络的轨迹压缩算法
- DOI:10.11896/jsjkx.191000194
- 发表时间:2020
- 期刊:计算机科学
- 影响因子:--
- 作者:励益韬;孙未未
- 通讯作者:孙未未
OPTICS与离线批处理在轨迹聚类中的应用
- DOI:10.19678/j.issn.1000-3428.0054309
- 发表时间:2020
- 期刊:计算机工程
- 影响因子:--
- 作者:郭雨;陈金勇;张新宇;李梁;孙未未
- 通讯作者:孙未未
CLSTERS: A General System for Reducing Errors of Trajectories Under Challenging Localization Situations
CLSTERS:一种在具有挑战性的定位情况下减少轨迹误差的通用系统
- DOI:10.1145/3130981
- 发表时间:2017-09-01
- 期刊:Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies
- 影响因子:--
- 作者:Hao Wu;Weiwei Sun;Wei Zhou
- 通讯作者:Wei Zhou
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于文档合并的XML无线数据广播调度算法
- DOI:--
- 发表时间:2011
- 期刊:计算机工程
- 影响因子:--
- 作者:吴晶晶;毛鼎鼎;朱良;张璞;孙未未
- 通讯作者:孙未未
基于位置的好友查询系统
- DOI:--
- 发表时间:2011
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:刘未末;陈坤杰;杜江帆;孙未未
- 通讯作者:孙未未
空间数据库中一种自适应的缓存替换策略
- DOI:--
- 发表时间:2011
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:陈坤杰;孙未未;朱良;刘未末
- 通讯作者:刘未末
无线数据广播环境下路网最近邻居节点的查询
- DOI:--
- 发表时间:2011
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:毛鼎鼎;孙未未;陈楚南;吴晶晶;刘未末;荆一楠
- 通讯作者:荆一楠
基于图嵌入框架的路网最优路径查询算法
- DOI:--
- 发表时间:2011
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:陈楚南;孙未未;陈翀
- 通讯作者:陈翀
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
孙未未的其他基金
轨迹预训练模型研究
- 批准号:
- 批准年份:2021
- 资助金额:61 万元
- 项目类别:面上项目
XML格式数据的无线广播技术研究
- 批准号:61073001
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
无线网络环境中数据广播技术研究
- 批准号:60503035
- 批准年份:2005
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}