本文已参加「新人创造礼」活动,一起开启创造之路。
TITLE: TrajStore: An Adaptive Storage System for Very Large Trajectory Data Sets
KEY:[2010] [ICDE]
PDF: dspace.mit.edu/bitstream/1…
一、概述
TrajStore 是一种存储系统,它被设计用来切割轨迹和共同定位在地舆和时刻上相邻的轨迹段。它将轨迹切割成合适时空区域的子轨迹,并在磁盘上的一个块(或块的调集)中符号关于每个区域的数据。它在这些块上运用自适应的多层次网格来查找空间中的数据。通过这种方法,大多数查询能够通过从磁盘中读取几个块来答复,即使这些块包括来自数百或数千个轨迹的数据;
二、原理
2.1 多级网格划分
- 将空间切割成一系列最优巨细的矩形,以检索大量与空间相关的子轨迹;
- 一种自适应的多级网格划分,提高查询效率,在轨迹密布的区域价值会昂贵些,因为要避免与拜访剩余区域相关的任何开支;大单元格不足以进行较小的查询,因为它们包括许多不与查询相交的段。
- 另一方面,较小的单元格需要更多的磁盘来寻求检索给定的空间区域,并产生更多的分裂;
- 每个单元格的信息被保存在一个动态四叉树中,其单元格指向存储数据的一系列页面;
- 动态方法切割区域,以最小化包括片段的单元格中的空白空间
2.2 聚类+增量编码紧缩
-
一种有损紧缩计划对在简直相同途径上运转的轨迹进行聚类,并存储所有轨迹的单一代表性空间途径以及聚类中每个轨迹的时刻偏移调集;
-
一种无损的三角洲紧缩计划来对轨迹内连续的时刻和空间坐标进行编码;
-
聚类机制在我们的途径轨迹数据集的背景下特别有用,其间不同的轿车一遍又一遍地驾驶相同的路途和途径,这导致了大量的冗余;
-
这种方法不依赖于底层的路途几许地图来识别和聚集相关的轨迹,虽然世界上一些地区有这样的路线图,但随着路途的变化,它们有必要及时更新,并且不能为行人或越野轨迹作业,这限制了它们的用途。
三、总结
- 作者的思路很有意思,根据网格来对轨迹进行存储和管理;
- 通过时刻映射+聚类来时刻多轨迹紧缩,但这个效率并不高,我在我的论文中对作者的方向进行了比较