一种基于列存储的区级数据压缩方法专利登记公告
专利名称:一种基于列存储的区级数据压缩方法
摘要:本发明涉及一种基于列存储的数据压缩方法,其特征在于包括以下步骤:步骤1、将按列存储的数据进一步划分为多个区;步骤2、为区中的数据定义一组统计信息;步骤3、利用步骤2中的统计信息,为每一个区按顺序定义一组统计量,进行该区数据分布特点的量化估计;步骤4、利用学习得到的区的统计量计算相邻两区之间的相似因子;步骤5、对于一列中的第一个区,依次计算各个统计量的值,采用逐步选择的方法,根据统计值进行压缩方法选择;步骤6、对于剩余第i个区,利用该区的统计值计算相邻两区之间的相似因子;若相似性较高,则直接沿用上一区的压缩
专利类型:发明专利
专利号:CN201210019945.9
专利申请(专利权)人:东华大学
专利发明(设计)人:乐嘉锦;王梅;夏小玲
主权项:一种基于列存储的区级数据压缩方法,其特征在于,步骤为:步骤1、对于按列列存储的数据,任意一个列Ai中的数据在逻辑上对应一个数据段Si,Si∈S,S为所有数据段的集合,将每个数据段均匀分为若干个区,区是一系列连续块的集合;步骤2、定义一组统计信息,记为集合Ti={t,o,s,a,d,n,c,l},其中t表示第i个区的数据类型,o表示i个区是否排序,r表示第i个区中item的数目,s表示区中相同值的数目,a表示区中相同值的总的item条数,d表示区中不同值的数,n表示区中空值的数目,c表示区中相同值连续的平均
专利地区:上海
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。