超过800万条软件/作品著作权公告信息!

提供基于中国版权保护中心以及各省市版权局著作权登记公告信息查询

一种基于列存储的区级数据压缩方法专利登记公告


专利名称:一种基于列存储的区级数据压缩方法

摘要:本发明涉及一种基于列存储的数据压缩方法,其特征在于包括以下步骤:步骤1、将按列存储的数据进一步划分为多个区;步骤2、为区中的数据定义一组统计信息;步骤3、利用步骤2中的统计信息,为每一个区按顺序定义一组统计量,进行该区数据分布特点的量化估计;步骤4、利用学习得到的区的统计量计算相邻两区之间的相似因子;步骤5、对于一列中的第一个区,依次计算各个统计量的值,采用逐步选择的方法,根据统计值进行压缩方法选择;步骤6、对于剩余第i个区,利用该区的统计值计算相邻两区之间的相似因子;若相似性较高,则直接沿用上一区的压缩

专利类型:发明专利

专利号:CN201210019945.9

专利申请(专利权)人:东华大学

专利发明(设计)人:乐嘉锦;王梅;夏小玲

主权项:一种基于列存储的区级数据压缩方法,其特征在于,步骤为:步骤1、对于按列列存储的数据,任意一个列Ai中的数据在逻辑上对应一个数据段Si,Si∈S,S为所有数据段的集合,将每个数据段均匀分为若干个区,区是一系列连续块的集合;步骤2、定义一组统计信息,记为集合Ti={t,o,s,a,d,n,c,l},其中t表示第i个区的数据类型,o表示i个区是否排序,r表示第i个区中item的数目,s表示区中相同值的数目,a表示区中相同值的总的item条数,d表示区中不同值的数,n表示区中空值的数目,c表示区中相同值连续的平均

专利地区:上海