基于分布熵的局部敏感哈希高维索引方法专利登记公告
专利名称:基于分布熵的局部敏感哈希高维索引方法
摘要:本发明提供了基于分布熵的局部敏感哈希高维索引方法。该方法首先生成局部敏感哈希函数候选集合。接着,根据训练数据集,计算局部敏感哈希函数候选集合中每个哈希函数的分布熵值,并从中选取分布熵值最高的L个哈希函数作为局部敏感哈希函数集合。然后,基于该局部敏感哈希函数集合,将待索引数据集存储到哈希表中。还可以采用基于三角不等式过滤和欧氏距离排序的查询算法查询上述哈希表,得到与查询数据相似的结果集。该方法通过选择分布熵值高的哈希函数,更好地适应了数据的分布,从而优化了哈希表索引结构,减小了索引的内存消耗,同时使得查询更
专利类型:发明专利
专利号:CN201110443604.X
专利申请(专利权)人:中国科学院计算技术研究所
专利发明(设计)人:张伟;高科;张勇东;李锦涛
主权项:一种局部敏感哈希高维索引方法,所述方法包括:步骤1)生成局部敏感哈希函数候选集合;步骤2)根据训练数据集,计算局部敏感哈希函数候选集合中每个哈希函数的分布熵值,并从中选取分布熵值最高的L个哈希函数作为局部敏感哈希函数集合;步骤3)基于该局部敏感哈希函数集合,将待索引数据集存储到哈希表中。
专利地区:北京
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。