基于用户日志进行查询推荐的方法及系统专利登记公告
专利名称:基于用户日志进行查询推荐的方法及系统
摘要:本发明公开了一种基于用户日志进行查询推荐的方法及系统,所述方法包括:根据用户日志中的数据集得到有效查询日志集合;选择典型查询串作为训练集,在有效查询日志集合中提取每个查询串的支持度、流行度、推荐度、共现度、相似度和关联度等六个特征指标,构建基于训练集的复合预测模型;对用户输入的查询串,提取候选查询串的六个特征指标,并将其作为变量输入到复合预测模型中,计算每一候选查询串与给定查询串的相关性大小,输出排序靠前的n个查询串;所述系统包括实现上述方法的数据准备模块、预测模型构建模块和处理输出模块。本发明充分利用搜
专利类型:发明专利
专利号:CN201110422562.1
专利申请(专利权)人:北京大学
专利发明(设计)人:王继民;李雷明子;王建冬
主权项:一种基于用户日志进行查询推荐的方法,其特征在于,包括以下步骤:S1:对搜索引擎用户日志中的数据集进行选择,并对所述选择的数据集进行预处理,得到有效查询日志集合,作为第一数据集;S2:提取第一数据集中每一个查询串的支持度、流行度和推荐度指标,选择满足这三个特征指标最小阈值的查询串与用户记录,作为第二数据集;S3:选择多个典型查询串作为训练数据,作为第一训练样本集;S4:对第一训练样本集中的每一查询串,在第二数据集提取具有一定共现度、相似度和关联度的查询串作为候选相关查询串,然后标注所述候选相关查询串与给定查
专利地区:北京
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。