一种自动处理网页文本的内链的方法及装置专利登记公告
专利名称:一种自动处理网页文本的内链的方法及装置
摘要:本发明提供了一种自动处理网页文本的内链的方法,包括步骤:a.获取用户行为日志;b.根据所述行为日志统计所述网页文本的点击数据;c.根据所述点击数据判断所述网页文本是否满足删除条件,以得到待删除内链的网页文本集合,d.从所述网页文本集合中的子文本的所有内链中抓取出低质量的内链;e.删除所述低质量的内链。通过上述方式,大大节省了人工成本,减少了内链处理行为的主观性,并且很好地提高了文本内链的质量,改善了文本内链对用户的引导效果。
专利类型:发明专利
专利号:CN201110052159.4
专利申请(专利权)人:北京百度网讯科技有限公司
专利发明(设计)人:李永强;耿磊;严冰;李忠红;刘晓东;苏上海;闫江波;田孟月
主权项:一种自动处理网页文本的内链的方法,其特征在于,所述方法包括步骤:a.获取用户行为日志;b.根据所述行为日志统计所述网页文本的点击数据;c.根据所述点击数据判断所述网页文本是否满足删除条件,以得到待删除内链的网页文本集合,d.从所述网页文本集合中的子文本的所有内链中抓取出低质量的内链;e.删除所述低质量的内链。
专利地区:北京
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。