超过800万条软件/作品著作权公告信息!

提供基于中国版权保护中心以及各省市版权局著作权登记公告信息查询

网页抽取准确性计算方法及系统专利登记公告


专利名称:网页抽取准确性计算方法及系统

摘要:一种网页抽取准确性计算方法,包括以下步骤:获取浏览器对网页解析的结果;获取待测网页抽取模块对网页解析的结果;计算所述待测网页抽取模块解析的结果与浏览器解析的结果的相似度。采用上述方法,以浏览器解析网页的结果为网页抽取标准的结果,计算得到的相似度可有效反映待测网页抽取模块进行网页抽取的准确性,该方法不需要人工参与,能够自动的对批量网页进行测试。此外,还提供了一种网页抽取准确性计算系统。

专利类型:发明专利

专利号:CN201110048960.1

专利申请(专利权)人:腾讯科技(深圳)有限公司

专利发明(设计)人:朱靖君;林世飞;张立明

主权项:一种网页抽取准确性计算方法,包括以下步骤:获取浏览器对网页解析的结果;获取待测网页抽取模块对网页解析的结果;计算所述待测网页抽取模块解析的结果与浏览器解析的结果的相似度,相似度越大,则所述待测网页抽取模块进行网页抽取的准确性越高。

专利地区:广东