一种专利信息解析方法和装置专利登记公告
专利名称:一种专利信息解析方法和装置
摘要:本发明提供了一种专利信息解析方法和装置,其中方法包括:从数据库中选择已完成解析的专利信息作为基础数据,并从网站上获取所述专利信息的HTML格式网页;针对所述基础数据中的各数据项,分别从获取到的HTML格式网页中获取能够唯一定位各数据项的字符串,并分别格式化为解析各数据项的正则表达式;利用所述解析各数据项的正则表达式,从所述网站未解析的HTML格式网页中解析专利信息,并将解析到的专利信息存入所述数据库。本发明能够自适应地建立出专利信息的解析规则,使得网页的HTML格式即便发生变化,也能够自动更新专利信息的解
专利类型:发明专利
专利号:CN201210142700.5
专利申请(专利权)人:北京彼速信息技术有限公司
专利发明(设计)人:谢国利
主权项:一种专利信息解析方法,其特征在于,该方法包括:S1、从数据库中选择已完成解析的专利信息作为基础数据,并从网站上获取所述专利信息的超文本标记语言HTML格式网页;S2、针对所述基础数据中的各数据项,分别从获取到的HTML格式网页中获取能够唯一定位各数据项的字符串,并分别格式化为解析各数据项的正则表达式;S3、利用所述解析各数据项的正则表达式,从所述网站未解析的HTML格式网页中解析专利信息,并将解析到的专利信息存入所述数据库。
专利地区:北京
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。