一种基于互联网的人物传记自动提取方法专利登记公告
专利名称:一种基于互联网的人物传记自动提取方法
摘要:本发明公开了一种基于互联网的人物传记自动提取方法,它的步骤如下:1、获取预置的与人物传记相关的网站集合,以数组保存,该数组记为传记类网站数组A;2、输入待检索的人物姓名搜索后得到的每个网站的超文本标记语言HTML脚本保存在数组中,该数组记为传记类网页脚本数组B;3、采用标签过滤工具对传记类网页脚本数组B中的各元素进行处理,将各网页的正文保存在传记数组中,该数组记为传记数组C;4、输入待生成的人物传记长度的字数,从传记数组C中提取一篇人物传记。该方法不仅能即时获取互联网上的信息用于人物传记生成,还能利用构建
专利类型:发明专利
专利号:CN201110386585.1
专利申请(专利权)人:上海大学
专利发明(设计)人:周文;李辉
主权项:一种基于互联网的人物传记自动提取方法,它包括如下步骤:步骤1、获取预置的与人物传记相关的网站集合,将该集合以数组的形式保存,记该数组为传记类网站数组A;步骤2、输入待检索的人物姓名,对传记类网站数组A中的每一个网站分别对该姓名进行搜索,将搜索后得到的每个网站的超文本标记语言HTML脚本保存在数组中,该数组记为传记类网页脚本数组B;步骤3、采用超文本标记语言HTML标签过滤工具对传记类网页脚本数组B中的各元素进行处理,将各网页的正文保存在传记数组中,该数组记为传记数组C;步骤4、输入待生成的人物传记长度的字
专利地区:上海
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。