技术标准的数字化处理方法专利登记公告
专利名称:技术标准的数字化处理方法
摘要:本发明涉及计算机应用系统中的数据采集及处理技术的一种技术标准的数字化处理方法,包括步骤为:技术标准分页扫描为图像格式;使用OCR转换为PDF文件;创建主文件夹,创建公共属性;创建技术标准独立文件夹,设置公共属性值;技术标准的独立文件夹创建属性;上传PDF文件,抓取文本;后台数据处理软件自动识别分析所述PDF文件的每页OCR文本,将条文编号写入每页的条文编号属性;前台Web检索浏览系统。本发明解决现有数字化技术存在的弊端,实现海量技术标准数字化后的全文检索和索引创建。
专利类型:发明专利
专利号:CN201110008216.9
专利申请(专利权)人:上海现代建筑设计(集团)有限公司
专利发明(设计)人:翟韦
主权项:一种技术标准的数字化处理方法,包括下列步骤:1)将技术标准分页扫描为图像格式;2)使用OCR软件批量转换为PDF文件;3)在软件系统中创建主文件夹,创建公共属性,所述公共属性包括标准名称和TAG;4)在文件管理器中为所述技术标准建立独立文件夹,设置所述公共属性值;5)在所述文件管理器中为所述技术标准的独立文件夹创建属性,所述属性包括页面内容和条文编号;6)在所述技术标准的独立文件夹内上传所述PDF文件,后台从所述PDF文件中抓取文本内容存入数据库;7)后台数据处理软件自动识别分析所述PDF文件的每页OCR
专利地区:上海
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。