文本文件的编码格式探测方法和装置专利登记公告
专利名称:文本文件的编码格式探测方法和装置
摘要:本发明公开了一种文本文件的编码格式探测方法和装置,属于文件处理领域。该方法包含:划分文本文件为多个文字段;如果当前文字段中的前4个字节的字节编码大于0x00且小于0x7F,则当前文字段的编码格式为ASCII;否则按照字节编码所采用的编码字节长度在对应的编码格式分组中进行探测,根据探测结果转换当前文字段为对应匹配的编码格式;读取下一文字段中的字节进行探测,直至全部文本文件转换完毕。本发明对不符合编码字节序标识的文字编码进行分组判断,对各种不同的编码格式进行编码转换,避免了使显示时的编码格式与文本文件的字节编
专利类型:发明专利
专利号:CN201010586125.9
专利申请(专利权)人:汉王科技股份有限公司
专利发明(设计)人:宋久元;展永定
主权项:一种文本文件的编码格式探测方法,其特征在于,包含有下列步骤:步骤一:划分文本文件为多个文字段;步骤二:如果当前文字段中的前4个字节的字节编码大于0x00且小于0x7F,则当前文字段的编码格式为ASCII;否则按照字节编码所采用的编码字节长度在对应的编码格式分组中进行探测,根据探测结果转换当前文字段为对应匹配的编码格式;步骤三:读取下一文字段中的字节并进行探测,重复步骤二,直至全部文本文件转换完毕。
专利地区:北京
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。