文本数据处理方法和装置专利登记公告
专利名称:文本数据处理方法和装置
摘要:本发明提供一种文本数据处理方法,包括:读取待压缩文本数据的数据流;对于所述数据流中已指定压缩方法的语种数据流,以指定压缩方法或指定压缩工具进行压缩;对于所述数据流中未指定压缩方法的语种数据流,以默认压缩方法或默认压缩工具进行压缩;将经过压缩的各数据流按照其在所述待压缩文本数据的数据流中的先后顺序进行合并。相应地,提供一种文本数据处理装置。本发明基于语种类别,分别利用不同的压缩方法对各个语种数据流进行压缩,从而提高了包含多个语种的文本数据的压缩率。
专利类型:发明专利
专利号:CN201010586550.8
专利申请(专利权)人:北京大学;北大方正集团有限公司;北京北大方正技术研究院有限公司
专利发明(设计)人:仇睿恒;胡薇
主权项:一种文本数据处理方法,包括以下步骤:读取待压缩文本数据的数据流;对于所述数据流中已指定压缩方法的语种数据流,以指定压缩方法或指定压缩工具进行压缩;对于所述数据流中未指定压缩方法的语种数据流,以默认压缩方法或默认压缩工具进行压缩;将经过压缩的各数据流按照其在所述待压缩文本数据的数据流中的先后顺序进行合并。
专利地区:北京
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。