首页 / 知识
pythonchardet检测编码
2023-11-12 12:53:00
pythonchardet检测编码
1、当我们拿到一个bytes时,就可以对其检测编码。用chardet检测编码,只需要一行代码:
>>>chardet.detect(b'Hello,world!')
{'encoding':'ascii','confidence':1.0,'language':''}
检测出的编码是ascii,注意到还有个confidence字段,表示检测的概率是1.0(即100%)。
2、检测GBK编码的中文
>>>data='离离原上草,一岁一枯荣'.encode('gbk')
>>>chardet.detect(data)
{'encoding':'GB2312','confidence':0.7407407407407407,'language':'Chinese'}
检测的编码是GB2312,注意到GBK是GB2312的超集,两者是同一种编码,检测正确的概率是74%,language字段指出的语言是'Chinese'。
以上就是pythonchardet检测编码的方法,希望对大家有所帮助。更多Python学习教程请关注我们
最新内容
相关内容
python一个数的平方怎么表示
python一个数的平方怎么表示,培训,平方根,个数,函数,模块,表示,方法,表达式,实例,下面,用python进行数学计算,可以使用python内置的函数模块,下python代码如何在命令行运行
python代码如何在命令行运行,代码,培训,路径,空格,文件,下面,以上,目录,更多,内容,我们在编写python代码时,可以在交互模式下运行代码,也可以用pythonpython是前端语言吗?
pythonpython是前端语言吗?,代码,互动,培训,平台,标准,设计,语言,前端,语法,解释性,python语言属于后端开发语言。Python是一个高层次的结合python立方怎么表示
python立方怎么表示,培训,代码,数字,表示,次方,立方,余数,符号,当中,区别,python可以直接运算数字,也可以加print进行运算。>>>1+12>>>2-11>>>python判断字符串是否包含中文
python判断字符串是否包含中文,培训,检测,代码,字符串,中文,字符,范围,空格,原理,以上,原理:中文字符的编码范围是:\u4e00-\u9fff只要编码在python怎么写多行代码
python怎么写多行代码,代码,培训,情况,示例,字符串,斜杠,方法,行书,括号,有用,在写代码过程中,经常遇到一行代码很长的情况。为了让代码显得整python如何匹配中文
python如何匹配中文,培训,中文,正则,大学,字符,范围,形式,以上,版本,结果,python中文字符的编码范围是:\u4e00-\u9fa5使用正则匹配中文#-*-cpythonpython是什么类型的语言
pythonpython是什么类型的语言,培训,系统,教育,软件,电脑,代码,简介,人工智能,类型,语言,python是一种面向对象、解释型、动态类型计算机程序python脚本语言
python脚本语言,代码,设计,情况,培训,语句,项目,基础,意外,异常,空格,Python是一种计算机程序设计语言。是一种面向对象的动态类型语言,最初被python为什么是胶水语言
python为什么是胶水语言,代码,标准,培训,环境,一致,系统,统一,数据,周期性,服务,胶水语言先从Helloworld开始。所有学python的童鞋都会从这句python怎么表示次方
python怎么表示次方,培训,代码,时间,数据,数字,乘方,次方,结果,表示,例子,大家都知道,Python可以用来做数据计算,那么在Python中,如何表示乘方呢python怎么给代码注释
python怎么给代码注释,代码,培训,注释,时间,项目,负担,冗余,重要性,开头,含义,注释的重要性如果我们是做独立项目,或者是唯一一位来查看自己编