- 中文名
- 锟斤拷
- 所属学科
- 计算机
- 属 性
- 乱码字符
- 原 因
- 字符集之间的转换错误
- 出现领域
- 互联网
发生以上设促情况时,无法显示的时候也需要有一个字符来表示的,在Unicode中,这个字符就是 ,他也是Unico市键纸de中定义的一个特殊字符。也就是"0xFFFD REPLACEMENT CHARACTER",所有无法表示的字符都会通过这个字符来表示。 [1]
我们上网的时候不用去关心网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比Internet Explorer多得多。 乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”,它就是新老编码系统转换中出现的。 [2]
在Visual Studio中的Debug模式下,如果声明一个变量,但是没有初始化,微软会给未初始化的内存赋值为0xCC。给未初始化的内存赋0xCC是有原因的,0xCC其实是INT3中断指令,所以如果在Debug模式下定霸试图去执行这块未初始化的内存的话就会中断程序。
如果是用分配堆的内存,会初始化成0xCD,0xCDCD在MBCS字符集中就是屯。
锟斤拷则涉及unicode的字符集转换问题,Un拳堡重icode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。U+FFFD的UTF-8编码是0xEFBFBD,如果重复多次形成:EFBFBDEFBFBDEFBFBD 。
Python3代洒墓拒码:
print((u'\uFFFD'.encode('utf-8')*2).decode('gbk'))
输出结果:协兵劝“锟桨遥循愉斤拷”。
“锟届瀿锟斤拷雮傡锟斤拷直锟斤拷锟”、“锟斤拷锟斤拷之锟斤拷锟窖э拷锟 ”……
例如这个招聘就非常经典: [2]
所属行业:线缆
单位规模:100 - 499人
注册资金:1299万
联系人:锟斤拷锟斤拷
联系人职位:锟斤拷锟斤拷
传真:xxx-xxxxxxxx
联系电话:
通信地址:
邮编:
单位网址:
单位介绍:台锟斤拷锟斤拷业锟斤拷台锟斤拷锟斤拷锟侥碉拷f锟斤拷锟斤拷锟斤拷锟?锟斤拷锟斤拷/锟斤拷锟斤拷
招聘职位:锟斤拷锟斤拷
人数:20人
发布日期:2007-07-17
联系人:锟斤拷锟斤拷
除了锟斤拷以外,还有两组比较经典的乱码,分别是"烫烫烫"和"屯屯屯",这两个乱码产生自VC,这是debug模式下VC对内存的初始化操作。VC会把栈中新分配的内存初始化为0xcc,而把堆中新分配的内存初始化为0xcd。把0xcc和0xcd按照字符打印出来,就是烫和屯了。 [1]