关于python中字符编码的问题

现在有些unicode的字符串(如\u3232\u6674),现在想把这些unicode的东西转换成中文字符。具体可以怎么做了。

你说的是,把字符串:
\u3232\u6674
本身,转换为unicode字符吧?

那么可以通过:
slashUStr = "\\u3232\\u6674";
decodedUniChars = slashUStr.decode("unicode-escape");
print "decodedUniChars=",decodedUniChars; #decodedUniChars= (有) 晴

注:(有) 是个特殊字符,如果想要在cmd(默认为gbk)中打印,会出错的。
UnicodeEncodeError: 'gbk' codec can't encode character u'\u3232' in position 0: illegal multibyte sequence

但是,本身的确已经是转换好了unicode字符串了。

详情可参考:
【整理】Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符

(此处不能贴地址,请用google搜标题,即可找到帖子地址)
温馨提示:答案为网友推荐,仅供参考
第1个回答  2012-11-21
a=u'\u6d4b\u8bd5'
print a

关键是加个 u