本文共 799 字,大约阅读时间需要 2 分钟。
第八部分
高级话题 第36章 Unicode和字节字符串
在本书的核心类型部分关于字符串的一章中 (第 章),我有意地限制了大多数 7 P y t h o n
程序员需要了解的字符串话题的子集的范围。因为大多数程序员只是处理像A S C I I这样
的文本的简单形式,他们快乐地使用着Python 的基本的 字符串类型及其相关的操作, str
并且不需要掌握更加高级的字符串概念。实际上,这样的程序员很大程度上可以忽略
Python 3.0 中的字符串的变化,并且继续使用他们过去所使用的字符串。
另一方面,一些程序员处理更加专业的数据类型:非A S C I I 的字符串集、图像文件内
容,等等。对于这些程序员 (以及其他可能某一天加入这一队伍的程序员),在本章
中,我们将介绍P y t h on字符串的其他内容,并且探讨P y t h on字符串模型中一些较为高级
的话题。
特别是,我们将介绍Python支持的Unicode文本的基础知识——在国际化应用程序中使用
的宽字符字符串,以及二进制数据——表示绝对的字节值的字符串。我们将看到,高级
的字符串表示法在Python 当前版本中已经产生了分歧:
· Python 3.0为二进制数据提供了一种替代字符串类型,并且在其常规的字符串类型 中支持 文本 ( 看作 的一种简单类型)。 Unicode ASCII Unicode
· Python 2.6为非ASCII Unicode文本提供了一种替代字符串类型,并且在其常规的字 符串类型中支持简单文本和二进制数据。
此外,由于P y t h o n 的字符串模式对于如何处理非A SC I I文件有着直接的影响,我们还将
在这里介绍相关话题的基础知识。最后,我们还将简单地看看一些高级字符串和二进制工具,例如模式匹配、对象pickle化、二进制数据包装和XML解析,以及Python 3.
转载地址:http://sgqhp.baihongyu.com/