什么是Python的缓冲区types?
在Python中有一个buffer
types,但我不知道如何使用它。
在Python文档中的描述是:
buffer(object[, offset[, size]])
对象参数必须是支持缓冲区调用接口(如string,数组和缓冲区)的对象。 将会创build一个引用对象参数的新缓冲区对象。 缓冲区对象将是从对象的开始(或从指定的偏移量)的切片。 切片将延伸到对象的末尾(或将有一个由大小参数给定的长度)。
一个示例用法:
>>> s = 'Hello world' >>> t = buffer(s, 6, 5) >>> t <read-only buffer for 0x10064a4b0, size 5, offset 6 at 0x100634ab0> >>> print t world
在这种情况下,缓冲区是一个子string,从长度为5的位置6开始,并且不占用额外的存储空间 – 它引用string的一个片段。
对于这样的短string来说这不是非常有用,但是在使用大量数据时可能是必须的。 这个例子使用了一个可变的bytearray
:
>>> s = bytearray(1000000) # a million zeroed bytes >>> t = buffer(s, 1) # slice cuts off the first byte >>> s[1] = 5 # set the second element in s >>> t[0] # which is now also the first element in t! '\x05'
如果您希望对数据有多个视图并且不想(或不能)在内存中保存多个副本,这可能非常有用。
请注意, buffer
已被Python 3中更好的命名memoryview
取代,尽pipe您可以在Python 2.7中使用。
还要注意的是,如果不深入研究C API,就不能实现自己的对象的缓冲接口,也就是说,你不能用纯Python来实现。
当将python连接到本地库时,我认为缓冲区是非常有用的。 (Guido van Rossum解释了这个邮件列表中的 buffer
)。
例如,numpy似乎使用缓冲区进行高效的数据存储:
import numpy a = numpy.ndarray(1000000)
a.data
是一个:
<read-write buffer for 0x1d7b410, size 8000000, offset 0 at 0x1e353b0>