如何使用Python将文本文件读入列表或数组

我想读取一个文本文件的行到python列表或数组。我只需要能够在创build后单独访问列表或数组中的任何项目。

文本文件格式如下：

0,0,200,0,53,1,0,255,...,0.

如果...在上面，则实际的文本文件具有数百或数千个项目。

我正在使用下面的代码来尝试将文件读入列表中：

 text_file = open("filename.dat", "r") lines = text_file.readlines() print lines print len(lines) text_file.close()

我得到的输出是：

 ['0,0,200,0,53,1,0,255,...,0.'] 1

显然，它将整个文件读入一个项目的列表，而不是单个项目的列表。我究竟做错了什么？

你将不得不使用split()将你的string分割成一个值列表

所以，

 lines = text_file.read().split(',')

python的file.readLines（）方法返回文件中行的列表：

 f = open('file_name.ext', 'r') x = f.readlines()

现在你应该可以迭代x行的数组了。

你也可以使用numpy的loadtxt

 from numpy import loadtxt lines = loadtxt("filename.dat", comments="#", delimiter=",", unpack=False)

所以你想创build一个列表清单…我们需要从一个空的列表开始

 list_of_lists = []

接下来，我们逐行阅读文件内容

 with open('data') as f: for line in f: inner_list = [elt.strip() for elt in line.split(',')] # in alternative, if you need to use the file content as numbers # inner_list = [int(elt.strip()) for elt in line.split(',')] list_of_lists.append(inner_list)

一个常见的用例是柱状数据，但是我们的存储单元是文件的行，我们已经逐一读取，因此您可能需要转置列表的列表。这可以用下面的习语来完成

 by_cols = zip(*list_of_lists)

另一个常用的用法是给每一列命名

 col_names = ('apples sold', 'pears sold', 'apples revenue', 'pears revenue') by_names = {} for i, col_name in enumerate(col_names): by_names[col_name] = by_cols[i]

以便您可以在同类数据项上进行操作

  mean_apple_prices = [money/fruits for money, fruits in zip(by_names['apples revenue'], by_names['apples_sold'])]

我写的大部分内容可以使用标准库中的csv模块进行加速。另一个第三方模块是pandas ，它可以让你自动化一个典型的数据分析的大多数方面（但有一些依赖）。

更新在Python 2中， zip(*list_of_lists)返回一个不同的（转置的）列表列表，在Python 3中情况已经改变， zip(*list_of_lists)返回一个不可下载的zip对象 。

如果你需要索引访问，你可以使用

 by_cols = list(zip(*list_of_lists))

给你一个在两个版本的Python列表的列表。

另一方面，如果你不需要索引访问，你想要的只是build立一个索引列名称的字典，一个zip对象就好了…

 file = open('some_data.csv') names = get_names(next(file)) columns = zip(*((x.strip() for x in line.split(',')) for line in file))) d = {} for name, column in zip(names, columns): d[name] = column

如何使用Python将文本文件读入列表或数组

我怎样才能find一个List <T>中的特定元素？

如何使用javascript将新的<li>添加到<ul> onclick

在R中合并两个列表

python转换列表字典

我如何序列化一个Python字典到一个string，然后回到一个字典？

如何查找列表中的所有元素？

HashSet <T>和List <T>有什么区别？

如何用另一个列表中的对象的属性创build一个新列表

什么是从一个不变的列表中“移除”一个元素的惯用的Scala方法？

字典的元组列表