TypeError:需要类似字节的对象,而不是python和CSV中的“str”
TypeError:需要类似字节的对象,而不是“str”
在执行下面的python代码的时候会出现以上的错误,以保存Csv文件中的HTML表格数据。 不知道如何获得rideup.pls帮助我。
import csv import requests from bs4 import BeautifulSoup url='http://www.mapsofindia.com/districts-india/' response=requests.get(url) html=response.content soup=BeautifulSoup(html,'html.parser') table=soup.find('table', attrs={'class':'tableizer-table'}) list_of_rows=[] for row in table.findAll('tr')[1:]: list_of_cells=[] for cell in row.findAll('td'): list_of_cells.append(cell.text) list_of_rows.append(list_of_cells) outfile=open('./immates.csv','wb') writer=csv.writer(outfile) writer.writerow(["SNo", "States", "Dist", "Population"]) writer.writerows(list_of_rows)
在最后一行之上。
您正在使用Python 2方法而不是Python 3。
更改:
outfile=open('./immates.csv','wb')
至:
outfile=open('./immates.csv','w')
你将得到一个带有以下输出的文件:
SNo,States,Dist,Population 1,Andhra Pradesh,13,49378776 2,Arunachal Pradesh,16,1382611 3,Assam,27,31169272 4,Bihar,38,103804637 5,Chhattisgarh,19,25540196 6,Goa,2,1457723 7,Gujarat,26,60383628 .....
在Python 3中,csv以文本模式input,而在Python 2中则以二进制模式input。
编辑添加
这是我跑的代码:
url='http://www.mapsofindia.com/districts-india/' html = urllib.request.urlopen(url).read() soup = BeautifulSoup(html) table=soup.find('table', attrs={'class':'tableizer-table'}) list_of_rows=[] for row in table.findAll('tr')[1:]: list_of_cells=[] for cell in row.findAll('td'): list_of_cells.append(cell.text) list_of_rows.append(list_of_cells) outfile = open('./immates.csv','w') writer=csv.writer(outfile) writer.writerow(['SNo', 'States', 'Dist', 'Population']) writer.writerows(list_of_rows)
我有与Python3相同的问题。 我的代码写入io.BytesIO()
。
replace与io.StringIO()
解决。
file = open('parsed_data.txt', 'w') for link in soup.findAll('a', attrs={'href': re.compile("^http")}): print (link) soup_link = str(link) print (soup_link) file.write(soup_link) file.flush() file.close()
在我的情况下,我用BeautifulSoup用Python 3.x编写了一个.txt文件。 它有同样的问题。 正如@tsduteba所说,将第一行的'wb'改为'w'。