Как написать скребковый контент в файл CSV?

Мне нужна помощь, чтобы сохранить выход из базового веб-скребка в файл CSV.

Вот код:

from urllib.request import urlopen from bs4 import BeautifulSoup import csv html_ = urlopen("some_url") bsObj_ = BeautifulSoup(html_, "html.parser") nameList_ = bsObj_2.findAll("div", {"class":"row proyecto_name_venta"}) for name in nameList_: print(name.get_text()) 

В частности, я хочу сохранить name.get_text() в файле CSV.

2 Solutions collect form web for “Как написать скребковый контент в файл CSV?”

Это довольно подробный пример того, что вы просили. , , ,

 import urllib2 listOfStocks = ["AAPL", "MSFT", "GOOG", "FB", "AMZN"] urls = [] for company in listOfStocks: urls.append('http://real-chart.finance.yahoo.com/table.csv?s=' + company + '&d=6&e=28&f=2015&g=m&a=11&b=12&c=1980&ignore=.csv') Output_File = open('C:/Users/rshuell001/Historical_Prices.csv','w') New_Format_Data = '' for counter in range(0, len(urls)): Original_Data = urllib2.urlopen(urls[counter]).read() if counter == 0: New_Format_Data = "Company," + urllib2.urlopen(urls[counter]).readline() rows = Original_Data.splitlines(1) for row in range(1, len(rows)): New_Format_Data = New_Format_Data + listOfStocks[counter] + ',' + rows[row] Output_File.write(New_Format_Data) Output_File.close() 

Если элементы в nameList_ являются строками с столбцами, разделенными nameList_ ',' попробуйте это:

 import csv with open('out.csv', 'w') as outf: writer = csv.writer(outf) writer.writerows(name.get_text().split(',') for name nameList_) 

Если nameList_.get_text() является просто строкой и вы хотите написать один CSV столбца, вы можете попробовать следующее:

 import csv with open('out.csv', 'w') as outf: writer = csv.writer(outf) writer.writerows([name.get_text()] for name in nameList_) 
  • Как получить данные внутри тега </ br>, который находится внутри <li>, используя скребок python
  • очистка данных с динамического графа с использованием python + beautifulSoup4
  • Разбор веб-сайта Python Beautifulsoup4
  • Каков правильный синтаксис, чтобы следовать ссылке, используя beautifulsoup & запросы в приложении django?
  • Выполнение последующего запроса POST в сеансе не работает - веб-скребок
  • Использование Python для очистки вложенных разделов и интервалов в Twitter?
  • Как удалить строку в цикле с помощью Python?
  • Объект списка Python не имеет ошибки атрибута
  • Python - лучший язык программирования в мире.