Tag: csv

как заменить все вхождения определенных символов?

Я читаю csv в: import csv import collections import pdb import math import urllib def do_work(): a=get_file('c:/pythonwork/cds/cds.csv') a=remove_chars(a) print a[0:10] def get_file(start_file): #opens original file, reads it to array with open(start_file,'rb') as f: data=list(csv.reader(f)) return (data) def remove_chars(a): badchars=['a','b','c','d'] for row in a: for letter in badchars: row[8].replace(letter,'') return a Я хотел бы заменить все […]

Поддерживает ли Python csv-writer всегда использовать символы конца строки DOS?

Я понимаю, что библиотека csv в Python всегда генерирует символы конца строки DOS. Даже если я использую режим 'wb' , даже если я использую Linux. import csv f = open('output.txt', 'wb'); writer = csv.writer(f) writer.writerow([2,3,4]); f.close() Вышеприведенный код всегда использует '\r\n' в качестве разделителя конца строки. Как я могу использовать его только '\n' ?

Python: csv.writer, записывающий каждый символ слова в отдельном столбце / ячейке

Obj: извлечь текст из тега привязки внутри всех li в 'models' и поместить его в csv. Я пробую этот код: with open('Sprint_data.csv', 'ab') as csvfile: spamwriter = csv.writer(csvfile) models = soup.find_all('li' , {"class" : "phoneListing"}) for model in models: model_name = unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip() spamwriter.writerow(unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip()) Его рабочий тон, за исключением каждой ячейки в csv, содержит […]

Как импортировать файл csv как numpy.array в python?

скажем, у меня есть файл csv file.csv в таком формате: dfaefew,432,1 vzcxvvz,300,1 ewrwefd,432,0 как импортировать второй столбец как numpy.array, а третий – как другой: second = np.array([432, 300, 432]) third = np.array([1, 1, 0]) Я использую python2.7 в Ubuntu. Thx впереди!

Чтение .csv в Python без прокрутки всего файла?

Единственный способ, которым я видел используемый csv.reader Python, – это цикл for, который проходит через весь файл без сохранения прошлых значений read в переменных. Мне нужно работать только с двумя последовательными строками (огромного) файла за раз. Используя цикл csv.reader для цикла, у меня есть только одна строка за раз. Есть ли способ использовать модуль csv […]

Получите pandas.read_csv, чтобы читать пустые значения как пустую строку вместо nan

Я использую библиотеку pandas для чтения в некоторых CSV-данных. В моих данных некоторые столбцы содержат строки. Строка "nan" – это возможное значение, равно как и пустая строка. Мне удалось получить панды, чтобы читать «нан» как строку, но я не могу понять, как заставить ее не читать пустое значение как NaN. Вот пример данных и результатов […]

Запись дополнительного столбца с заголовком

на данный момент у меня есть это: 2 переменные: varHeader: ExtraColumn varContent: ToBeFilledIn writer.writeheader() for line in reader: writer.writerow(line) И все работает отлично. Проблема в том, что у меня есть 2 переменные, varHeader и varContent. И что я терпеть неудачу: перед writer.writeheader мне нужно добавить дополнительный столбец с заголовком ExtraColumn, который является содержимым переменной varHeader. […]

Python csv пропускает первые две пустые строки

Прежде чем кто-либо отметит это как дубликат, я попробовал все: от isspace, startswith, itertools filterfunction, readlines () [2:]. У меня есть скрипт Python, который ищет сотни файлов CSV и печатает строку с соответствующей строкой (в данном случае уникальным идентификатором) в восьмом столбце слева. import csv import glob csvfiles = glob.glob('20??-??-??.csv') for filename in csvfiles: reader […]

Проблема с созданием текстового файла, когда новые строки создаются, когда они не действительно EOL

Я импортирую некоторые текстовые данные из набора файлов, которые я создал в python (преобразование метаданных / xml записей в текст) в excel. В основном он отлично работает, за исключением того, что в точках, где текст просто находится в абзаце, вставлены новые строки. Это проблема в процессе создания файла. Возможно ли автоматическое очистку данных для сохранения […]

Повторная запись чисел записывает байтовые литералы в мой файл csv?

Я использовал следующий тестовый код import numpy as np import csv data = np.zeros((3,),dtype=("S24,int,float")) with open("testtest.csv", 'w', newline='') as f: writer = csv.writer(f,delimiter=',') for row in data: writer.writerow(row) И данные в файле csv имеют теги b '' (байтовые теги букв) для строковых компонентов массива записей. Каким образом можно обрабатывать запись в csv этих массивов записей […]

Python - лучший язык программирования в мире.