Tag: csv

Чтение .csv в Python без прокрутки всего файла?

Единственный способ, которым я видел используемый csv.reader Python, – это цикл for, который проходит через весь файл без сохранения прошлых значений read в переменных. Мне нужно работать только с двумя последовательными строками (огромного) файла за раз. Используя цикл csv.reader для цикла, у меня есть только одна строка за раз. Есть ли способ использовать модуль csv […]

Получите pandas.read_csv, чтобы читать пустые значения как пустую строку вместо nan

Я использую библиотеку pandas для чтения в некоторых CSV-данных. В моих данных некоторые столбцы содержат строки. Строка "nan" – это возможное значение, равно как и пустая строка. Мне удалось получить панды, чтобы читать «нан» как строку, но я не могу понять, как заставить ее не читать пустое значение как NaN. Вот пример данных и результатов […]

Запись дополнительного столбца с заголовком

на данный момент у меня есть это: 2 переменные: varHeader: ExtraColumn varContent: ToBeFilledIn writer.writeheader() for line in reader: writer.writerow(line) И все работает отлично. Проблема в том, что у меня есть 2 переменные, varHeader и varContent. И что я терпеть неудачу: перед writer.writeheader мне нужно добавить дополнительный столбец с заголовком ExtraColumn, который является содержимым переменной varHeader. […]

Python csv пропускает первые две пустые строки

Прежде чем кто-либо отметит это как дубликат, я попробовал все: от isspace, startswith, itertools filterfunction, readlines () [2:]. У меня есть скрипт Python, который ищет сотни файлов CSV и печатает строку с соответствующей строкой (в данном случае уникальным идентификатором) в восьмом столбце слева. import csv import glob csvfiles = glob.glob('20??-??-??.csv') for filename in csvfiles: reader […]

Проблема с созданием текстового файла, когда новые строки создаются, когда они не действительно EOL

Я импортирую некоторые текстовые данные из набора файлов, которые я создал в python (преобразование метаданных / xml записей в текст) в excel. В основном он отлично работает, за исключением того, что в точках, где текст просто находится в абзаце, вставлены новые строки. Это проблема в процессе создания файла. Возможно ли автоматическое очистку данных для сохранения […]

Повторная запись чисел записывает байтовые литералы в мой файл csv?

Я использовал следующий тестовый код import numpy as np import csv data = np.zeros((3,),dtype=("S24,int,float")) with open("testtest.csv", 'w', newline='') as f: writer = csv.writer(f,delimiter=',') for row in data: writer.writerow(row) И данные в файле csv имеют теги b '' (байтовые теги букв) для строковых компонентов массива записей. Каким образом можно обрабатывать запись в csv этих массивов записей […]

Split pandas dataframe by String

Я новичок в использовании фреймов данных Pandas. У меня есть данные в .csv, как это: foo, 1234, bar, 4567 stuff, 7894 New Entry,, morestuff,1345 Я читаю его в dataframe с помощью df = pd.read_csv Но то, что я действительно хочу, это новый dataframe (или способ разделения текущего) каждый раз, когда у меня есть строка «Новая […]

Удаление строк из csv с помощью Python также добавляет дополнительную строку

Этот код, заимствованный из другого места в stackoverflow, удаляет все места, в которых csv имеет «None». Однако он также добавляет дополнительную строку в csv. Как я могу изменить этот код, чтобы удалить эту дополнительную строку? Я думаю, что проблема вызвана inplace , но когда я беру на место, файл больше не изменяется, запустив код. def […]

улучшить отображаемые lambdas в Python (панды)

Я перевариваю несколько файлов csv (каждый с одним или несколькими годами данных), чтобы классифицировать медицинские процедуры в широкие категории, а также хранить только подмножество исходной информации и даже суммировать до ежемесячного числа (по AR = год и месяц ) лечения на одного человека (LopNr). Многие обращения относятся к разным категориям одновременно (несколько кодов диагностики указаны […]

csv.DictWriter – TypeError: __init __ () принимает не менее 3 аргументов (4 данных)

Я пытаюсь написать список словарей в CSV, и у csv.DictWriter() возникают проблемы с инициализацией csv.DictWriter() . У меня есть: fname = "Machine Detection Rate.csv" with open(fname, "wb") as f: fieldNames = ["Number of Packets", "Number of Machines"] writer = csv.DictWriter(f, fieldNames=fieldNames, restval="", dialect="excel",) writer.writeheader() for line in machineCounter: print "Got Here!" writer.writerow(line) Ошибка, которую я […]

Python - лучший язык программирования в мире.