Tag: csv

Чтение данных из csv-файла и преобразование в правильный тип данных

У меня проблема. Я написал двумерный список, где каждый столбец имеет другой тип (bool, str, int, list), в csv-файл. Теперь я хочу снова прочитать данные из csv-файла. Но каждая прочитанная ячейка интерпретируется как строка. Как я могу автоматически преобразовать данные чтения в правильный тип? Или лучше: есть ли возможность, чтобы сказать csv-reader правильный тип данных […]

Представляете иерархию деревьев с использованием электронной таблицы Excel, которая легко анализируется с помощью Python CSV-читателя?

У меня есть нетехнический клиент, у которого есть некоторые иерархические данные о продуктах, которые я буду загружать в древовидную структуру с помощью Python. Дерево имеет переменное количество уровней и узлы с переменным числом и листовые узлы на каждом уровне. Клиент уже знает иерархию продуктов и хотел бы поместить все в электронную таблицу Excel, чтобы я […]

Pandas: импортировать несколько файлов csv в dataframe, используя цикл и иерархическую индексацию

Я хотел бы прочитать несколько файлов CSV (с различным количеством столбцов) из целевого каталога в один Python Pandas DataFrame для эффективного поиска и извлечения данных. Пример файла: Events 1,0.32,0.20,0.67 2,0.94,0.19,0.14,0.21,0.94 3,0.32,0.20,0.64,0.32 4,0.87,0.13,0.61,0.54,0.25,0.43 5,0.62,0.21,0.77,0.44,0.16 Вот что я имею до сих пор: # get a list of all csv files in target directory my_dir = "C:\\Data\\" filelist […]

Python csv записывает неправильный разделитель?

Отказ: Я в Европе. Согласно этой странице Excel использует точку с запятой ; как разделитель по умолчанию в Европе для «предотвращения конфликтов» с десятичной запятой. Теперь у меня есть этот код Python: import csv data = [["test", "data"], ["foo", "bar"]] writer = csv.writer(open("data.csv", "wb"), dialect="excel") writer.writerows(data) Который должен сгенерировать этот файл: test;data foo;bar но вместо […]

DictReader, без кавычек, файл с вкладками

У меня есть файл csv, который выглядит так: Обратите внимание: кавычек нет, вкладка (\ t) является разделителем, и между заголовком и фактическим содержимым есть пустая строка. Facility No Testing No Name Age 252 2351 Jackrabbit, Jazz 15 345 257 Aardvark, Ethel 41 Я думаю, что я пробовал почти все возможные комбинации идей и параметров f […]

Импорт большой вкладки. Разделительный .txt-файл в Python

У меня есть файл с разделителями табуляции .txt, который я пытаюсь импортировать в матричный массив в python того же формата, что и текстовый файл, как показано ниже: 123088 266 248 244 266 244 277 123425 275 244 241 289 248 231 123540 156 654 189 354 156 987 Обратите внимание, что есть много и много […]

Добавление данных в Pandas Dataframe из файла CSV, вызывающего ошибки значения

Я пытаюсь добавить int к существующему значению в Pandas DataFrame с помощью >>> df.ix['index 5','Total Dollars'] += 10 Я получаю сообщение об ошибке: ValueError: Must have equal len keys and value when setting with an iterable . Я думаю, что ошибка исходит из datatype полученного из: >>> print type(df.ix['index 5','Total Dollars'] int64 <class 'pandas.core.series.Series'> Блок […]

Регулярное выражение Python для чтения CSV-подобных строк

Я хочу анализировать входящие CSV-подобные строки данных. Значения разделяются запятыми (и между запятыми могут быть ведущие и конечные пробелы) и могут быть указаны либо с помощью «или с». Например, это допустимая строка: data1, data2 ,"data3'''", 'data4""',,,data5, но это некорректно: data1, data2, da"ta3", 'data4', – кавычки могут быть добавлены или перемещены пробелами. Такие искаженные строки должны […]

Сохранить Dataframe в csv прямо на s3 Python

У меня есть pandas DataFrame, который я хочу загрузить в новый CVS-файл. Проблема в том, что я не хочу сохранять файл локально, прежде чем переносить его на s3. Есть ли способ, подобный to_csv, для прямого ввода данных в s3? Я использую boto3. Вот что я имею до сих пор: import boto3 s3 = boto3.client('s3', aws_access_key_id='key', […]

Почему читатель Python CSV игнорирует поля с двойными кавычками?

Я думаю, что это, наверное, что-то простое, но после часа поиска мне не удавалось выяснить, что я делаю неправильно. Я использую следующий код для чтения CSV-файла – у меня нет проблем с чтением файла, но когда строка содержит поле, которое является двойным, потому что оно содержит разделитель, считыватель CSV игнорирует двойные кавычки и анализирует поле […]

Python - лучший язык программирования в мире.