Tag: csv

чтение файла в python

Я новичок в том, что python использовал его для графики, но никогда не делал этого для других проблем. Мой вопрос заключается в том, как прочитать этот файл, который является разделителем табуляции или пробела, и имеет заголовки в python, я знаю, как сделать файл с разделителями-запятыми, но не сделал этого? ID YR MO DA YrM MoM […]

Обновление csv с данными csv с различным форматированием

Я пытаюсь обновить файл csv с некоторыми данными о студентах, предоставленными другими источниками, однако они отформатировали данные csv несколько иначе, чем наши. Он должен соответствовать ученикам, основанным на трех критериях, их имя, их класс и, наконец, первые несколько букв местоположения, поэтому для первых учеников класса B из Dumpt который фактически является парком Dumpton. Когда совпадения […]

Прочтите разреженный csv непосредственно в разреженную рамку данных pandas

Функция pandas read_csv , похоже, не имеет разреженной опции. У меня есть данные csv с тонны нулей в нем (он очень хорошо сжимается, и удаление любого значения 0 уменьшает его до почти половины исходного размера). Я попытался загрузить его в плотную матрицу сначала с помощью read_csv а затем вызвать to_sparse , но он занимает много […]

Чтение UTF-8 с помощью спецификации с использованием модуля CSV Python вызывает нежелательные дополнительные символы

Я пытаюсь прочитать CSV-файл с Python со следующим кодом: with open("example.txt") as f: c = csv.reader(f) for row in c: print row Мой example.txt имеет только следующий контент: Привет мир! Для файлов с кодировкой UTF-8 или ANSI это дает мне ожидаемый результат: > ["Hello world!"] Но если я сохраню файл как UTF-8 с BOM, я […]

csv.reader читает из потока Requests: iterator должен возвращать строки, а не байты

Я пытаюсь csv.reader ответ на csv.reader используя csv.reader requests.get(url, stream=True) чтобы обрабатывать довольно большие фиды данных. Мой код отлично работал с python2.7 . Вот код: response = requests.get(url, stream=True) ret = csv.reader(response.iter_lines(decode_unicode=True), delimiter=delimiter, quotechar=quotechar, dialect=csv.excel_tab) for line in ret: line.get('name') К сожалению, после перехода на python3.6 появилась следующая ошибка: _csv.Error: iterator should return strings, not […]

Django models.CommaSeparatedIntegerField с формами. CheckboxSelectMultiple widget

У меня есть приложение Django и вы хотите отображать флажки с множественным выбором в интерфейсе администратора Django. Я не хочу создавать отдельную модель для своих выборов, используя ManyToManyField. models.py from django.db import models STAFF_BUSINESS_TYPES = { (1, "Foo"), (2, "Bar"), (3, "Cat"), (4, "Dog") } class Business(models.Model): name = models.CharField(max_length=255, unique=True) business_types = models.CommaSeparatedIntegerField(max_length=32, choices=STAFF_BUSINESS_TYPES) […]

сумка-сумка, не использующая все сердечники? альтернативы?

У меня есть скрипт python, который выполняет следующие действия: i. который принимает входной файл данных (обычно вложенный формат JSON) ii. передает данные по строкам на другую функцию, которая манипулирует данными в желаемом формате iii. и, наконец, он записывает вывод в файл. Вот моя текущая простая строка python, которая делает это … def manipulate(line): # a […]

понимание синтаксиса csv DictWriter в python

Я смотрел на очень полезный ответ на предыдущий вопрос SO, который можно найти здесь, когда вы пытаетесь написать список dicts в файл CSV. Код, который я использовал, был: with open((filename), 'wb') as outfile: write = csv.DictWriter(outfile, keyList) write.writer.writerow(keyList) write.writerows(data) где keyList – это список заголовков для файла csv. Код работал отлично, что приятно, но я […]

Чтение данных из csv в pandas, когда дата и время находятся в отдельных столбцах

Я посмотрел на ответ на этот вопрос: Parse date, когда YYYYMMDD и HH находятся в отдельных столбцах с использованием панд в Python , но, похоже, это не работает для меня, и это заставляет меня думать, что я делаю что-то неправильно. У меня есть данные в CSV-файлах, которые я пытаюсь прочитать с помощью функции pandas read_csv. […]

Кодирование с помощью pandas.read_csv, когда имя файла имеет акценты

Я пытаюсь загрузить CSV с помощью pandas, но я столкнулся с проблемой, если имя файла имеет акценты. Это явно проблема кодирования, но хотя read_csv позволяет вам устанавливать кодировку для текста внутри файла, я не могу понять, как правильно закодировать имя файла. input_file = r'C:\…\Datasets\%s\Provinces\Points\%s.csv' % (country, province) self.locs = pandas.read_csv(input_file,sep=',',skipinitialspace=True) Файл CSV – Anzoátegui.csv. Когда […]

Python - лучший язык программирования в мире.