Импортируйте несколько файлов excel в pandon pandas и объедините их в один фрейм данных

Я хотел бы прочитать несколько файлов excel из каталога в pandas и объединить их в один большой фрейм. Однако я не смог понять это. Мне нужна помощь в цикле for и построении конкатенированного фрейма данных: вот что я до сих пор:

import sys import csv import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files\excelfiles' filenames = glob.glob(path + "/*.xlsx") dfs = [] for df in dfs: xl_file = pd.ExcelFile(filenames) df=xl_file.parse('Sheet1') dfs.concat(df, ignore_index=True) 

  • Соответствие строки Python
  • Словарь доступа Python: производные классы базового класса в том же месте памяти
  • Как я могу сделать метод, который запускается каждый раз, когда кадр отображается в tkinter
  • Интерполяция ConfigParser и String с переменной env
  • Как мы обрабатываем Python xmlrpclib Connection Refused?
  • Как получить экземпляры ModelChoiceField в шаблоне
  • Как обрабатывать огромные текстовые файлы, содержащие символы EOF / Ctrl-Z, используя Python в Windows?
  • Python как PDF-редакция и обработка Framework
  • One Solution collect form web for “Импортируйте несколько файлов excel в pandon pandas и объедините их в один фрейм данных”

    Как упоминалось в комментариях, одна ошибка, которую вы делаете, заключается в том, что вы перебираете пустой список.

    Вот как я это сделаю, используя пример наличия пяти одинаковых файлов Excel, которые добавляются один за другим.

    (1) Импорт:

     import os import pandas as pd 

    (2) Список файлов:

     path = os.getcwd() files = os.listdir(path) files 

    Вывод:

     ['.DS_Store', '.ipynb_checkpoints', '.localized', 'Screen Shot 2013-12-28 at 7.15.45 PM.png', 'test1 2.xls', 'test1 3.xls', 'test1 4.xls', 'test1 5.xls', 'test1.xls', 'Untitled0.ipynb', 'Werewolf Modelling', '~$Random Numbers.xlsx'] 

    (3) Выберите файлы «xls»:

     files_xls = [f for f in files if f[-3:] == 'xls'] files_xls 

    Вывод:

     ['test1 2.xls', 'test1 3.xls', 'test1 4.xls', 'test1 5.xls', 'test1.xls'] 

    (4) Инициализировать пустой фрейм данных:

     df = pd.DataFrame() 

    (5) Перечислить список файлов для добавления в пустой фреймворк:

     for f in files_xls: data = pd.read_excel(f, 'Sheet1') df = df.append(data) 

    (6) Наслаждайтесь новым фреймворком данных. 🙂

     df 

    Вывод:

      Result Sample 0 a 1 1 b 2 2 c 3 3 d 4 4 e 5 5 f 6 6 g 7 7 h 8 8 i 9 9 j 10 0 a 1 1 b 2 2 c 3 3 d 4 4 e 5 5 f 6 6 g 7 7 h 8 8 i 9 9 j 10 0 a 1 1 b 2 2 c 3 3 d 4 4 e 5 5 f 6 6 g 7 7 h 8 8 i 9 9 j 10 0 a 1 1 b 2 2 c 3 3 d 4 4 e 5 5 f 6 6 g 7 7 h 8 8 i 9 9 j 10 0 a 1 1 b 2 2 c 3 3 d 4 4 e 5 5 f 6 6 g 7 7 h 8 8 i 9 9 j 10 
    Interesting Posts

    Самый пифонический способ принятия аргументов с использованием optparse

    Как определить, работает ли ваше приложение на локальном сервере разработки Python?

    Как отключить второстепенные тики логарифма в Matplotlib?

    как преобразовать переменную в строку в python

    Проверьте, находится ли float рядом с любым поплавком, хранящимся в массиве

    Завершение объекта с его отношениями и исключение ненужных запросов в sqlalchemy

    Есть что-то вроде RStudio для Python?

    django-rest-framework HyperlinkedIdentityField с несколькими аргументами поиска

    Сериализовать и де-сериализовать поле Django Enum, чтобы принять числовое и текстовое представление

    Построение дерева в Python

    SQLAlchemy: выбор столбцов объекта в запросе

    Django – передать переменную js в django view

    Как выполнить необработанный SQL в приложении SQLAlchemy-flask

    Python, разность списков рассылки

    изменяемый тип внутри неизменяемого контейнера

    Python - лучший язык программирования в мире.