Как автоматически импортировать и объединить несколько файлов в R

Автоматически импортировать и объединить файлы в R

Перестаньте тратить время на ручной импорт нескольких файлов

Фото от ThisisEngineering RAEng на Unsplash

В своей работе дата-сайентиста мне часто приходится импортировать несколько разных файлов, содержащих одинаковый тип информации из-за ограничений экспорта в разных программах. Если вы находитесь в подобной ситуации, внизу приведен ясный и простой способ автоматического импорта ваших файлов как отдельных наборов данных или их объединения в один набор данных.

Подготовьте ваши файлы

Прежде чем мы начнем с нашим кодом, мы должны подготовить наши файлы. Нам нужно иметь способ программно выбирать файлы, которые мы хотим импортировать в R. Хотя вы можете выбрать любой способ отличить эти файлы, вот два самых простых способа:

  1. Создайте уникальный префикс для всех файлов, которые вы хотите импортировать одновременно.
  2. Создайте отдельную папку в вашей рабочей директории и включите в нее только эти файлы.

Например, если у меня есть набор файлов Excel с названиями “SA#.xlsx”. Если у меня нет других похожих файлов, начинающихся с SA, тогда у меня уже есть мой префикс. Если в моей папке есть другие файлы, начинающиеся с SA, такие как “SAT.xlsx”, я легко могу создать папку и назвать ее “SA”. Затем я включу в эту папку только файлы, которые я хочу импортировать как SA.

Создайте список файлов

Как только у нас есть программный способ определить наши файлы, нам нужно создать список всех имен файлов. Мы можем использовать функцию R list.files() для этого.

Список файлов с префиксом

Если вы решите добавить префикс к именам файлов, мы будем использовать параметр pattern функции list.files() для выбора конкретных файлов, которые мы хотим.

# Формированиеспискафайлов filelist <- list.files(pattern = "^<prefix>")#Примерспискафайлов filelist <- list.files(pattern = "^SA")

Параметр pattern принимает регулярное выражение. Поэтому мы можем использовать символ “^” для обозначения начала строки. Это гарантирует, что любые другие имена файлов, содержащие “SA” внутри имени, но не в начале, не будут включены в этот набор имен. Примечание: Это будет получать файлы только из вашей рабочей директории. Вы можете изменить