Как автоматически импортировать и объединить несколько файлов в R
Автоматически импортировать и объединить файлы в R
Перестаньте тратить время на ручной импорт нескольких файлов
В своей работе дата-сайентиста мне часто приходится импортировать несколько разных файлов, содержащих одинаковый тип информации из-за ограничений экспорта в разных программах. Если вы находитесь в подобной ситуации, внизу приведен ясный и простой способ автоматического импорта ваших файлов как отдельных наборов данных или их объединения в один набор данных.
Подготовьте ваши файлы
Прежде чем мы начнем с нашим кодом, мы должны подготовить наши файлы. Нам нужно иметь способ программно выбирать файлы, которые мы хотим импортировать в R. Хотя вы можете выбрать любой способ отличить эти файлы, вот два самых простых способа:
- Создайте уникальный префикс для всех файлов, которые вы хотите импортировать одновременно.
- Создайте отдельную папку в вашей рабочей директории и включите в нее только эти файлы.
Например, если у меня есть набор файлов Excel с названиями “SA#.xlsx”. Если у меня нет других похожих файлов, начинающихся с SA, тогда у меня уже есть мой префикс. Если в моей папке есть другие файлы, начинающиеся с SA, такие как “SAT.xlsx”, я легко могу создать папку и назвать ее “SA”. Затем я включу в эту папку только файлы, которые я хочу импортировать как SA.
Создайте список файлов
Как только у нас есть программный способ определить наши файлы, нам нужно создать список всех имен файлов. Мы можем использовать функцию R list.files() для этого.
- Баги в Python? Pdb спасает!
- Искусственный интеллект и разделение источников музыки как это работает и почему это так сложно
- Школа инженерии приветствует доктора Сонги Иун, выпускницу 2000 года, в качестве посетителя-исследователя по инновациям.
Список файлов с префиксом
Если вы решите добавить префикс к именам файлов, мы будем использовать параметр pattern функции list.files() для выбора конкретных файлов, которые мы хотим.
# Формированиеспискафайлов filelist <- list.files(pattern = "^<prefix>")#Примерспискафайлов filelist <- list.files(pattern = "^SA")
Параметр pattern принимает регулярное выражение. Поэтому мы можем использовать символ “^” для обозначения начала строки. Это гарантирует, что любые другие имена файлов, содержащие “SA” внутри имени, но не в начале, не будут включены в этот набор имен. Примечание: Это будет получать файлы только из вашей рабочей директории. Вы можете изменить…