Ключевая ошибка при объединении pandas (левое соединение)

У меня есть два фрейма данных ниже: df_purchase (1) и df_login (2)

+--------+-----+--------+------------+--------------------+-------------+--------------------------+ | | age | gender | ttp | count | sum(amount) | region | +--------+-----+--------+------------+--------------------+-------------+--------------------------+ | 49427 | 63 | M | 824.731412 | 2 | 25.00 | Omaha, Nebraska | | 28433 | 49 | M | 1.166250 | 2 | 41.94 | Catasauqua, Pennsylvania | | 4162 | 29 | M | 5.620949 | 2 | 51.78 | Eagle Center, Iowa | | 18747 | 43 | M | 153.502072 | 2 | 23.84 | Pacific, Washington | | 45173 | 59 | M | 0.027257 | 2 | 13.98 | De Soto, Missouri | +--------+-----+--------+------------+--------------------+-------------+--------------------------+ +--------+-----+--------+------------+--------------------+-------------+--------------------------+ | | age | gender | count | region | | | | 671766 | 84 | M | 13900 | New York, New York | | | | 671166 | 84 | F | 7619 | New York, New York | | | | 672209 | 85 | F | 6483 | New York, New York | | | | 672671 | 85 | M | 5808 | New York, New York | | | | 195201 | 34 | M | 3817 | New York, New York | | | +--------+-----+--------+------------+--------------------+-------------+--------------------------+ 

Я пытаюсь присоединиться к df_logins к df_purchase по возрасту, полу и региону со следующим кодом pandas:

 df = pd.merge(df_purchase, df_login[['count']], how='left', on=['age', 'gender', 'region']) 

Тем не менее, я продолжаю получать эту ошибку: KeyError: 'age' Любые мысли?

One Solution collect form web for “Ключевая ошибка при объединении pandas (левое соединение)”

Из этого возникает KeyError:

 df = pd.merge(df_purchase, df_login[['count']] <- this selects just count column, how='left', on=['age', 'gender', 'region']) 

Вы выбрали только один столбец из df_login , вам это нужно:

 df = pd.merge(df_purchase, df_login, how='left', on=['age', 'gender', 'region']) 

Я предполагаю, что это не ваши полные данные, так как у вас нет общих значений в столбце age и region в df_login .

  • Проблемы, связанные с lambda для подачи заявки на панды DataFrame
  • Спектроскопические данные по спектру данных панд в 3D с разной длиной массива
  • ImportError: нет модуля с именем 'pandas.indexes'
  • Эквивалент Python R mclapply ()
  • Графический ящик
  • Преобразование текстовой таблицы в pandas dataframe
  • декартовой продукции в пандах
  • конвертировать числовые даты sas в datetime в Pandas
  • Python - лучший язык программирования в мире.