Простое объяснение логнормального распределения

Логнормальное распределение простое объяснение

Небольшая модификация знаменитого нормального распределения

Фото Джеймса Яремы на Unsplash

Основы

Нормальное распределение – это хорошо известное понятие, особенно в сферах науки о данных и машинного обучения. Но вы слышали о логнормальном распределении? Оно имеет применение в широком спектре отраслей, от биологии до финансов, поэтому для специалистов по обработке данных это очень полезное понятие. В этой статье мы рассмотрим теорию и применение этого распределения.

Определение

Логнормальное распределение относительно легко понять. Случайная величина X принадлежит логнормальному распределению, если её логарифм имеет нормальное распределение:

На следующем графике показано это понятие:

График, созданный автором на Python.

Обратите внимание, как применение логарифма к случайным величинам на левом графике приводит к распределению, которое имеет нормальное распределение, отображенное на правом графике.

Теория

Если Zстандартная нормальная переменная, то она имеет среднее значение µ равное 0 и стандартное отклонение σ равное 1. Логнормальное распределение для случайной величины X представляется следующим образом:

Затем, применяя логарифм к обеим сторонам уравнения:

Правая часть уравнения представляет собой нормальное распределение, так как Z имеет нормальное распределение. Следовательно, мы видим, что логарифм X имеет нормальное распределение.

Функция плотности вероятности (PDF) для логнормального распределения очень похожа на нормальное распределение, но к случайной величине x применяется логарифмическое преобразование:

См. здесь вывод PDF.

Применение

Логнормальное распределение часто используется для моделирования темпов роста, которые не зависят от размера. Это распространено в природных явлениях, например:

  • Измерение размеров живых организмов
  • Объем осадков
  • Количество нефти в нефтяном месторождении