«Не допускайте той же ошибки, которую я сделал в проекте машинного обучения!»

«Избегайте тех же ошибок, что и я в проекте по машинному обучению!»

Осознание важного компонента в проекте машинного обучения

Фото от Пьера Бамина на Unsplash

Часто мы нисколько не учитываем это.

Я узнал это на собственном опыте во время стажировки.

Мой путь начался, когда я начал изучать основы машинного обучения в колледже, я делал множество проектов, чтобы глубоко разобраться в том, как все работает.

Это помогло мне заранее преодолеть многих других, так как это улучшило мои знания для применения этих концепций на практике.

Но, не осознавая этого, я попал в цикл вициозных ловушек, и бессознательно продолжал повторять это в каждом проекте. Я был настолько сосредоточен и сосредоточен на:

  1. Какую модель машинного обучения использовать?
  2. Увеличение производительности с помощью стратегий оптимизации.
  3. Время, затраченное на анализ EDA.
  4. Различные методы очистки данных.

Этот список продолжается до самого конца этой статьи. И я с вами согласен, что это необходимо для создания высокопроизводительной модели.

Но если мы посмотрим на общую картину, вышеуказанные шаги в целом являются одинаковыми в каждом проекте машинного обучения. Так что, что вы думаете, какие изменения считаются важными для каждого проекта?

ДАННЫЕ ВСЕ ИЗМЕНЯЮТ !!!

Фото от Маркуса Списке на Unsplash

Когда меняются данные – меняются стратегии очистки данных, используемые визуализационные графики для поиска инсайтов, изменяется, какую модель выбрать, и так далее.

ПЕРСПЕКТИВА ДАННЫХ

Мы предполагаем, что проведение большего времени на разработку модели может изменить производительность с низкой на высокую. Но это не так, качество данных имеет огромное значение и является определяющим фактором для точности модели.

Чтобы получить более широкое понимание, давайте рассмотрим эти сценарии

Сценарий А