Когнитивные искажения в науке о данных искажение по категориям

Когнитивные искажения в науке о данных искажение по категориям

ХАКЕРЫ ПО СМЕЩЕНИЮ ДАННЫХ

Руководство по обходу предубеждений для специалистов по обработке данных

Фото Анди Ли на Unsplash

Представьте, что вы оказались в живописном районе с двумя пекарнями. Первая – небольшая семейная пекарня, уютно расположенная на углу улицы. Вторая, однако, – это грандиозное трехэтажное здание с вывеской, на которой показано его богатое разнообразие и новейшие печи.

Пока вы отправляетесь в поисках идеального буханки хлеба, вы привлекаете внимание высокой пекарни. Ее размеры и великолепие здания мгновенно производят впечатление, создавая предположение, что более крупная пекарня обязательно производит самый вкусный хлеб.

Таким образом, в этом сценарии вы неосознанно подчиняетесь ментальному склону, известному как предубеждение категорий по размеру. Это предубеждение заставляет вас полагать, что более крупная пекарня более вероятно предлагает превосходный хлеб.

На самом деле размер пекарни не обязательно коррелирует с качеством ее хлеба. У более маленькой семейной пекарни может быть строго охраняемый секретный рецепт, совершенствовавшийся несколько поколений, в то время как более крупная пекарня может акцентировать внимание на количестве, а не на ремесленном искусстве.

Это предубеждение отражает наш склон связывать более крупные категории с лучшими результатами, даже если конкретные характеристики в этих категориях могут не совпадать с нашими предположениями. Это явление называется предубеждением по размеру категории.

Предубеждение по размеру категории означает наш склон воспринимать результаты как более вероятные, когда они относятся к большей категории, в отличие от меньшей, даже когда вероятность каждого результата равна.

Несмотря на то, чтобы предубеждение было основано на экспериментально подтвержденных исследованиях, все еще существует вариабельность в интерпретации доказательств.

В области Data Science предубеждение по размеру категории может проявляться с помощью определенных предположений. Например:

Предположение 1: Более крупные и сложные модели всегда предоставляют лучшие прогнозы по сравнению с меньшими моделями.