Адам Росс Нельсон о уверенной науке о данных

Adam Ross Nelson on confident data science

Поскольку в области науки о данных появляются новые направления, и исследования все еще трудно уловимы, иногда лучше обратиться к экспертам и пионерам этой области. Недавно мы беседовали с Адамом Россом Нельсоном, карьерным тренером по науке о данных и автором книг «Как стать специалистом по науке о данных» и «Уверенная наука о данных». В интервью мы говорили о том, что такое уверенная наука о данных, как научные работники могут уверенно и этично использовать искусственный интеллект, а также о новых направлениях, таких как инжиниринг запросов. Вы можете послушать полное интервью по ссылке здесь и прочитать транскрипт для двух интересных вопросов с Адамом Россом Нельсоном ниже.

Вопрос: Что такое уверенная наука о данных?

Адам Росс Нельсон: На самом деле, я много размышлял об этом не только из-за самой книги, но когда мне предложили написать эту книгу прошлым летом в рамках серии, я подумал: «Что такое уверенная наука о данных?». Одна из вещей, которую стоит знать, чтобы понять смысл названия, заключается в том, что эта книга является частью серии, в которой есть другие книги. Есть книга об уверенном пользовательском опыте, есть книга о уверенном программировании, и моя книга — о уверенной науке о данных.

Я хорошо подумал об этом и считаю, что уверенная наука о данных очень хорошо соответствует правилу 80/20. Это означает, что примерно восемьдесят процентов работы выполняется с помощью двадцати процентов инструментов. Таким образом, если в науке о данных у нас есть много общих задач, вызовов и примеров использования, и наука о данных предлагает полный спектр решений, из которых – или восемьдесят процентов – могут быть обслужены двадцатью процентами инструментов и двадцатью процентами знаний, связанных с наукой о данных. Затем научные работники должны немного специализироваться за пределами этих двадцати процентов, но ни один отдельный научный работник не может знать сто процентов всей темы, и я считаю, что это верно для многих областей.

Для меня уверенная наука о данных означает признание этого правила 80/20, признание этой динамики 80/20. Это знание того, что наука о данных – очень разнообразная область, и что в ней есть место для множества путей с разными предпосылками и интересами, и ни один научный работник никогда не сможет знать всю область. Это знание того, что вы знаете и умение делать это хорошо.

Вопрос: Какие проблемы привели вас к написанию этой книги?

Адам Росс Нельсон: Я заметил проблему в мире издания науки о данных несколько лет назад, когда я взял с полки около 10 книг по науке о данных – как очень общих, так и очень специфических для отрасли. Затем я просмотрел приложения, оглавления и глоссарии, и искал разделы об этике. И вы верите или нет, только две книги из десяти упоминали или обсуждали этику каким-то значимым, существенным и глубоким образом.

Именно тогда я понял, что здесь есть возможность, и я знал, что если я когда-нибудь напишу книгу, я буду работать над тем, чтобы исправить это и создать книгу, которая более целенаправленно сосредоточена на этике, ответственности и надежности на протяжении всей книги.

Другая вещь, которую я сделал для этой книги, – переписал историю науки о данных. Многие люди указывают на середину 1990-х годов как на начало науки о данных и на первых людей, которые действительно изобрели науку о данных, но я указываю на Аду Ловелас и Флоренс Найтингейл в XIX веке. Если вы никогда не читали о Аде Ловелас, то знайте, что она фактически писала о генеративном искусственном интеллекте в XIX веке. Она писала о том, как работает с Чарльзом Бэббиджем над аналитическим двигателем, который был ранним компьютером во многих отношениях. Ада Ловелас часто считают первым компьютерным ученым, потому что она часто приписывается как первый автор компьютерного алгоритма. В своем дневнике она пишет о том, как аналитический двигатель может быть способен сочинять музыку, а это и есть генеративный искусственный интеллект.

Как узнать больше о уверенной науке о данных и ответственном искусственном интеллекте

Хотя многие научные работники могут иметь добрую душу и только лучшие намерения при разработке алгоритмов, иногда трудно убедиться в том, что они используют искусственный интеллект уверенно, этично и ответственно. Посетив конференцию ODSC West с 30 октября по 2 ноября и, в частности, изучив секцию «Ответственный искусственный интеллект», вы узнаете все, что вам нужно знать о этической реализации искусственного интеллекта.