Расшифровка экосистемы науки о данных с Викасом Агравалом

Разбор экосистемы науки о данных вместе с Викасом Агравалом

Исследуйте будущее искусственного интеллекта вместе с доктором Викашем Агравалом, старшим главным специалистом по обработке данных в Oracle Analytics Cloud. В этой поведущей сессии, посвященной данным, он делится своими взглядами на решение проблем в области науки о данных, MLops и влияние генеративного искусственного интеллекта на корпоративные решения. Обсуждение охватывает практические подходы и ловушки в проектах науки о данных, предлагая необходимые советы для начинающих ученых данных.

Основные выводы из нашего разговора с Викашем Агравалом

  • В науке о данных фокус на понимании проблемы критичен и занимает большую часть усилий.
  • Успешное доказательство концепции (POC) в науке о данных должно учитывать не только технические аспекты, но и практичность и масштабируемость решения.
  • Четкая коммуникация и установление реалистичных ожиданий с клиентами являются важными для избежания дорогостоящих недоразумений, вызванных рекламой искусственного интеллекта.
  • Генеративный искусственный интеллект имеет потенциал для революции в корпоративных решениях, особенно в областях, связанных с текстом и пользовательским интерфейсом.
  • Построение карьеры в науке о данных требует крепкого математического фундамента и глубокого понимания алгоритмов.
  • В корпоративной среде обеспечение надежности и достоверности выводов искусственного интеллекта требует новых методов валидации.
  • С развитием инструментов искусственного интеллекта ученые по данным должны обладать навыками для улучшения и развития этих инструментов, а не только их использования.

Ознакомьтесь с еще большим количеством подобных информативных сессий с ведущими экспертами по искусственному интеллекту и науке о данных на нашем сообществе!

Как вы достигаете баланса между технической глубиной и макроподходом в науке о данных?

В повседневной работе я многое обязан своим наставникам из различных уважаемых институтов и компаний, которые внушили мне философию о том, что технология – это средство для достижения цели, а не сама по себе. Ключевое значение имеет тщательное изучение проблемы – около 90% усилий приходится на это. Остальное – поиск решений, который часто включает изучение того, как другие решали подобные проблемы и чего в конечном итоге требует клиент. Этот подход является фундаментальным для связи технологии с бизнес-воздействием.

Как вы подходите к решению проблемы клиента?

После определения проблемы, которую стоит решать, мы первым делом проверяем наличие нужных данных для ее решения. Затем мы оцениваем, существует ли технология для решения проблемы в разумные сроки. Если мы видим путь, даже если это займет несколько лет, мы продолжаем с доказательством концепции (POC). Этот POC является комплексным и охватывает все – от потоков данных до функциональности от начала до конца, хотя масштабируемость на этой стадии не является главной проблемой. Целью является наличие четкого пути к алгоритмам, источникам данных и характеру ожидаемого вывода.

Как вы обрабатываете фазу оптимизации и ML ops?

После успешного POC мы переходим к фазе оптимизации, где лежит основная работа. Это включает в себя обеспечение того, чтобы модель адаптировалась к различным бизнес-процессам и географиям, а также способность исправляться, когда она выходит из диапазона. Это также связано с обеспечением возможности эффективного повторного обучения модели и ее соответствующего масштабирования. Эта фаза является критической, поскольку именно здесь модель переходит от концепции к практическому, применимому решению.

Какие наиболее распространенные ошибки в проектах науки о данных?

Наиболее дорогостоящие ошибки обычно связаны с рекламой искусственного интеллекта и неправильной коммуникацией. Важно установить четкие и взаимные ожидания с клиентом. Часто клиенты имеют высокие ожидания из-за шума в отрасли, связанного с искусственным интеллектом, не понимая, что с искусством может быть не всегда дается правильный ответ, которого они ищут. Еще одна опасность – неправильное определение проблемы, или непосредственное адресование проблемы клиента, или попытка «вылить океан ложкой».

Как вы взаимодействуете с генеративным искусственным интеллектом в своих рабочих процессах?

Генеративный искусственный интеллект широко не используется в большинстве предприятий из-за опасений относительно авторских прав и заражения интеллектуальной собственности. Однако мы используем коммерчески доступные открытые материалы. Генеративный искусственный интеллект значительно продвинулся в таких областях, как краткое изложение текста, расширение текста и предоставление объяснений. Проблемой остается доверие, и мы исследуем техники фильтрации выводов от больших моделей языков (LLM), чтобы гарантировать их надежность для корпоративного использования.

Какой влияние, по вашему мнению, имеет генеративное ИИ на решения в сфере предприятий?

Генеративное ИИ, вероятно, окажет наибольшее влияние на рабочие процессы, связанные с обработкой текста, такие как информационный поиск и пользовательские интерфейсы. Например, он может существенно улучшить предприятийский поиск, извлекая семантически схожие тексты. Он также может революционизировать интерфейсы естественного языка для баз данных, позволяя пользователям задавать вопросы на естественном языке и получать точные SQL-ответы.

Какой совет вы бы дали тем, кто сегодня входит в сферу науки о данных?

Сейчас очень интересное время для занятий наукой о данных, но крайне важно иметь прочные знания в области математики и понимание алгоритмов, с которыми вы работаете. По мере совершенствования инструментов искусственного интеллекта, умение расширять и улучшать их станет ценным навыком. Те, кто может создавать новые алгоритмы или понимать тонкости существующих, будут востребованы.

Выводы из разговора с Викашем Агравалом

В этой информативной сессии доктор Викаш Агравал поделился ключевыми идеями для успеха в карьере в области науки о данных. От акцентирования понимания проблемы до избегания подводных камней и использования генеративного ИИ, интервью предоставляет дорожную карту. Будущим ученым-исследователям данных рекомендуется создать прочные математические и алгоритмические основы для работы в постоянно развивающейся области. Это интервью знаменует новую эру инноваций в области искусственного интеллекта.

Следите за нами на сайте “Ведущие с данными”, чтобы получать информацию о путях к успеху более многих пионеров в сфере искусственного интеллекта и науки о данных в этой отрасли. Здесь вы можете ознакомиться с нашими предстоящими сессиями “Ведущие с данными”!