11 Способов лучше использовать машинное обучение на ODSC West 2023

11 Способов максимально использовать машинное обучение на конференции ODSC West 2023

Многие компании сейчас используют науку о данных и машинное обучение, но все еще есть много места для улучшения в терминах ROI. Анализ VentureBeat 2021 года говорит о том, что 87% моделей искусственного интеллекта никогда не попадают в рабочую среду, и статья MIT Sloan Management Review показывает, что 70% компаний сообщают о минимальном влиянии от проектов искусственного интеллекта. Тем не менее, несмотря на эти трудности, Gartner прогнозирует, что инвестиции в искусственный интеллект достигнут беспрецедентных 62,5 миллиарда долларов в 2022 году, что является увеличением на 21,3% по сравнению с 2021 годом.

Тем не менее, у нас все еще остается вопрос: Как мы можем улучшить машинное обучение? Чтобы узнать это, мы рассмотрели несколько предстоящих уроков и мастер-классов от ODSC West 2023 и позволили экспертам своими темами указать нам путь к созданию более хорошего машинного обучения.

Введение в разметку данных

Крис Ходже | Глава сообщества | Heartex

В современной эпохе машинного обучения нельзя недооценивать важность высококачественных и точно размеченных данных. Этот доклад вводит в создание высококачественных наборов данных с аннотацией для обучения моделей машинного обучения. В этом учебнике мы будем использовать Label Studio, инструмент для разметки данных с открытым исходным кодом, чтобы исследовать общие методы разметки исходных наборов данных, включая как методы разметки, выполняемые человеком, так и методы автоматической разметки.

Количественная неопределенность: подходы и методы

Брайан Лусена | Приоритетный | Numeristical

Мы начнем с обзора того, почему важно количественно оценивать неопределенность вокруг прогнозов модели. Мы обсудим, в чем отличие КН от задач классификации и регрессии, а также представим различные подходы. Этот мастер-класс предоставит теоретический контекст для этих методов, а затем приступит к примерам их реального применения с использованием блокнотов Jupyter.

Data Morph: предостережение о сводной статистике

Стефани Молин | Инженер-программист, ученый в области данных, начальник управления информационной безопасности, автор книги Hands-On Data Analysis with Pandas | Bloomberg

В этом докладе Стефани расскажет о пакете Data Morph, использующем метод имитации отжига для превращения произвольного входного набора данных в различные формы, сохраняя среднее значение, стандартное отклонение и корреляцию с точностью до нескольких десятичных знаков. Она покажет, как это работает, обсудит вызовы, с которыми столкнулась во время разработки, и изучит ограничения такого подхода.

СОБЫТИЕ – ODSC West 2023

Личная и виртуальная конференция

30 октября – 2 ноября

Присоединяйтесь к нам в погружении в последние тенденции, инструменты и техники в области науки о данных и искусственного интеллекта, от LLM до анализа данных и от машинного обучения до ответственного искусственного интеллекта.

Косвенный ИИ: от данных к действию

Д-р Андре Франка | Генеральный технический директор | connectedFlow

В этом докладе мы исследуем и демистифицируем мир косвенного искусственного интеллекта для специалистов в области науки о данных, с акцентом на понимании причинно-следственных связей внутри данных для принятия оптимальных решений. Мы сосредоточимся на технологиях шейпли, графах направленного акционирования, обнаружении причинно-следственных связей и принятии оптимальных решений.

Sбыстрое исполнение качественного открытия знаний с помощью искусственного интеллекта

Алекс Лью, Ph.D. | Основатель и директор | Лаборатория RMDS

В этой презентации наш спикер начнет с проведения всестороннего обзора списка общих причин неудач. Кроме того, он представит экосистемный подход на основе искусственного интеллекта для открытия знаний и обсудит реальный тест этого подхода, включающий 14 проектов по открытию знаний. Через это участники получат ценные идеи о важной связи между успехом проектов по открытию знаний с использованием данных и прогрессом в технологии искусственного интеллекта. Участники также оценят то, как этот экосистемный подход может привести к значительному ускорению, повышенному качеству и эффективному снижению рисков в проектах по открытию знаний.

Заполнение пробела в интерпретируемости при сегментации клиентов

Иви Фаулер | Старший научный сотрудник данных | Fulcrum Analytics

Исторически, существовали два основных подхода к сегментации: основанный на правилах и основанный на машинном обучении. В этой лекции Иви представит новый гибридный подход, сочетающий лучшие аспекты обоих методов. Процесс начинается с тщательного анализа данных клиентов и оценки наличия естественно образовавшихся кластеров в данных. Затем выбирается алгоритм кластеризации и настраивается модель для создания кластеров. После этого проводится дополнительный анализ данных для понимания того, что отличает каждый кластер от других. В конце используется линейное приближение для создания простого представления алгоритма кластеризации на основе машинного обучения.

Человеко-центрический искусственный интеллект

Питер Норвиг, Ph.D. | Инженерный директор, Феллоу по образованию | Google, Исследовательский институт Stanford по человеко-центрическому искусственному интеллекту (HAI)

Мы видели удивительные технические достижения в применении искусственного интеллекта в последние годы. В этой лекции будет рассмотрена человеческая сторона, а не техническая: как мы можем быть уверены, что наши приложения будут справедливыми, правдивыми, полезными и хорошо проработанными для пользователей, других заинтересованных сторон и общества в целом.

Обучение представлению на графах и сетях

Доктор Петар Величкович, Научный сотрудник | Преподаватель, DeepMind | Университет Кембридж

В этой лекции Петар представит несколько обзорных подходов к графовым нейронным сетям. Вначале он объяснит, зачем нужно обучение представлению на графах, а затем выведет графовые нейронные сети из первых принципов перестановочной инвариантности и эквариантности. Мы обсудим, как можно построить графовые нейронные сети, которые не полностью зависят от входной структуры графа. Лекция будет ориентирована на общедоступную аудиторию компьютерных ученых, хотя базовое знание машинного обучения с нейронными сетями будет полезным предварительным требованием.

Машинное обучение стало некромантией

Марк Саруфим | Автор | Breaking Stagnation

Машинное обучение претерпело глубокие изменения с появлением открытого исходного кода. С технологии, способной только к наивной аппроксимации кривых, оно превратилось в технологию, которая потенциально может положить конец доминированию человека. В 2017 году Али Рахими заявил, что машинное обучение – это новая алхимия, и мы хотим пойти дальше и утверждаем, что машинное обучение – это новая некромантия. Забытая наука с страстно развиваемой открытой этикой, которая в конечном итоге была уничтожена католической церковью.

Обнаружение аномалий в данных CRM

Гита Шанкар, Инженер программного обеспечения и Тули Нивас, Архитектор программного обеспечения | Salesforce

В нашей технической лекции мы продемонстрируем ценность машинного обучения и аналитической визуализации при решении реальных аналитических задач. Мы покажем, как наша система, основанная на данных, решает эти задачи и подчеркивает важность аналитики данных для обеспечения надежных систем и создания доверия клиентов.

Пропущенные данные: подход с использованием синтетических данных для восстановления пропущенных значений

Фабиана Клементе | Сооснователь и главный директор по данным | YData

В этой лекции мы рассмотрим использование генеративных моделей, таких как LLM и GAN, для генерации умных синтетических данных, которые могут быть использованы для восстановления пропущенных значений данных. Путем использования генеративной модели для восстановления пропущенных данных мы можем создавать новые выборки, соответствующие распределению исходных данных, что помогает снизить влияние пропущенных значений на наши модели. Кроме того, эти модели могут быть настроены для конкретных наборов данных, что позволяет генерировать синтетические данные, приспособленные к нашей конкретной ситуации.

Изучайте лучшие методы для лучшего машинного обучения на ODSC West 2023

Чтобы погрузиться глубже в эти темы, присоединяйтесь к нам на ODSC West 2023, который пройдет с 30 октября по 2 ноября, как лично, так и виртуально. Конференция также включает практические учебные сессии в областях, таких как машинное обучение, глубокое обучение, MLOps и инженерия данных, отвественное искусственное интеллект, и многое другое. Более того, вы можете расширить опыт обучения до 4 дней с помощью пропуска на буткемп. Ознакомьтесь со всеми типами пропусков здесь.