10 Не пропустите сеансы по языковым моделям на конференции ODSC West 2023

10 Не пропустите сеансы по модным языковым тенденциям на конференции ODSC West 2023

LLM и Generative AI доминировали как в индустрии, так и в повседневной жизни в этом году. На конференции ODSC West, которая состоится с 30 октября по 2 ноября, мы поставили перед собой цель подготовить вас к новым технологиям, приложениям и необходимым навыкам, которые этот переход принесет. На конференции вы найдете практические тренировочные сессии, мастер-классы и доклады о LLM, Generative AI и инженерии запуска. Ниже вы найдете небольшой выбор подтвержденных сессий.

Персонализация LLM с помощью хранилища особенностей

Джим Даулинг | Генеральный директор | Hopsworks

В этой сессии вы узнаете, как персонализировать LLM с использованием хранилища особенностей (feature store) и инженерных наводок. Вы рассмотрите процесс создания примера бесплатного безсерверного приложения с персонализированным LLM с использованием Hopsworks, открытого хранилища особенностей с встроенной векторной базой данных, и узнаете, как создавать шаблоны для наводок, заполнять их реальными данными контекста в режиме реального времени и как можно включать документы из векторных баз данных в наводки с использованием комбинации пользовательского ввода и исторических пользовательских данных из хранилища особенностей.

Техники оценки больших языковых моделей

Раджив Шах, PhD | Инженер машинного обучения | Hugging Face

Выбор подходящей LLM для ваших нужд становится все более сложным. В ходе этого учебного пособия вы узнаете о практических инструментах и лучших практиках для оценки и выбора LLM.

Вы исследуете существующие исследования о возможностях LLM по сравнению с небольшими традиционными ML-моделями, а также несколько техник, включая оценочный набор EleutherAI Harness, методы сопоставления и использование LLM для оценки других LLM. Наконец, вы затронете тонкие факторы, влияющие на оценку, включая роль наводок, токенизацию, требования к фактической точности и проблемы модели и этики.

Создание бота для вопросов и ответов эксперта с использованием инструментов с открытым исходным кодом и LLM

Крис Ходж | Руководитель сообщества | Heartex

Помимо “понимания” мира, LLM наследуют предубеждения, которые трудно понять или контролировать. Эту проблему необходимо решать, поскольку они внедряются в приложения реального мира. В этой сессии будет рассмотрено, как Label Studio, LangChain, Chroma и Gradio могут быть использованы в качестве инструментов для непрерывного совершенствования, в частности при создании системы вопросов и ответов (QA).

Понимание ландшафта больших моделей

Лукас Бивальд | Генеральный директор и сооснователь | Weights & Biases

Присоединяйтесь к этой сессии, чтобы изучить текущую ситуацию с большими моделями от GPT-3 до Stable Diffusion. Вы также обсудите, как команды некоторых проектов с открытым исходным кодом используют W&B для ускорения своей работы.

Демократизация настройки открытых моделей с помощью системной оптимизации совместного использования

Кабир Нагреча | Аспирант | UC San Diego

В этой сессии будет представлен обзор основных идей, лежащих в основе Saturn, как он работает на техническом уровне для сокращения времени выполнения и затрат, а также процесс использования Saturn для настройки больших моделей. Вы изучите, как Saturn может ускорять и оптимизировать рабочие нагрузки с большими моделями всего лишь за несколько строк кода и опишете некоторые ценные в реальном мире примеры применения из индустрии и научного сообщества.

Создание работников знаний, основанных на LLM, на основе ваших данных с использованием LlamaIndex

Джерри Лью | Сооснователь и генеральный директор | LlamaIndex

LLM предлагает новые способы поиска, взаимодействия и генерации нового контента. В этой сессии вы изучите, как LlamaIndex позволяет вам создавать системы поиска и извлечения на основе LLM, а также автоматизированные работники знаний, способные взаимодействовать с источниками данных в более сложных взаимодействиях. В рамках этого мастер-класса вы увидите, как создать простого бота для вопросов и ответов, а также автоматизированный рабочий процесс.

Общее и эффективное самообучение на основе данных (data2vec)

Майкл Оли | Главный научный сотрудник в FAIR | Директор в Meta AI

В этой сессии будет рассмотрена технология data2vec – фреймворк для общего самообучения, который использует одинаковый метод обучения для речи, обработки естественного языка или компьютерного зрения. Вместо предсказания модально-специфичных целей, таких как слова, визуальные токены или единицы речи, в data2vec предсказываются контекстуализированные латентные представления, содержащие информацию из всего входного потока данных. Эксперименты на основных испытаниях распознавания речи, классификации изображений и понимания естественного языка демонстрируют новый метод, который является либо лидером, либо имеет конкурентоспособную производительность по сравнению с другими подходами.

К понятности и языково-независимым моделям глубокого языка

Валид С. Саба | Старший научный сотрудник | Институт экспериментального искусственного интеллекта Университета Норт-Истерн

Для решения проблем истинного понимания языка и отсутствия объяснительных возможностей, на этой сессии будет рассмотрено сочетание сил символических представлений с успешным обратным инжинирингом языка на масштабе. Таким образом, делается аргумент в пользу обратного инжиниринга языка в символической среде. Несколько авторов уже предложили некоторые идеи о том, что может стать результатом этого проекта, и вы здесь подробно обсудите, как этот проект может быть осуществлен.

За рамками демонстраций и прототипов: как создавать готовые к производству приложения с использованием открытых моделей глубокого языка

Сухас Паи | Главный технический директор | Bedrock AI

На этом семинаре будет рассмотрена область открытых моделей глубокого языка и предоставлен пошаговый план, как наиболее эффективно использовать их для создания готовых к производству приложений. Вы узнаете, как выбрать модель глубокого языка, наилучшим образом подходящую для вашей задачи, и изучите несколько методов доведения модели глубокого языка до подходящего для вас уровня, а также обсудите техники для работы с ограничениями в логике, галлюцинациями, пристрастиями и проблемами справедливости.

Большие модели глубокого языка – распространенные проблемы и трудности

Нилс Раймерс | Директор по машинному обучению | Cohere.ai

Эта сессия познакомит с тем, как большие модели глубокого языка (LLM) могут быть связаны с вашими данными через семантический поиск, с фокусом на множестве проблем и затруднений. Вы исследуете, как некоторые из них можно решить, используя правильные технологии, а также обсудите проблемы, которые до сих пор остаются не решенными.

Записывайтесь!

Чтобы принять участие в этих и многих других сессиях, проводимых экспертами по LLM, генеративному ИИ, машинному обучению, NLP, глубокому обучению, инжинирингу данных и многому другому, присоединяйтесь к нам на ODSC West уже через несколько недель. Зарегистрируйтесь сейчас, чтобы воспользоваться скидкой 40%, которая заканчивается в пятницу.