10 Не пропустите сеансы по языковым моделям на конференции ODSC West 2023
10 Не пропустите сеансы по модным языковым тенденциям на конференции ODSC West 2023
LLM и Generative AI доминировали как в индустрии, так и в повседневной жизни в этом году. На конференции ODSC West, которая состоится с 30 октября по 2 ноября, мы поставили перед собой цель подготовить вас к новым технологиям, приложениям и необходимым навыкам, которые этот переход принесет. На конференции вы найдете практические тренировочные сессии, мастер-классы и доклады о LLM, Generative AI и инженерии запуска. Ниже вы найдете небольшой выбор подтвержденных сессий.
Персонализация LLM с помощью хранилища особенностей
Джим Даулинг | Генеральный директор | Hopsworks
- Разговорные приложения с моделями большого языка, понимание последовательности ввода пользователей, подсказок и ответов
- Возникающие угрозы обеспечение безопасности приложений в эпоху языковых моделей
- Познакомьтесь с набором данных LMSYS-Chat-1M крупномасштабным набором данных, содержащим миллион реальных разговоров с 25 передовыми моделями глубокого обучения языка
В этой сессии вы узнаете, как персонализировать LLM с использованием хранилища особенностей (feature store) и инженерных наводок. Вы рассмотрите процесс создания примера бесплатного безсерверного приложения с персонализированным LLM с использованием Hopsworks, открытого хранилища особенностей с встроенной векторной базой данных, и узнаете, как создавать шаблоны для наводок, заполнять их реальными данными контекста в режиме реального времени и как можно включать документы из векторных баз данных в наводки с использованием комбинации пользовательского ввода и исторических пользовательских данных из хранилища особенностей.
Техники оценки больших языковых моделей
Раджив Шах, PhD | Инженер машинного обучения | Hugging Face
Выбор подходящей LLM для ваших нужд становится все более сложным. В ходе этого учебного пособия вы узнаете о практических инструментах и лучших практиках для оценки и выбора LLM.
Вы исследуете существующие исследования о возможностях LLM по сравнению с небольшими традиционными ML-моделями, а также несколько техник, включая оценочный набор EleutherAI Harness, методы сопоставления и использование LLM для оценки других LLM. Наконец, вы затронете тонкие факторы, влияющие на оценку, включая роль наводок, токенизацию, требования к фактической точности и проблемы модели и этики.
Создание бота для вопросов и ответов эксперта с использованием инструментов с открытым исходным кодом и LLM
Крис Ходж | Руководитель сообщества | Heartex
Помимо “понимания” мира, LLM наследуют предубеждения, которые трудно понять или контролировать. Эту проблему необходимо решать, поскольку они внедряются в приложения реального мира. В этой сессии будет рассмотрено, как Label Studio, LangChain, Chroma и Gradio могут быть использованы в качестве инструментов для непрерывного совершенствования, в частности при создании системы вопросов и ответов (QA).
Понимание ландшафта больших моделей
Лукас Бивальд | Генеральный директор и сооснователь | Weights & Biases
Присоединяйтесь к этой сессии, чтобы изучить текущую ситуацию с большими моделями от GPT-3 до Stable Diffusion. Вы также обсудите, как команды некоторых проектов с открытым исходным кодом используют W&B для ускорения своей работы.
Демократизация настройки открытых моделей с помощью системной оптимизации совместного использования
Кабир Нагреча | Аспирант | UC San Diego
В этой сессии будет представлен обзор основных идей, лежащих в основе Saturn, как он работает на техническом уровне для сокращения времени выполнения и затрат, а также процесс использования Saturn для настройки больших моделей. Вы изучите, как Saturn может ускорять и оптимизировать рабочие нагрузки с большими моделями всего лишь за несколько строк кода и опишете некоторые ценные в реальном мире примеры применения из индустрии и научного сообщества.
Создание работников знаний, основанных на LLM, на основе ваших данных с использованием LlamaIndex
Джерри Лью | Сооснователь и генеральный директор | LlamaIndex
LLM предлагает новые способы поиска, взаимодействия и генерации нового контента. В этой сессии вы изучите, как LlamaIndex позволяет вам создавать системы поиска и извлечения на основе LLM, а также автоматизированные работники знаний, способные взаимодействовать с источниками данных в более сложных взаимодействиях. В рамках этого мастер-класса вы увидите, как создать простого бота для вопросов и ответов, а также автоматизированный рабочий процесс.
Общее и эффективное самообучение на основе данных (data2vec)
Майкл Оли | Главный научный сотрудник в FAIR | Директор в Meta AI
В этой сессии будет рассмотрена технология data2vec – фреймворк для общего самообучения, который использует одинаковый метод обучения для речи, обработки естественного языка или компьютерного зрения. Вместо предсказания модально-специфичных целей, таких как слова, визуальные токены или единицы речи, в data2vec предсказываются контекстуализированные латентные представления, содержащие информацию из всего входного потока данных. Эксперименты на основных испытаниях распознавания речи, классификации изображений и понимания естественного языка демонстрируют новый метод, который является либо лидером, либо имеет конкурентоспособную производительность по сравнению с другими подходами.
К понятности и языково-независимым моделям глубокого языка
Валид С. Саба | Старший научный сотрудник | Институт экспериментального искусственного интеллекта Университета Норт-Истерн
Для решения проблем истинного понимания языка и отсутствия объяснительных возможностей, на этой сессии будет рассмотрено сочетание сил символических представлений с успешным обратным инжинирингом языка на масштабе. Таким образом, делается аргумент в пользу обратного инжиниринга языка в символической среде. Несколько авторов уже предложили некоторые идеи о том, что может стать результатом этого проекта, и вы здесь подробно обсудите, как этот проект может быть осуществлен.
За рамками демонстраций и прототипов: как создавать готовые к производству приложения с использованием открытых моделей глубокого языка
Сухас Паи | Главный технический директор | Bedrock AI
На этом семинаре будет рассмотрена область открытых моделей глубокого языка и предоставлен пошаговый план, как наиболее эффективно использовать их для создания готовых к производству приложений. Вы узнаете, как выбрать модель глубокого языка, наилучшим образом подходящую для вашей задачи, и изучите несколько методов доведения модели глубокого языка до подходящего для вас уровня, а также обсудите техники для работы с ограничениями в логике, галлюцинациями, пристрастиями и проблемами справедливости.
Большие модели глубокого языка – распространенные проблемы и трудности
Нилс Раймерс | Директор по машинному обучению | Cohere.ai
Эта сессия познакомит с тем, как большие модели глубокого языка (LLM) могут быть связаны с вашими данными через семантический поиск, с фокусом на множестве проблем и затруднений. Вы исследуете, как некоторые из них можно решить, используя правильные технологии, а также обсудите проблемы, которые до сих пор остаются не решенными.
Записывайтесь!
Чтобы принять участие в этих и многих других сессиях, проводимых экспертами по LLM, генеративному ИИ, машинному обучению, NLP, глубокому обучению, инжинирингу данных и многому другому, присоединяйтесь к нам на ODSC West уже через несколько недель. Зарегистрируйтесь сейчас, чтобы воспользоваться скидкой 40%, которая заканчивается в пятницу.