Этот бюллетень о искусственном интеллекте – все, что вам нужно #76

Все, что вам нужно знать о искусственном интеллекте – бюллетень #76

Что произошло на этой неделе в области искусственного интеллекта от Луи

На этой неделе мы сосредоточились на значительных достижениях в области искусственного интеллекта, выходящих за рамки преобразователей и больших моделей языка (LLM). В то время как недавний импульс новых моделей генерации видео на основе диффузии продолжался, нас больше всего впечатлила последняя модель DeepMind, GNoME.

GNoME – новая крупномасштабная графовая нейронная сеть, разработанная для поиска новых кристаллических материалов, которые значительно повышают скорость и эффективность открытий. Результаты модели были объявлены и сделаны доступными на этой неделе DeepMind. Удивительно, это увеличило на 10 раз количество известных человечеству стабильных материалов за одну неделю! Открытие GNoME 2,2 миллиона материалов было бы эквивалентно примерно 800 годам знаний. Из 2,2 миллиона предсказаний, 380 000 предположительно являются стабильными, что делает их перспективными кандидатами для экспериментального синтеза. Несмотря на этот огромный прорыв в человеческих знаниях, все еще существует узкое место в количестве лабораторий и экспертов, доступных для производства этих материалов и проверки их полезных свойств. В пользу этого, была опубликована вторая статья, демонстрирующая, как ИИ также может быть использован для помощи в производстве этих материалов.

Почему вам это может быть интересно?

https://deepmind.google/discover/blog/millions-of-new-materials-discovered-with-deep-learning/

История человечества регулярно разделяется и описывается новыми материалами, обнаруженными и использованными, и даже сегодня многие новые технологии могут быть вдохновлены обнаружением новых материалов, начиная от чистой энергии и компьютерных чипов, заканчивая термоядерным синтезом и суперпроводниками при комнатной температуре. Мы считаем, что есть высокая вероятность наличия революционного нового материала в представленных данными DeepMind; однако потребуется много времени, чтобы узнать, какие новые материалы обладают полезными свойствами и могут быть произведены масштабно и доступно по цене. Более широко, успех масштабирования графовых нейронных сетей здесь подразумевает, что недавняя экспансия графических процессоров ИИ, скорее всего, приведет к прорывам вне мира масштабирования LLM.

– Луи Петерс – соучредитель и генеральный директор Towards AI

Самые горячие новости

  1. Мета представляет Seamless: систему мультиязыкового перевода с сохранением экспрессии в режиме реального времени

Мета представила семейство моделей, позволяющих совершать выразительные мультиязыковые переводы с сохранением уникального голоса и ритма говорящего, что делает разговоры более естественными.

2. Представление SDXL Turbo: модель генерации текста в изображение в режиме реального времени

Stability AI представляет SDXL Turbo, новую модель генерации текста в изображение, использующую оседлую диффузию (ADD) для быстрого создания высококачественных изображений за один шаг. Она позволяет быстро и точно создавать изображения размером 512 х 512 всего за 200 миллисекунд.

3. Впечатляющий дебют Pika в качестве генератора видео с искусственным интеллектом, нацеленного на гигантов технологической отрасли

Компания Pika Labs выпустила Pika 1.0, впечатляющий инструмент генерации видео с использованием искусственного интеллекта. Он обладает продвинутыми функциями, такими как текст-видео и изображение-видео конвертация. Компания также привлекла $55 миллионов финансирования для конкуренции с гигантами Meta, Adobe и Stability AI.

4. Starling-7B: увеличение полезности и безопасности LLM с помощью RLAIF

Беркли представила модель Starling-7B, мощную языковую модель, которая использует обратную связь от искусственного интеллекта с помощью обучения с подкреплением (RLAIF). Она использует набор данных с ранжированием Nectar, новый генеративно-рейтинговый датасет Berkley GPT-4. Модель превосходит все существующие модели на тесте MT-Bench, кроме GPT-4 и GPT-4 Turbo от OpenAI.

5. Amazon представляет новые чипы для обучения и запуска AI-моделей

AWS представила свое новое поколение AI-чипов – Graviton4 и Trainium 2, предназначенных для обучения и вывода моделей. Trainium 2 обеспечивает вдвое лучшую производительность и вчетверо большую энергоэффективность, а Graviton4 предоставляет до 30% более высокую вычислительную производительность, 50% больше ядер и 75% больше пропускной способности памяти по сравнению с предыдущим поколением.

На этой неделе было выпущено несколько новых генеративных моделей для создания изображений, звука и видео. Какая из них кажется вам наиболее перспективной и почему? Поделитесь своим мнением в комментариях.

Пять 5-минутных статей/видео, чтобы продолжать обучаться

  1. LLM Visualizations

В этой статье показаны визуализации известных архитектур Transformer, включая nano GPT, GPT2 и GPT3. Она предоставляет ясные визуальные изображения и иллюстрирует связи между всеми блоками.

2. Как улучшить ваш LLM?

Это видео поможет разработчикам и энтузиастам искусственного интеллекта улучшить LSTM-модели языка, предлагая методы для незначительных и существенных улучшений. Оно также поможет выбрать между обучением с нуля, дообучением, (продвинутым) инжинирингом запросов и Retrieval Augmented Generation (RAG) с использованием Deep Memory от Activeloop.

3. Оглядываясь назад на трансформационный год в области искусственного интеллекта

c прошлого года OpenAI тихо запустила ChatGPT. В этой статье прослежена таймлайн эволюции искусственного интеллекта за последний год и рассмотрены возможности этих технологий в креативной и познавательной работе, как мы ее знаем.

4. Почему обертки для ИИ получают плохую репутацию?

Обертки для ИИ – это практические инструменты, использующие API искусственного интеллекта для генерации результата и приносящие создателям значительные финансовые вознаграждения. Примеры, такие как Formula Bot и PhotoAI, имеют годовой доход от 200 тысяч до 900 тысяч долларов.

5. 5 способов применения искусственного интеллекта в технологиях

Прасад Рамакришнан, главный информационный директор Freshworks, подчеркивает несколько практических примеров использования искусственного интеллекта в стартапах. Эта статья исследует пять способов применения ИИ для эффективного решения проблем, от улучшения пользовательского опыта до оптимизации процессов привлечения и оптимизации данных.

Репозитории и инструменты

  1. Whisper Zero by Gladia – полная переработка Whisper ASR для исключения галлюцинаций.
  2. Taipy – открытая Python-библиотека для создания фронтенда и бэкенда веб-приложений.
  3. GPT-fast – простая и эффективная генерация текста с использованием трансформеров в нативном коде PyTorch менее чем на 1000 строках кода на Python.
  4. GitBook – платформа для управления техническими знаниями, централизующая базу знаний для команд.

Лучшие статьи недели

  1. Могут ли общие фундаментальные модели превзойти специализированное настройка? Исследование случая в медицине

GPT-4 превзошел Med-PaLM 2 в отвечении на медицинские вопросы с использованием новой методологии Medprompt. Благодаря трем продвинутым стратегиям подсказок, GPT-4 достигла впечатляющей точности в 90,2% на наборе данных MedQA.

2. Мерлин: Повышение мультимодальных LLM с помощью последовательности действий

“Merlin,” новая модель MLLM с поддержкой FPT и FIT, демонстрирует улучшенное визуальное восприятие, прогнозирование будущего и анализ мультимодального ввода с несколькими изображениями. Исследователи предлагают добавить моделирование будущего в мультимодальные модели LLM (MLLM), чтобы улучшить их понимание основных принципов и намерений субъектов. Они используют техники учения предвидения (FPT) и настройки инструкций предвидения (FIT), вдохновленные существующими парадигмами обучения.

3. Дельфины: Мультимодельный языковой модуль для автопилота

Дельфины – это модель видео-языка, разработанная в качестве разговорного помощника автопилота. Обученная с использованием видеоданных, текстовых инструкций и исторических сигналов управления, она обеспечивает всестороннее понимание сложных ситуаций на дороге для автономных транспортных средств.

4. Модели диффузии без внимания

В этой статье представлена модель диффузионного пространства состояний (DiffuSSM), архитектура, заменяющая механизмы внимания более масштабируемым основным компонентом модели. Такой подход эффективно обрабатывает изображения более высокого разрешения без глобального сжатия, сохраняя детализированное представление изображения на протяжении всего процесса диффузии.

5. Развитие и потенциал агентов на основе моделей большого языка: Обзор

Это всесторонний обзор агентов, основанных на моделях большого языка (LLM). Он прослеживает концепцию агентов от философских корней до развития в области искусственного интеллекта и объясняет, почему LLM-ы являются подходящим фундаментом для агентов. Также представлена общая структура агентов на основе LLM, включающая три основных компонента: мозг, восприятие и действие.

  1. Alibaba Cloud представляет модель искусственного интеллекта Tongyi Qianwen с 72 миллиардами параметров. Qwen-72B конкурирует с ChatGPT от OpenAI и превосходит его в знании английского, китайского языков, математики и программирования.
  2. Генеральный директор Nvidia Дженсен Хуанг стал лидером роста компании в области искусственного интеллекта, что привело к увеличению ее стоимости на 200 миллиардов долларов. Благодаря уклону в развитие и применение искусственного интеллекта в различных отраслях, Nvidia опередила крупные компании, такие как Walmart.
  3. Google реагирует на давление инструментов генеративного ИИ и судебные тяжбы, изменяя свой поисковый опыт. Они тестируют функцию “Заметки” для публичных комментариев к результатам поиска и представляют функцию “Подписка”, позволяющую пользователям подписываться на конкретные темы поиска.

Кто нанимает в области искусственного интеллекта

Прикладной ученый в области искусственного интеллекта @Gusto, Inc. (Сан-Франциско, Калифорния, США)

Старший инженер LLM @RYTE Corporation (Париж, Франция/Фрилансер)

Инженер машинного обучения @LiveChat (Удаленная работа)

Разработчик приложений – эксперт – K0714 @TLA-LLC (Виргиния, США)

Data Analyst @Empowerly (Remote)

Консультант (аналитика данных и процессов) @Celonis (Дания)

Менеджер по инженерии качества @Brightflag (Remote)

Интересуетесь возможностью публикации вакансии здесь? Обратитесь к .

Если вы готовитесь к интервью по машинному обучению, не стесняйтесь посетить наш ведущий веб-сайт по подготовке к интервью, confetti!

https://www.confetti.ai/

Думаете, вашему другу тоже понравится это? Поделитесь этой рассылкой и позвольте им присоединиться к обсуждению.