Это AI-информационное письмо – все, что вам нужно #66

AI-информационное письмо все, что вам нужно знать (#66)

Что произошло на этой неделе в сфере искусственного интеллекта от Луи

На этой неделе OpenAI снова доминировала в заголовках, объявив о скором запуске новых голосовых и образных возможностей в ChatGPT. Гонка за LLM продолжается набирать обороты, с Amazon, объявившей о значительных инвестициях в Anthropic AI.

OpenAI запускает новые мультимодальные версии GPT Turbo и GPT-4, а также интеграции ChatGPT с новой моделью текста в речь, Whisper (модель речи в текст) и Dalle-3. Теперь ChatGPT обладает способностью видеть, слышать и говорить, а также художественные способности. Эти новые возможности ChatGPT позволят пользователям вести голосовые разговоры и использовать изображения для улучшения взаимодействия. Теперь пользователи могут сделать фотографию и вести живые разговоры на ее основе, что будет полезно в различных ситуациях, таких как определение достопримечательностей, планирование блюд на основе содержимого холодильника или помощь в решении математических задач. Эти функции сначала будут доступны для пользователей Plus и Enterprise, при этом голос будет доступен на iOS и Android, а изображения – на всех платформах. Мы также взволнованы новой моделью генерации изображений Dalle 3, которая имеет меньшую зависимость от текстовых подсказок. Мы надеемся увидеть замечательные произведения искусства, созданные этим новым итеративным дизайном через чат.

OpenAI стремилась опередить Google Deepmind’s Gemini в выпуске полной мультимодальной модели (хотя у Bard уже есть некоторые ограниченные возможности работы с изображениями). Она также, вероятно, опередит Amazon Alexa, представив на рынок чат-бот, работающий на основе LLM. Amazon объявила о предстоящем запуске своей обновленной Alexa, работающей на базе мультимодального LLM, способной обрабатывать голос, видео и текстовые вложения. В то время как демонстрационное видео от Alexa показывает в основном задачи генерации текста, Amazon объявляет, что Alexa LLM подключена к тысячам API и может выполнять сложные последовательности задач. В других новостях Amazon сообщила о вложении до 4 миллиардов долларов в Anthropic AI для разработки надежных моделей структуры.

Гонка за искусственным интеллектом набирает новые обороты, и теперь кажется, что ведущие облачные поставщики выстроили свои ключевые лаборатории с партнерами LLM: Google Cloud поддерживает Deepmind, Microsoft Azure поддерживает OpenAI, а Amazon AWS поддерживает Anthropic.

– Луи Питерс — Сооснователь и Генеральный директор Towards AI

Самые горячие новости

1. OpenAI объявляет о DALL·E 3

OpenAI запускает DALL·E 3, улучшенную версию, которая отличается в следовании инструкциям, требует меньше инженерии подсказок и может взаимодействовать с ChatGPT. Эта интеграция позволяет пользователям уточнять подсказки DALL·E 3, описывая свои идеи для ChatGPT. Начиная с октября, DALL·E 3 будет доступен для пользователей ChatGPT Plus и Enterprise.

2. Amazon инвестирует 4 миллиарда долларов в Anthropic для конкуренции с Microsoft (OpenAI)

Amazon планирует инвестировать до 4 миллиардов долларов в искусственный интеллект Anthropic. Соглашение является частью более широкого сотрудничества в разработке надежных и высокопроизводительных моделей структуры. Amazon Web Services (AWS) станет основным облачным провайдером для Anthropic. Инвестиция включает использование микросхем AWS Trainium и Inferentia для обучения и развертывания моделей.

3. DeepMind объявляет о AlphaMissense, каталоге генетических мутаций, помогающем выявить причину заболеваний

DeepMind представляет AlphaMissense, модель, которая использует прогнозирование структуры белка AlphaFold для классификации миссенс-мутаций как доброкачественные или злокачественные. Благодаря этому, она превосходит усилия человека, классифицируя 89% из 71 миллиона вариантов.

4. Microsoft объявляет о Microsoft Copilot, вашем помощнике на каждый день с использованием искусственного интеллекта

Microsoft запускает Copilot для предоставления индивидуальной помощи на основе рабочих данных и контекста Интернета. Он повышает производительность и креативность в Windows 11, Microsoft 365, Edge и Bing, при этом уделяя приоритет конфиденциальности. Кроме того, пользователям Bing и Edge станет доступен персонализированный опыт работы с моделью DALL·E 3 от OpenAI, включая шопинг с использованием искусственного интеллекта и создание изображений.

5. Meta приносит ‘Sassy Chatbots’ для молодых пользователей

Meta готовится объявить о разработке генеративного ИИ-чатбота, внутренне названного “Gen AI Personas”, который предназначен для молодых пользователей. Meta также планирует разработать ‘дюжины’ персонажей-чатботов, включая тех, которые будут взаимодействовать со своими поклонниками.

Пять 5-минутных чтений / видео для вашего образования

1.Adept.ai объявляет о проблемах, возникших во время обучения их больших моделей

Adept.ai, компания по разработке ИИ, дает идины по возможным ошибкам, которые могут возникнуть во время обучения больших моделей. Эти ошибки могут привести к проблемам с кривой обучения, когда модели могут выглядеть нормально, но требуют исправления из-за накопления незначительных ошибок со временем.

2. Инженерия запросов для модели Claude с длинным окном контекста

В данной статье представлены рекомендации по постановке запросов, чтобы использовать длинное окно контекста в 100 000 токенов для модели Claude. Будут представлены количественные исследования двух техник, которые могут улучшить воспоминания Claude в длинных контекстах, извлекать цитаты и предоставлять примеры.

3. Cооснователь DeepMind: генеративный ИИ – всего лишь фаза. Впереди – Интерактивный ИИ

Мустафа Сулейман, сооснователь DeepMind, подчеркивает положительное влияние технологии на здравоохранение и возглавляет команду разработки политики ИИ в Google. Поддерживаемый влиятельными фигурами и компаниями, Сулейман представляет Пи, дружелюбного ИИ, который пропагандирует интерактивный ИИ для связи технологий с общественным влиянием.

4. Лидерборд обнаружения объектов

Hugging Face представляет Лидерборд обнаружения объектов, где представлены модели, показывающие лучшие результаты на основе архитектур DETA и DETR. В этом блоге будет показано, как эти модели были оценены, а также разъясняются популярные метрики, используемые в обнаружении объектов, от пересечения с объединением (IoU) до средней точности (AP) и средней полноты (AR).

5. GPT 3.5 против Llama 2 Fine-tuning: подробное сравнение

В этой публикации автор документирует свои эксперименты, сравнивая настройку GPT 3.5 с Llama 2 на задаче SQL и функционального представления. GPT 3.5 немного превосходит Llama 2, однако обучение и использование GPT 3.5 обходится в 4-6 раз дороже, чем Llama 2.

Статьи и репозитории

1.LongLoRA: эффективная настройка больших языковых моделей с длинным контекстом

LongLoRA – это метод эффективного расширения размера контекста предварительно обученных языковых моделей (LLMs) в искусственном интеллекте. С использованием разреженного локального внимания во время обучения и плотного глобального внимания во время вывода, этот подход позволяет эффективно настраивать модели и поддерживать их производительность. Он продемонстрировал впечатляющие результаты на различных задачах и позволяет расширять контекст до 100 тысяч токенов в LLMs.

2. Шкалирующие законы для фондовых моделей с разреженной связностью

Исследователи открыли уникальный закон масштабирования, который показывает связь между разреженностью весов, количеством ненулевых параметров и объемом обучающих данных в фондовых моделях. Они также обнаружили, что оптимальный уровень разреженности для достижения лучшей производительности возрастает с увеличением объема данных.

3. PDFTriage: ответы на вопросы по длинным структурированным документам

Исследователи разработали PDFTriage, решение, которое повышает производительность систем вопросно-ответной модели на основе языковой модели на структурированных документах, таких как PDF. Включая структуру документа и его содержимое, PDFTriage превосходит существующие модели в ответах на сложные вопросы из различных категорий.

4. Цепочка проверок снижает галлюцинации в больших языковых моделях

Chain-of-Verification (CoVe) – это простой подход, минимизирующий галлюцинации в языковых моделях. CoVe успешно снижает галлюцинации в различных задачах, включая вопросно-ответные системы и генерацию текста, благодаря систематическому процессу генерации, проверки и предоставления ответов.

5. Подключение больших языковых моделей с помощью эволюционных алгоритмов обеспечивает мощные оптимизаторы запросов

EvoPrompt, новый фреймворк эволюционных алгоритмов, оптимизирует генерацию запросов для языковых моделей, таких как GPT-3.5 и Alpaca. Он превосходит запросы, созданные человеком, и текущие методы, демонстрируя свою эффективность для языковых задач.

Нравятся эти статьи и краткие новости? Получайте ежедневные обзоры в вашем почтовом ящике!

Раздел сообщества Learn AI Together!

Предстоящие мероприятия сообщества

Сообщество Learn AI Together проводит еженедельные семинары по искусственному интеллекту, чтобы помочь участникам сообщества учиться у ведущих экспертов отрасли, задавать вопросы и получать более глубокое понимание последних исследований в области искусственного интеллекта. Присоединяйтесь к нам на бесплатных, интерактивных видеосессиях, проводимых вживую на платформе Discord, каждую неделю на наших предстоящих событиях.

  1. Пояснение согласованности искусственного интеллекта

На вебинаре Руйки Чжон будет рассказывать о согласованности искусственного интеллекта, проводимом как часть серии мероприятий Prompt Hackathon. Познакомьтесь с Руйки и согласованностью искусственного интеллекта перед ее выступлением в ее публикации «Пояснение согласованности искусственного интеллекта в качестве NLPer и почему я работаю над этим».

Дата и время: 28 сентября 2023 г., 12:00 по восточному стандартному времени

Присоединяйтесь к мероприятию здесь или Добавьте наш календарь Google, чтобы видеть все наши бесплатные мероприятия по искусственному интеллекту!

Мем недели!

Мем опубликован archiesnake

Популярный пост сообщества из Discord

Kylejmichel разрабатывает Glimpse, расширение браузера, которое извлекает контекст из веб-данных в режиме реального времени и с любого веб-сайта, который вы просматриваете. Оно выделяет ключевые моменты, предлагает вопросы и темы, фильтрует и перефразирует текст любого веб-сайта, документа, статьи или видео. Оно будет наиболее полезно для студентов, разработчиков и потребителей контента. Посмотрите здесь и поддержите участника сообщества! Делитесь своими вопросами и отзывами в обсуждении.

AI голосование недели!

Присоединяйтесь к обсуждению на Discord.

Раздел TAI Curated

Статья недели

Как автоматически исследовать и очищать данные с помощью PandasAI от Cornellius Yudha Wijaya

С появлением модели GPT возникает интересное приложение – объединение мощи LLM и Pandas. PandasAI – это пакет для Python, который предоставляет реализацию LLM в Pandas. Он направлен на дополнение функциональности Pandas, а не на ее замену. Используя PandasAI, мы можем превратить пакет Pandas в инструмент для разговоров, который автоматически исследует и очищает наши данные.

Наши необходимые статьи

Generative AI для временных рядов от Fabiana Clemente

Как генерирует текст LLM? от Ivan Reznikov

Если вы хотите опубликовать свою работу на Towards AI, проверьте наши руководства и зарегистрируйтесь. Мы опубликуем вашу работу в нашей сети, если она соответствует нашим редакторским политикам и стандартам.

Вакансии

Инженер машинного обучения @Mercari (удаленная работа)

Инженер машинного обучения @OXMAN (Нью-Йорк, Нью-Йорк, США)

Инженер интеллектуальной автоматизации / машинного обучения @Node.Digital (Вашингтон, округ Колумбия, США)

Старший специалист по обработке данных @DNSFilter (удаленная работа)

Младший программист-инженер (Vaga Exclusiva para PCDs) @Loggi (удаленная работа)

Инженер машинного обучения @Blackbird.AI (удаленная работа)

Старший специалист по обработке данных / инженер машинного обучения @Zenni Optical (удаленная работа)

Интересуете вас возможность размещения здесь вакансии? Свяжитесь с .

Если вы готовитесь к своему следующему собеседованию по машинному обучению, не стесняйтесь посетить наш ведущий сайт подготовки к интервью, confetti!

https://www.confetti.ai/