Этот AI (искусственный интеллект) новостной бюллетень – все, что вам нужно #73
AI (искусственный интеллект) новостной бюллетень #73 - всё, что вам нужно
Что произошло на этой неделе в области искусственного интеллекта от Луи
На этой неделе разговоры снова были затронуты последствиями Devday от OpenAI, новыми выпусками продуктов и спекуляциями о будущем потенциале GPTStore, в котором уже создано более 10 000 GPT. Однако нас также заинтересовали несколько новых исследований, опубликованных на этой неделе, по состоянию и внедрению искусственного интеллекта в экономике.
Последнее исследование исследовало влияние запуска ChatGPT на потери рабочих мест и заработок в сферах фриланса, таких как копирайтинг и графический дизайн. Исследование показало, что ChatGPT не только значительно сократил число доступных вакансий, но и снизил стоимость работы. Другое исследование, проведенное Бостонской консалтинговой группой (BCG), показывает, что сотрудники, которые имеют доступ к GPT-4, выполняют на 12% больше задач на 25% быстрее с 40% улучшением качества. В исследовании особо отмечен значительный рост производительности среди членов молодежной команды, которые могут использовать знания GPT-4 для дополнения своих навыков.
Кроме того, отчет «Состояние искусственного интеллекта 2023» от Retool.com, в котором приняли участие около 1600 человек, показывает интересные данные о настроении в отношении искусственного интеллекта, его внедрении и текущих лидерах. (Мы выделили некоторые интересные результаты в этом обзоре и настоятельно рекомендуем вам прочитать полный отчет.) Большинство респондентов разделяют общую веру в отношении ожидаемого влияния искусственного интеллекта на их карьеру в ближайшие пять лет. Кроме того, существует заметное предпочтение нанимать инженеров, владеющих AI-инструментами, такими как ChatGPT/Copilot. Интересно, что 80% участников используют различные варианты ChatGPT (включая GPT-3, 3.5 и 4). В то же время основные опасения связаны с точностью модели и галлюцинациями, с 67% респондентов, выразившими беспокойство. В части инструментов разработчика текущее доминирование на рынке принадлежит Huggingface, LangChain и LlamaIndex. Наконец, согласно участникам опроса, результаты исследования свидетельствуют о том, что GitHub Copilot, ChatGPT и Google Bard являются наиболее ценными инструментами.
Почему вам следует обратить внимание?
Легко пропустить невероятное темпы выпуска новых моделей и улучшения возможностей искусственного интеллекта. Однако иногда бывает сложно оценить, как эти инструменты используются в более широком контексте и насколько они начинают влиять на экономику. Поэтому мы считаем важным видеть подробные исследования внедрения искусственного интеллекта в различные отрасли, чтобы начать планировать как положительные, так и отрицательные последствия этой технологии. Очевидно, что в некоторых областях применение LLM уже значительно влияет на сотрудников, как отрицательно (снижение зарплаты), так и положительно (увеличение производительности и качества). Однако в других аспектах внедрение все еще находится на ранней стадии, и компании только начинают адаптироваться к новым возможностям. Возможно, последний продукт от OpenAI GPT и лучший пользовательский интерфейс для обмена подсказками и идеями для использования LLM ускорят эти тенденции.
- 7 шагов по запуску небольшой языковой модели на локальном CPU
- Будут ли большие языковые модели поставить конец программированию?
- Десять паттернов и антипаттернов в экспериментах с глубоким обучением
– Луи Питерс – Сооснователь и генеральный директор Towards AI
Самые горячие новости
NVIDIA значительно усовершенствовала библиотеку Pandas, достигнув до 150-кратного увеличения производительности с использованием GPU. С новым модулем cudf.pandas операции автоматически выполняются на GPU или CPU с автоматической синхронизацией и эффективным переключением между ними.
2. Искусственный интеллект и открытый исходный код в 2023 г.
В 2023 году исследования в области искусственного интеллекта и отрасль сосредоточились на улучшении существующих технологий, таких как GPT и DALL-E, а не на радикальных инновациях. Компании стали более осторожными в отношении своей коммерческой информации, что привело к уменьшению публичных публикаций исследовательских статей. Однако в открытом исходном коде были достигнуты продуктивные прогрессирующие результаты, и Fuyu-8B позволил создавать более компактные и эффективные модели. Искусственный интеллект оказался полезным в различных областях, но в будущем необходимо решить этические вопросы и проблемы.
3. Copilot превращает GitHub в разработчик платформу на основе искусственного интеллекта
GitHub реализует технологию искусственного интеллекта через Copilot и Copilot Chat, стремясь революционизировать разработку программного обеспечения, предоставляя понимание кода, предложения, исправления уязвимостей и повышенный опыт разработчика. Copilot Chat будет основан на модели GPT-4 от OpenAI и станет доступным с декабря 2023 года.
4. OpenAI хочет сотрудничать с организациями для создания новых наборов данных для обучения ИИ
OpenAI объявила о запуске программы Data Partnerships, нацеленной на сотрудничество с организациями-партнерами для создания общедоступных и частных наборов данных для обучения моделей ИИ. Эта программа стремится сделать модели более практичными для различных организаций. Основной целью программы является сбор обширных данных, которые не легко найти в сети интернет, особенно данные, отражающие намерения людей на разных языках, темах и форматах.
5. Представляем Adept Experiments
Adept открывает доступ к Adept Experiments, инструменту для построения рабочего процесса на основе ИИ, который позволяет пользователям автоматизировать сложные или утомительные задачи на разных платформах с помощью простых команд на естественном языке. Он помогает делегировать повторяющиеся задачи, преобразовывать неструктурированные данные в структурированные и даже заказывать ужин.
На этой неделе в области искусственного интеллекта было уделено внимание усовершенствованию существующих технологий, данных и вычислений. Каково ваше мнение: создавать новое или усовершенствовать то, что уже есть? Поделитесь своим мнением в комментариях!
Пять статей/видео продолжительностью в 5 минут для образования
Этот эссе представляет отличный обзор искусственного интеллекта и его развития. Статья прослеживает ключевые события, формировавшие современное состояние ИИ, с активным участием таких влиятельных компаний, как Google, IBM и OpenAI. В ней также затрагивается будущее ответственного ИИ, потребительского ИИ и др.
2. Подготовка GPT-4 к анализу изображений графиков: достаточно ли вызовов?
Последняя версия GPT, GPT-4, представила возможности анализа изображений, включая изображения графиков. В то время как она может предоставить общий анализ изображений графиков, есть место для значительного улучшения, особенно в точном количественном измерении данных. В этой статье используются несколько видов графиков для определения того, насколько GPT-4 хорошо (или плохо) справляется с анализом изображений графиков.
3. Измерение галлюцинаций в системах RAG
Модель оценки галлюцинаций (HEM) является инструментом с открытым исходным кодом, разработанным для измерения частоты галлюцинаций в системах Retrieval Augmented Generation (RAG). Он оценивает надежность ИИ, оценивая способность генеративных моделей LLM точно суммировать результаты без производства несвязанных или смещенных выводов.
DALL·E-3 – улучшенная версия моделей текст-изображение DALL-E, обладающая высоким качеством изображений в различных областях. Некоторые значимые особенности включают переработку запроса с использованием GPT-4 для улучшения результатов, настраиваемые параметры качества изображения и гибкие размеры изображений. В этой статье рассматриваются новые возможности DALL·E-3 с примерами того, какие новые продукты можно создать с использованием API.
5. Оптимизация связанных с временем компиляции
Это руководство охватывает функции, связанные с оптимизацией времени компиляции, сосредоточенные на общих инструментах для языков, таких как C и Rust, которые обычно используют компиляцию и связывание на этапе сборки (AOT).
Репозитории и инструменты
XTTS – это модель текст в речь, которая позволяет пользователям клонировать голоса на разные языки. Она поддерживает 16 языков и является той же моделью, которая используется в нашем приложении-конструкторе Coqui Studio и в Coqui API.
Giskard – это библиотека Python, которая автоматически обнаруживает уязвимости в моделях искусственного интеллекта, от табличных моделей до LLM, включая смещение производительности, утечку данных, ложную корреляцию, галлюцинации и многое другое.
Система типографии Monaspace – это семейство неразрывных шрифтов для кода. Включает пять переменных шрифтовых осей; каждый из них имеет свой собственный стиль, но при этом они совместимы по метрике, что позволяет пользователям комбинировать их для создания более выразительной типографики.
MindStudio позволяет пользователям создавать индивидуальные AI-приложения без кодирования, используя любую модель и подсказки. Он также позволяет пользователям тренировать их искусственный интеллект на внешних данных и развертывать их публично или приватно.
Graphlit – это платформа для разработчиков API-first для создания приложений с использованием LLM-моделей. С помощью RAG-шаблона Graphlit использует возможности LLM, такие как GPT-3.5 и GPT-4 от OpenAI, для преобразования сложных данных в поисковый, разговорный граф знаний.
Топ статей недели
В этой статье представлена модель OtterHD-8B, инновационная мультимодальная модель, развитая на основе Fuyu-8B, специально созданная для интерпретации высокоразрешающих визуальных входов. Она позволяет обрабатывать изображения при их естественном разрешении, что позволяет модели замечать даже мельчайшие детали. При сопоставимом количестве параметров OtterHD-8B превосходит другие LMM-модели на MagnifierBench, такие как InstructBLIP, LLaVA и Qwen-VL.
2. Битва за основы: сравнение предварительно обученных моделей в задачах компьютерного зрения
В этой статье представлено сравнение предварительно обученных моделей в задачах компьютерного зрения, и было установлено, что ConvNeXT, нейронная сеть, инспирированная трансформерами зрения, обеспечивает лучшие результаты в различных задачах. Несмотря на популярность трансформеров зрения и самообучение, в задачах компьютерного зрения преподготовленные сверточные нейронные сети все еще предлагают лучшую производительность в большинстве случаев.
3. TEAL: токенизация и встраивание для мультимодальных больших языковых моделей
Данная работа предлагает систему TEAL (Tokenize and Embed ALl), которая упрощает моделирование взаимодействий между многомодальными входами и создание не-текстовых модальностей. Вход из любой модальности рассматривается как последовательность токенов, и обучается совместное встраивание для всех модальностей. Это позволяет мультимодальным языковым моделям более эффективно предсказывать мультимодальные токены, что позволяет решать задачи с не-текстовыми модальностями, такими как изображения и звук.
4. Уровни AGI: операционализация прогресса на пути к AGI
DeepMind представила рамочное соглашение “Уровни AGI”, которое классифицирует искусственный интеллект на “узкую” и “общую” интеллектуальность. В рамках этой системы описываются пять уровней производительности ИИ, от начинающего до сверхчеловеческого, основанных на его способности учиться, рассуждать и применять знания. Это рамочное соглашение может быть полезным аналогично уровням автономного вождения, предоставляя общий язык для сравнения моделей, оценки рисков и измерения прогресса по пути к AGI.
5. JARVIS-1: многозадачные агенты с памятью для мультимодальных языковых моделей
В этой статье представляется JARVIS-1, открытый агент, который способен воспринимать мультимодальный ввод (визуальные наблюдения и человеческие инструкции), создавать сложные планы и выполнять контроль, все в популярной, но сложной открытой вселенной Minecraft. В экспериментах JARVIS-1 демонстрирует практически идеальные результаты в более чем 200 разнообразных задачах, начиная от начального до промежуточного уровней.
Быстрые ссылки
- Google ведет переговоры о вложении сотен миллионов долларов в Character.AI, быстро растущую стартап-компанию чат-ботов искусственного интеллекта, которая ищет дополнительные средства для обучения моделей и удовлетворения потребностей пользователей.
- IBM объявила о запуске венчурного фонда на 500 миллионов долларов для инвестиций в различные компании по искусственному интеллекту – от стартапов на ранних стадиях до гиперроста, с фокусом на ускорении развития генеративной технологии искусственного интеллекта и исследований для предприятий.
- Два бывших вице-президента Coca-Cola объединились, чтобы вывести на рынок систему искусственного интеллекта (ИИ), которая уже помогает нескольким известным компаниям из списка Fortune 500 уточнить свои стратегии устойчивого развития.
- Новое оружие OpenAI в войне за таланты с Google: пакеты оплаты в размере 10 миллионов долларов для исследователей.
- Компания Iterate с головным офисом в Калифорнии запустила AppCoder LLM – настроенную модель, которая может мгновенно генерировать рабочий и обновляемый код для готовых к производству приложений искусственного интеллекта с использованием естественных языковых подсказок.
Кто нанимает в области искусственного интеллекта
Технический писатель и разработчик ИИ для больших языковых моделей @ Towards AI Inc (удаленно)
Руководитель практики, науки о данных, ИИ и машинного обучения @ Rackspace (США/удаленно)
(Младший) DevOps HPC Engineer @ Recursion (удаленно)
Менеджер качества ИИ @ Welocalize (Пекин, Китай)
Архитектор ИИ @ Tibra Capital (Сидней, Австралия)
Ученый-исследователь машинного обучения @ Anyon Systems Inc. (Монреаль, Квебек, Канада)
Интересуете вакансия здесь? Свяжитесь с нами по адресу sponsors@towardsai.net.
Если вы готовитесь к следующему собеседованию по машинному обучению, не стесняйтесь проверить нашу лидирующую веб-страницу для подготовки к собеседованиям, confetti!

Думаете, другу тоже понравится? Поделитесь этой рассылкой и позвольте им присоединиться к беседе.