Окунитесь в будущее с отчетом Kaggle о искусственном интеллекте на 2023 год – узнайте, что сейчас в тренде.

Откройте для себя тренды искусственного интеллекта на 2023 год с отчетом Kaggle - будущее уже здесь!

12 мая 2023 года Kaggle открыл соревнование, в котором участники сообщества Kaggle могут принять участие в создании отчета, который будет подводить итоги быстрого развития искусственного интеллекта за последние два года. Сообщество Kaggle представляет собой разнообразную группу людей с различным опытом в области искусственного интеллекта.

Участников попросили написать эссе на определенную тему на основе изменений и развития за последние 2 года, например, Generative AI, этика искусственного интеллекта и многое другое.

В отчете присутствуют следующие разделы:

  • Generative AI
  • Текстовые данные
  • Изображения и видео
  • Табличные и временные данные
  • Соревнования на Kaggle
  • Этика искусственного интеллекта

Давайте погружаемся в то, что мы узнали…

Generative AI

Generative AI недавно стал популярной темой обсуждения. Этот раздел отчета описывает быстрый прогресс и применение Generative AI за последние 2 года. Мы видели развитие таких функций, как генерация текста, создание изображений и разработка музыки с использованием инструментов и техник, таких как GAN и LLM.

Это стало возможным только благодаря использованию больших наборов данных и улучшенного аппаратного обеспечения для усовершенствования алгоритмов в процессе их обучения. Хотя Generative AI все еще находится в своей ранней стадии, только за прошедший год оно показало, как оно революционизирует различные отрасли. При этом все еще следует учитывать этические аспекты, такие как конфиденциальность, дезинформация и использование этих ИИ-систем.

Рекомендуем ознакомиться с различными эссе:

  1. Generative AI
  2. Понимайте, генерируйте и преобразовывайте мир
  3. Взгляд в мир Generative AI

Текстовые данные

Со всем восторгом вокруг Generative AI возникло большое внимание к обработке естественного языка (NLP) из-за появления больших моделей языка (LLM). Следующий раздел отчета Kaggle AI фокусируется на техниках NLP и их использовании в различных задачах, таких как краткое изложение и перевод.

Если обратиться к ранним подходам к текстовым задачам, включающим создание основанных на частоте терминов функций совместно с методами машинного обучения, не использующими нейронные сети, мы видим, что сейчас мы имеем дело с более объемными наборами данных, проходящими обучение по представлению слов для интерпретации модели.

Использование интернет-данных в качестве учебного корпуса позволило этим моделям учиться лучше и показывать лучшие результаты в областях, таких как перенос обучения. В рамках соревнований на Kaggle был замечен тренд на настройку публично доступных моделей, которые показали результаты, превосходящие возможности человека.

Следующие лучшие эссе сосредотачиваются на появлении и последних техниках LLM:

  1. Современные большие языковые модели LLMs
  2. Большие языковые модели: способность к рассуждениям
  3. Мини-гиганты: “маленькие” языковые модели

Изображения и видео

Как и использование текстовых данных для задач, таких как генерация контента, генерация изображений и видео также стала очень популярной. Компьютерное зрение существует уже долгое время, но в последние годы оно стремительно развивается. Теперь мы можем выполнять задачи, такие как обнаружение объектов и многое другое.

Этот раздел рассматривает архитектуры моделей, а также общие практики, используемые в компьютерном зрении, такие как аугментация. Компьютерное зрение используется в различных отраслях, например, в здравоохранении для медицинской диагностики, но у него все еще есть свои проблемы, связанные с тематикой глубокой фейковости, этическими и философскими вопросами, ограничениями многомодальных моделей и другими. 

У нас есть модели, такие как Segment Anything Model (SAM) и YOLO (You Only Look Once), которые показали, как обобщенные модели с открытым исходным кодом могут быть адаптированы для различных и уникальных задач.

Разберитесь в прогрессе в области обработки изображений и видеоданных с помощью этих эссе:

  1. Прогресс в моделях искусственного интеллекта в области компьютерного зрения за последние два года
  2. Изображения и видеоданные

 

Табличные и временные ряды данных

 

Следующий раздел рассматривает историческое значение табличных данных и временных рядов данных. В последние несколько лет они не получили широкого распространения, так как не оказали такого же влияния, как революция глубокого обучения. Однако они все еще широко используются и очень эффективны, актуальны в таких областях, как:

  • Уникальный подход для индивидуальных наборов данных/задач
  • Важность предварительной обработки данных и инженерии признаков
  • Доминирование градиентного бустинга деревьев

В сообществе Kaggle эти тенденции были широко признаны, и следующие эссе рассмотрят эти особенности, а также уникальные проблемы, с которыми сталкиваются табличные данные и временные ряды данных.

  1. Уроки из типичного табличного процесса
  2. Временные ряды и табличные данные
  3. Табличные данные в эпоху искусственного интеллекта

 

Соревнования Kaggle

 

Частью данного отчета от сообщества Kaggle является также анализ соревнований Kaggle, изучение их развития и наблюдений сообщества за последние 2 года. Соревнования Kaggle на протяжении многих лет пользовались широкой популярностью, поскольку сообщество использовало эту платформу для проверки своих навыков, создания портфолио и подготовки к реальному миру.

Наблюдаются изменения в соревнованиях Kaggle, такие как псевдо-разметка, усреднение сидов и метод холмов, которые когда-то считались “хитростями”, а теперь стали общепринятыми практиками. Конкурсы Kaggle за последние 2 года стали более конкурентоспособными, и соревнования, такие как RSNA, Learning Agency и другие, пользуются большой популярностью.

Погрузитесь в победные приемы соревнований Kaggle:

  1. К зеленому искусственному интеллекту
  2. Как выиграть соревнование Kaggle
  3. Медицинские изображения

 

Этика искусственного интеллекта

 

Этика в области искусственного интеллекта также является одной из областей озабоченности, многие люди в обществе испытывают смешанные чувства по поводу использования и внедрения систем искусственного интеллекта. Организации изучают этические принципы искусственного интеллекта и создают новые стратегии, чтобы обеспечить возможность не только понимать системы искусственного интеллекта, но и контролировать и снижать риски.

Это не академическое исследование, а общественное, и важно понимать мнения, которые имеют важность для понимания мира искусственного интеллекта и того, как его можно использовать, соблюдая ценности общества. Мы видим, как организации продолжают аудит своих систем искусственного интеллекта с применением этичности с самого начала.

Узнайте больше о вызовах в области искусственного интеллекта и его влиянии на общество:

  1. Изучение этики и ESG в области ИИ в предприятиях
  2. Развитие ИИ и этики за последние 2 года
  3. Этичный ИИ – все, что нам нужно!!

 

Обернув это

 

Команда Kaggle создала уникальный отчет, в котором позволила своему сообществу выразить свое мнение и опыт о мире искусственного интеллекта и его изменениях за последние 2 года. Дайте нам знать, если какая-то конкретная секция или эссе показались вам очень интересными!

****[Ниша Арья](https://www.linkedin.com/in/nisha-arya-ahmed/)**** – дата-сайентист и фриланс писатель по техническим темам. Она особенно интересуется предоставлением советов о карьере в области науки о данных, созданием учебных пособий и теоретических знаний в области науки о данных. Она также хочет исследовать различные способы, которыми искусственный интеллект может быть полезен для долголетия человеческой жизни. Она стремится расширить свои знания в области технологий и навыки письма, помогая при этом другим.