Познакомьтесь с пятью инноваторами в области генеративного искусственного интеллекта в Африке и на Ближнем Востоке

Пять инноваторов в области генеративного искусственного интеллекта в Африке и на Ближнем Востоке.

Предприниматели развивают генеративное искусственное интеллекта от западного побережья Африки до восточного края Аравийской пустыни.

Gen AI – последний из больших планов, над которыми Кофи Генфи и Нии Осае работали с тех пор, как они встретились 15 лет назад в старшей школе в Аккре, столице Ганы, расположенной на побережье Гвинейского залива.

“Мы следили за этой последней волной искусственного интеллекта в течение последних нескольких лет”, – сказал Осае, программист, который обнаружил свою страсть к машинному обучению в колледже.

Нии Осае (слева) и Кофи Генфи из стартапа Mazzuma.

Так что в конце прошлого года они расширили Mazzuma – свой стартап по мобильным платежам, который уже обработал более 150 миллионов долларов транзакций, чтобы включить MazzumaGPT.

Большая языковая модель (LLM), обученная на двух популярных блокчейн-языках, позволяет разработчикам быстро составлять умные контракты, рынок Web3, который по прогнозам International Data Corp., может достигнуть 19 миллиардов долларов в следующем году.

Тысячи попаданий

В первый месяц использования LLM воспользовались 400 разработчиков из 70 стран. Модель имеет 175 миллиардов параметров, грубая мера размера и силы модели.

Это последний успех пары, которая в 2018 году попала в список 30 лучших предпринимателей Африки до 30 лет по версии Forbes.

“Учитывая высокий рост и большие демографические данные, в этом регионе есть большие возможности”, – сказал Генфи, который начал свою первую компанию, реселлер устройств Apple, когда ему было 19 лет.

Осае развивает потенциал как основатель и председатель Ассоциации искусственного интеллекта Ганы, в которой состоят более 100 участников. “Я думаю, что мы нацелены на прогресс в области искусственного интеллекта, который превосходит прогресс в других местах”, – сказал он.

LLM говорит по-арабски

Около двух лет назад и на расстоянии 6000 миль к северо-востоку другая пара предпринимателей запустила бизнес по генеративному искусственному интеллекту в эмирате Персидского залива Дубаи, доме Бурдж-Халифа, самого высокого здания в мире.

У Якова Лившица уже было около десятка активных стартапов, когда к нему обратился исследователь искусственного интеллекта Эли Брагинский, друг семьи, с идеей MetaDialog. В рамках стартапа была создана первая LLM, поддерживающая как арабский, так и английский, модель объемом 7 миллиардов параметров, обученная на одном из самых больших арабско-английских датасетов в мире.

“Мы называем ее Baby, потому что мы гордимся ею, и сейчас мы создаем более крупную модель с 40 миллиардами параметров”, – сказал Брагинский.

“Наши Baby LLM уже интегрированы в одном из крупнейших правительств в регионе, и мы ведем переговоры с тремя другими правительствами, заинтересованными в его использовании”, – сказал Лившиц.

С более чем 3 миллионами жителей на площади всего 13 квадратных миль, Дубай является живым центром региона.

“Подход правительств Ближнего Востока к искусственному интеллекту и передовым технологиям в целом очень смелый – они хотят двигаться быстро, поэтому мы обучаем пользовательские модели на разных языках и представим их на конференции GITEX”, – сказал Лившиц, который жил в России, Израиле и США, прежде чем переехать в Дубай.

В феврале только Саудовская Аравия объявила о создании фонда в размере 2,4 миллиарда долларов США для поддержки стартапов с целью диверсификации экономики страны.

Корпорации хотят пользовательские LLM

В Абу-Даби всего в ста милях от побережья Хусейн аль-Нацех возглавляет команду инженеров и специалистов по обработке данных в Beyond Limits, которые обучают и настраивают LLM. Одна из таких моделей уже составляет документы для крупной энергетической компании и проверяет их соответствие стандартам.

Beyond Limits также работает над моделями для энергетических компаний, коммунальных служб и других клиентов, которые позволят индексировать и искать корпоративные документы, составлять маркетинговые материалы и многое другое.

“Компании нужны свои собственные LLM, обученные на их конфиденциальных данных, поэтому мы используем машины для чтения их данных, а не мы сами”, – сказал аль-Нацех, родом из Аммана, Иордания, который до присоединения к Beyond Limits работал над Salma, одним из первых арабских голосовых помощников.

Добыча данных

Теперь, когда данные – новая нефть, Beyond Limits разрабатывает наборы инструментов для их извлечения из неструктурированных файлов – корпоративных электронных писем, презентаций PowerPoint и других источников, чтобы помочь компаниям обучать настраиваемые модели языкового моделирования с размером до 70 миллиардов параметров.

Наборы инструментов могут помочь справиться с нехваткой образцов данных среди многих арабских диалектов. Действительно, отчет правительства ОАЭ о 100 ведущих применениях искусственного интеллекта требует большего внимания к арабскому языку, на котором говорит почти полмиллиарда человек.

Хорошая новость заключается в том, что правительства и крупные компании, такие как G42, региональная облачная сервисная компания, вкладывают ресурсы в решение этой проблемы. Например, благодаря последнему раунду финансирования от G42, Beyond Limits смогла создать свою региональную штаб-квартиру в Дубае.

Большая поддержка с Inception

Все три компании являются участниками программы NVIDIA Inception, бесплатной программы, помогающей стартапам, работающим над передовыми технологиями, такими как генеративный искусственный интеллект.

В рамках программы Inception Beyond Limits имела доступ к библиотекам NVIDIA NeMo, фреймворку для создания масштабных моделей генеративного искусственного интеллекта, который в одном случае сократил время обучения с пяти дней до одного.

“Программное обеспечение NVIDIA значительно облегчает нашу работу, и наши клиенты доверяют технологии NVIDIA”, – сказал Аль-Нацех.

В рамках программы Inception Mazzuma получила доступ к облачным службам GPU для ускорения экспериментов и знакомства с потенциальными инвесторами.

“Это действительно дало нам толчок, и работа с лучшими людьми и инструментами приносит много уверенности”, – сказал Генфи.

Уважительное отношение к партнерам

Своей частью MetaDialog обучила свою модель Baby LLM на 440 GPU NVIDIA A100 Tensor Core с использованием сервиса, предоставляемого MosaicML, участником Inception, недавно приобретенным компанией Databricks.

“Я создал много стартапов, и ни одна компания не относится к своим партнерам так хорошо, как NVIDIA”, – сказал Лившиц.

На фото: слева направо – Нии Осе, Хусейн Аль-Нацех, Эли Брагинский, Яков Лившиц и Кофи Генфи.