Этан Гинсберг, сооснователь Martian – Интервью Серии

Этан Гинсберг, сооснователь Martian - Интервью из серии

Этан Гинсберг является сооснователем платформы Martian, которая динамически маршрутизирует каждый запрос к лучшей LLM (языковая модель длинного текста). Благодаря этой маршрутизации Martian достигает более высокой производительности и более низкой стоимости по сравнению с любым отдельным поставщиком, включая GPT-4. Система основана на уникальной технологии Model Mapping компании, которая распаковывает LLMs из сложных черных ящиков в более интерпретируемую архитектуру, что является первым коммерческим применением механистической интерпретируемости.

Этан занимается созданием программ, дизайном веб-сайтов и созданием электронных бизнесов для клиентов с момента учебы в средней школе. Этан является полиматом, участником Чемпионата мира по памяти и занял второе место на Чемпионате мира по скорочтению в Шеньчжэне, Китай.

Он является участником хакатонов видео. Среди предыдущих наград можно отметить 3-е место на Tech Crunch SZ, финалиста Топ-7 на хакатоне Princeton и 3 промышленные награды на хакатоне в Йельском университете.

Вы являетесь сооснователем стартапа, какими были эти компании и что вы извлекли из этого опыта?

Моя первая компания была первой платформой для продвижения и развития спорта «Американский ниндзя-воин». Еще в 2012 году я видел «Американского ниндзя-воина» как подпольный спорт (подобно ММА в 90-е годы) и создал первую платформу, где люди могли покупать чертежи, заказывать препятствия и находить тренажерные залы для тренировок. Я консультировал компании, желающие открыть свои залы, включая помощь Специальным силам США в создании тренировочного курса и развитие объекта от эскиза на салфетке до прибыли в размере 300 000 долларов за первые 3 месяца. Несмотря на то, что я был в старшей школе, у меня был опыт управления командами из более чем 20 сотрудников и я узнал о эффективном управлении и взаимоотношениях между людьми.

Моя вторая компания была компанией по управлению альтернативными активами, которую я сосновал в 2017 году до начала ICO-волны в криптовалюте. Это был мой первый опыт работы с NLP (обработкой естественного языка), где мы использовали анализ эмоциональной окраски данных из социальных сетей в качестве стратегии инвестирования.

Я много узнал о технических и межличностных навыках, необходимых для запуска стартапа, от управления командой до технических аспектов NLP. В то же время я узнал многое о себе и о том, чем я хотел бы заниматься. Я считаю, что наиболее успешные компании основаны основателями, у которых есть более широкое видение или цель. В 2017 году я покинул криптовалюту, чтобы сосредоточиться на NLP, потому что развитие и понимание интеллекта человека действительно вдохновляет меня. Я был рад открыть это для себя.

Вы изучали искусственный интеллект в Университете Пенсильвании, над чем исследовали?

Наши исследования изначально были направлены на создание приложений, использующих LLMs. В частности, мы работали над образовательными приложениями, использующими LLMs, и создавали первый когнитивный учебник, работающий на базе LLM. Результаты были достаточно хорошими – мы заметили улучшение результатов студентов на 0,3 стандартного отклонения при первом эксперименте, и наша система использовалась от Университета Пенсильвании до Университета Бутана.

Можете ли вы рассказать, как исследования привели вас к сосозданию Martian?

Поскольку мы были одними из первых, кто создавал приложения на базе LLM, мы также столкнулись с проблемами, с которыми сталкиваются люди, создавая приложения на базе LLM. Это направило наше исследование на уровень инфраструктуры. Например, с самого начала мы настраивали более маленькие модели на выводы более крупных моделей, таких как GPT-3, и настраивали модели на специализированные источники данных для задач программирования и решения математических задач. В конечном итоге это привело нас к проблемам понимания поведения модели и маршрутизации моделей.

Происхождение названия Martian и его связь с интеллектом также интересны, можете ли вы рассказать историю выбора этого имени?

Наша компания была названа в честь группы венгерско-американских ученых, известных как “Martians” (“Марсианцы”). Эта группа, которая жила в 20 веке, состояла из некоторых самых умных людей, когда-либо живших:

  • Самым известным из них был Джон фон Нейманн; он изобрел теорию игр, современную компьютерную архитектуру, теорию автоматов и внес фундаментальные вклады в десятки других областей.
  • Пауль Эрдош был самым продуктивным математиком всех времен, опубликовавшим более 1500 научных статей.
  • Теодор фон Карман разработал фундаментальные теории аэродинамики и способствовал созданию американской космической программы. Граница между Землей и внешним космосом носит имя “Кармановская линия” в признании его работы.
  • Лео Силард изобрел атомную бомбу, радиационную терапию и ускорители частиц.

Эти ученые и 14 других подобных (включая изобретателя водородной бомбы, человека, внесшего групповую теорию в современную физику, и фундаментальных вкладчиков в области комбинаторики, теории чисел, численного анализа и теории вероятности) обладали замечательной сходностью – они все родились в одной части Будапешта. Это побудило людей задаться вопросом: откуда столько интеллекта?

В ответ Шилард пошутил: «Марсиане уже здесь, и они называют себя венграми!» На самом деле… никто не знает.

Сегодня человечество оказывается в схожей ситуации по отношению к новому набору потенциально сверхумных разумов: искусственный интеллект. Люди знают, что модели могут быть невероятно умными, но не имеют понятия, как они работают.

Наша миссия – ответить на этот вопрос и понять, как использовать современный сверхинтеллект.

У вас есть история невероятных памятных подвигов, как вы стали погружаться в эти памятные вызовы и как эти знания помогли вам с концепцией «Марсиан»?

В большинстве спортивных состязаний профессиональный спортсмен может показать результат в 2-3 раза лучше, чем обычный человек (сравните, насколько далеко может пнуть обычный человек мячик при футболе или насколько быстро он может бросить быстрый мяч по сравнению с профессионалом). Спортивные состязания памяти интересны тем, что топ-атлеты могут запомнить в 100 или даже 1000 раз больше, чем обычный человек, и при этом им не нужно столько тренироваться, как в большинстве других видов спорта. Более того, это часто люди с обычной памятью, которые приписывают свои успехи определенным техникам, которые может освоить каждый. Я хочу максимизировать знания человечества, и я видел чемпионаты по памяти как недооцененное понимание того, как мы можем повысить интеллект человека, достигнув исключительных результатов.

Я хотел применить техники запоминания в системе образования, поэтому начал изучать, как NLP и LLM могут помочь уменьшить затраты, которые препятствуют использованию наиболее эффективных методов образования в обычной системе образования. Яш и я создали первого когнитивного учителя на основе LLM, и это привело к тому, что мы сейчас решаем проблемы, связанные с внедрением LLM.

Суть концепции «Марсиан» состоит в том, чтобы абстрагировать решение о том, какую большую языковую модель (LLM) использовать. Почему это в настоящее время вызывает такие трудности для разработчиков?

Становится все проще создавать языковые модели: стоимость вычислений снижается, алгоритмы становятся более эффективными, и появляются все больше инструментов с открытым исходным кодом для создания этих моделей. В результате всё больше компаний и разработчиков создают пользовательские модели, обученные на пользовательских данных. Поскольку эти модели имеют разные стоимости и возможности, можно достичь лучшей производительности, используя несколько моделей, но сложно протестировать их все и найти те, которые следует использовать. Мы берем на себя эту задачу для разработчиков.

Можете рассказать, как система определяет, для каких конкретных задач лучше всего использовать LLM?

Эффективная маршрутизация – это в первую очередь проблема понимания моделей. Чтобы эффективно маршрутизировать между моделями, вы хотите понимать, что заставляет модели падать или успешно работать. Возможность понимать эти характеристики с помощью модель-mapping помогает нам определить, насколько хорошо данная модель будет выполнять запрос, не запуская ее в работу. В результате мы можем направить этот запрос к модели, которая даст лучший результат.

Можете обсудить экономические выгоды от оптимизации выбора LLM?

Мы позволяем пользователям определить, как они сбалансированно оценивают стоимость и производительность. Если вам важна только производительность, мы можем превзойти GPT-4 на openai/evals. Если вам нужна определенная стоимость, чтобы сделать экономику единицы работы, мы позволяем вам указать максимальную стоимость для вашего запроса, затем находим наилучшую модель для выполнения этого запроса. И если вам нужно что-то более гибкое, мы позволяем указать, сколько вы готовы заплатить за лучший ответ – таким образом, если две модели имеют схожую производительность, но большую разницу в стоимости, мы можем позволить вам использовать более дешевые модели. Некоторые из наших клиентов смогли снизить затраты вплоть до 12 раз.

Какова ваша видение будущего «Марсиан»?

Каждый раз, когда мы улучшаем наше фундаментальное понимание моделей, это приводит к парадигматическому сдвигу для искусственного интеллекта. Настройка была парадигмой, основанной на понимании выходных данных. Подсказывание – это парадигма, основанная на понимании входных данных. Это единственная разница в нашем понимании моделей, что отличает традиционное машинное обучение («давайте обучим регрессор») и современный генеративный искусственный интеллект («давайте применим AGI-подобного метода»).

Наша цель – постоянно достигать прорывов в толковости, пока искусственный интеллект не будет полностью понят и у нас не будет теории интеллекта, так же прочной, как наши логические или математические теории.

Для нас это означает строить. Это означает создавать потрясающие инструменты и предоставлять их людям. Это означает выпускать вещи, которые ломают стереотипы, которые никто раньше не делал и которые, прежде всего, интересны и полезны.

По словам сэра Фрэнсиса Бэкона: «Знание – это сила». Следовательно, лучший способ убедиться, что мы понимаем искусственный интеллект, – выпустить мощные инструменты. По нашему мнению, модельный маршрутизатор является инструментом такого рода. Мы с нетерпением строим его, развиваем и с удовольствием предоставим его людям.

Это первый из множества инструментов, которые мы собираемся выпустить в ближайшие месяцы. Чтобы открыть красивую теорию искусственного интеллекта, для создания совершенно новых типов ИИ инфраструктуры, для помощи в построении светлого будущего как для людей, так и для машин – мы не можем дождаться, чтобы поделиться этими инструментами с вами.

Спасибо за отличное интервью, читатели, желающие узнать больше, могут посетить сайт Марсианин.