Рональд Т. Кнезел, автор книги «Как работает искусственный интеллект от колдовства до науки» – серия интервью

Рональд Т. Кнезел, автор книги Как работает искусственный интеллект от колдовства до науки - серия интервью

Мы недавно получили перед выпуском книгу «Как работает искусственный интеллект: от волшебства до науки» Рональда Т. Кнезеля. Я прочитал уже более 60 книг об искусственном интеллекте, и хотя некоторые из них повторяются, эта книга удалось предложить свежую перспективу. Мне так понравилась эта книга, что я добавил ее в свой личный список Лучшие книги о машинном обучении и искусственном интеллекте всех времен.

«Как работает искусственный интеллект: от волшебства до науки» – это краткая и ясная книга, разработанная для изложения основных принципов машинного обучения. Ниже приведены некоторые вопросы, заданные автору Рональду Т. Кнезелу.

Это ваша третья книга об искусственном интеллекте, первые две из которых: «Практическое глубокое обучение: введение на базе Python» и «Математика для глубокого обучения: то, что вам нужно знать, чтобы понять нейронные сети». Каковы были ваши первоначальные намерения, когда вы приступили к написанию этой книги?

Разная целевая аудитория. Мои предыдущие книги предназначены как введение для людей, интересующихся становлением практикантами в области искусственного интеллекта. Эта книга предназначена для общего читателя, людей, которые слышат много о искусственном интеллекте в новостях, но не имеют никакого опыта в этой области. Я хочу показать читателям, откуда пришел искусственный интеллект, что это не магия и что каждый может понять, что он делает.

В то время как многие книги об искусственном интеллекте часто обобщают информацию, вы заняли противоположную позицию, очень конкретно объясняя значения различных терминов и даже объясняя связь между искусственным интеллектом, машинным обучением и глубоким обучением. Почему вы считаете, что существует такое большое общественное недоумение в отношении этих терминов?

Чтобы понять историю искусственного интеллекта и почему он повсюду вокруг нас сейчас, нам нужно понять различие между этими терминами, но в общественном использовании допустимо использование термина «искусственный интеллект», имея в виду прежде всего системы искусственного интеллекта, которые так быстро преобразуют мир. Современные системы искусственного интеллекта вышли из глубокого обучения, которое возникло из машинного обучения и связанного подхода к искусственному интеллекту.

Вторая глава углубляется в историю искусственного интеллекта, начиная с мифа о Талосе, гигантском роботе, предназначенном для охраны финикийской принцессы, до научной статьи Алана Тьюринга 1950 года «Вычислительная техника и интеллект», до наступления революции глубокого обучения в 2012 году. Почему понимание истории искусственного интеллекта и машинного обучения является неотъемлемым условием для полного понимания того, насколько далеко развился искусственный интеллект?

Моим намерением является показать, что искусственный интеллект не падает с неба. У него есть история, происхождение и эволюция. Хотя возможности крупных языковых моделей являются сюрпризом, путь, приводящий к ним, нет. Это десятилетия мысли, исследования и экспериментов.

Вы уделили целую главу пониманию устаревших систем искусственного интеллекта, таких как машины опорных векторов, деревья решений и случайные леса. Почему вы считаете, что полное понимание этих классических моделей искусственного интеллекта так важно?

Искусственный интеллект в виде нейронных сетей представляет из себя всего лишь (!) альтернативный подход к тому же роду оптимизационного моделирования, которое присутствует во многих ранее разработанных моделях машинного обучения. Это другой способ создания модели какого-либо процесса, какой-либо функции, которая отображает входы на выходы. Знание о более ранних типах моделей помогает понять, откуда происходят современные модели.

Вы утверждаете, что модель LLM ChatGPT от OpenAI является рассветом истинного искусственного интеллекта. Что, по вашему мнению, является самым большим прорывом между этим и предыдущими методами решения задач искусственного интеллекта?

Недавно я посмотрел видео конца 1980-х годов, где Ричард Фейнман пытается ответить на вопрос об интеллектуальных машинах. Он заявил, что не знает, какую программу можно было бы использовать для действия интеллектуально. В каком-то смысле он говорил о символическом искусственном интеллекте, где тайна состоит в поиске волшебной последовательности логических операций и т. д., которая позволила бы интеллектуальное поведение. Как и многие, раньше я задумывался о том же – как программировать интеллект?

Я считаю, что этого действительно нельзя сделать. Разум возникает из достаточно сложных систем, способных реализовывать то, что мы называем интеллектом (например, мы). Наши мозги являются крайне сложными сетями базовых элементов. Именно такова также нейронная сеть. Я думаю, что архитектура трансформера, реализованная в LLM, в некотором смысле случайно обнаружила похожую организацию базовых элементов, которые могут работать вместе, чтобы проявлялось интеллектуальное поведение.

С одной стороны, это идеальный «счастливый случай» Боба Росса, а с другой, это не должно вызывать удивления, когда происходят такие расположение и разрешение взаимодействия между основными компонентами, которые способны обеспечивать возникновение интеллектуального поведения. Теперь кажется ясным, что трансформерные модели являются одним из таких решений. Конечно, тут возникает вопрос: какие еще такие расположения могут иметься?

Ваш главный вывод состоит в том, что современные искусственные интеллекты (RNN) по сути являются нейронной сетью, которую обучают методом обратного распространения ошибки и градиентным спуском. Удивляет ли вас лично эффективность RNN?

Да и нет. Я постоянно поражаюсь их реакциям и способностям, когда я их использую, но, отвечая на предыдущий вопрос, следует отметить, что возникновение интеллекта – это реальность, так что почему бы это не происходило в достаточно большой модели с подходящей архитектурой? Я думаю, что исследователи, вероятно, задумывались над этим еще задолго до Фрэнка Розенблатта, если не раньше.

Миссия OpenAI – “обеспечить то, чтобы искусственный общий интеллект – системы искусственного интеллекта, которые в целом умнее людей – принес пользу всему человечеству.” Лично вы верите в то, что общий искусственный интеллект достижим?

Я не знаю, что такое общий искусственный интеллект, так же как и не знаю, что такое сознание. Поэтому сложно ответить на этот вопрос. Как я отмечаю в книге, возможно, наступит момент, очень скоро, когда нет смысла заботиться о таких различиях – если это ходит как утка и крякает как утка, просто называйте это уткой и занимайтесь своим делом.

Несмотря на шутливый ответ, совершенно возможно, что система искусственного интеллекта может соответствовать многим теориям сознания. Хотим ли мы полностью осознанные (что бы это ни означало на самом деле) системы искусственного интеллекта? Возможно, нет. Если оно осознает себя, то оно похоже на нас и, следовательно, человек с правами, а я не думаю, что мир готов к искусственным личностям. У нас достаточно проблем с уважением прав наших соплеменников, не говоря уже о правах какого-либо другого вида существ.

Было ли что-то удивительное, что вы узнали, пиша эту книгу?

Помимо уровня удивления, которое чувствует каждый, открывая новые возможности RNN, на самом деле нет. Я узнал об искусственном интеллекте, когда был студентом в 1980-х годах. В начале 2000-х я начал работать с машинным обучением, и в 2010-х годах я был связан с глубоким обучением. Я свидетельствовал новым разработкам последнего десятилетия лично, вместе с тысячами других людей, поскольку от конференции к конференции область резко развивалась.

Спасибо за интересное интервью. Читатели также могут ознакомиться с моим обзором этой книги. Книга доступна во всех крупных магазинах, включая Amazon.