Взлет и падение Prompt Engineering мода или будущее?
Сверхпопулярность и разочарование стоит ли ждать больше от моды Prompt Engineering?
В бесконечно расширяющейся вселенной искусственного интеллекта и машинного обучения появилась новая звезда: инженерия запросов. Эта быстроразвивающаяся область касается стратегического создания входных данных, способных направлять модели искусственного интеллекта на генерацию определенных, желаемых результатов.
Различные СМИ с энтузиазмом обсуждают инженерию запросов, делая это так, будто бы это идеальная работа – не надо изучать программирование, не нужно разбираться в таких понятиях машинного обучения, как глубокое обучение, наборы данных и т. д. Вы наверняка согласитесь, что это кажется слишком хорошим, чтобы быть правдой, верно?
Ответ на этот вопрос, по сути, да и нет. В этой статье мы расскажем, почему именно так, проследим начало развития инженерии запросов, объясним, почему это важно, и, что самое главное, почему это не карьера, которая изменит жизнь и поднимет миллионы людей по социальной лестнице.
- Важные статьи LLM за неделю с 06/11 по 12/11.
- Лучший способ оценить LLM-программы
- Развитие потенциала наблюдаемости с помощью искусственного интеллекта
Возникновение инженерии запросов
Мы все видели эти цифры – к 2030 году глобальный рынок искусственного интеллекта оценивается в 1,6 триллиона долларов, OpenAI предлагает зарплаты в размере 900 тысяч долларов, и это еще не упомянули миллиарды, а может быть и триллионы слов, создаваемых GPT-4, Claude и различными другими LLMs. Конечно, на переднем плане находятся данные ученые, эксперты по машинному обучению и другие высококвалифицированные специалисты в этой области.
Однако 2022 год изменил все, так как GPT-3 стал повсеместно популярным с момента его публичного доступа. Вдруг средний человек понял, как важны запросы и понятие GIGO – “мусор внутри, мусор на выходе”. Если вы напишете небрежный запрос без подробностей, LLM будет иметь полную свободу в выдаче результата. Все было просто вначале, но пользователи вскоре поняли истинные возможности модели.
Однако вскоре люди начали экспериментировать с более сложными рабочими процессами и более длинными запросами, еще более подчеркивая ценность умелого использования слов. Пользовательские инструкции лишь расширили возможности и только ускорили развитие специалиста по запросам – профессионала, способного использовать логику, рассуждение и знание поведения LLM для достижения желаемого результата по желанию.
Инженерия запросов: говорение на машинном языке?
На вершине своего потенциала инженерия запросов стала катализатором значительных прогрессов в обработке естественного языка (NLP). Искусственные интеллектуальные модели от обычного GPT-3.5 до ниши LLaMa от Meta, кормленные тщательно созданными запросами, продемонстрировали изумительную способность адаптироваться к широкому спектру задач с замечательной ловкостью.
Защитники инженерии запросов приветствуют ее как проводник для инноваций в области искусственного интеллекта, предвидя будущее, в котором взаимодействие человека и искусственного интеллекта будет безупречно облегчено тщательной работой над запросами.
Однако именно обещание инженерии запросов разжигает пламя контроверзии. Раскрыть потенциалы искусственного интеллекта, превратив его из инструмента вычислений в партнера творчества – так видят внутри этой области видение мечтатели.
Критика инженерии запросов
Среди взлетов энтузиазма звучат и голоса скептиков. Критики инженерии запросов указывают на ее врожденные ограничения и утверждают, что она представляет собой не более чем сложное манипулирование системами искусственного интеллекта, лишенными фундаментального понимания.
Они утверждают, что prompt-инжиниринг – это всего лишь фасад, умное оркестрование входных данных, которое скрывает врожденную неспособность ИИ понимать и рассуждать. Также можно сказать, что следующие аргументы поддерживают их позицию:
- Модели ИИ приходят и уходят. Например, то, что сработало в GPT-3, уже было устранено в GPT-3.5, а практически невозможно в GPT-4. Разве это не делает инженеров prompt-инжиниринга просто знатоками конкретных версий LLM?
- Даже лучшие инженеры prompt-инжиниринга на самом деле не являются «инженерами» в прямом смысле этого слова. Например, эксперт по SEO может использовать плагины GPT или даже локально работающий LLM для поиска возможностей для обратных ссылок, или инженер по программному обеспечению может знать, как использовать Copilot при написании, тестировании и развертывании кода. Но в конечном счете они всего лишь делают свою работу – отдельные задачи, которые, в большинстве случаев, полагаются на предыдущий опыт в нише.
- Помимо редких возможностей вакансий prompt-инжиниринга в Силиконовой Долине, о prompt-инжиниринге существует едва ли усиливающая его осведомленность, не говоря уже о чем-то другом. Компании медленно и осторожно принимают LLM, что характерно для каждого нововведения. Но мы все знаем, что это не останавливает гипетрейн.
Броский ажиотаж вокруг prompt-инжиниринга
Привлекательность prompt-инжиниринга не осталась безразличной к силам ажиотажа и гиперболы. СМИ осциллируют между превозношением его достоинств и порицанием его недостатков, часто усиливая успехи, игнорируя его ограничения. Эта дихотомия создает путаницу и раздувает ожидания, заставляя людей верить, что это либо магия, либо совершенная бесполезность, но ни на что не посередине.
Исторические параллели с другими технологическими страстями также служат загадочным напоминанием о временном характере технологических трендов. Технологии, которые когда-то обещали революционизировать мир, от метавселенной до раскладных телефонов, часто утратили свой блеск, поскольку реальность не соответствовала громким ожиданиям, заложенным в раннем ажиотаже. Этот паттерн завышенного энтузиазма, сопровождаемый разочарованием, наводит сомнения на долгосрочную жизнеспособность prompt-инжиниринга.
Реальность за ажиотажем
Раскрывая слои ажиотажа, мы видим более нюансированную реальность. Технические и этические вызовы буквально кишат, от масштабируемости prompt-инжиниринга в различных приложениях до вопросов воспроизводимости и стандартизации. Помещая их рядом с традиционными и хорошо установленными карьерами в области ИИ, такими как связанные с наукоемкой обработкой данных, блеск prompt-инжиниринга начинает тускнеть, раскрывая инструмент, который, хотя и мощный, не лишен значительных ограничений.
Вот почему prompt-инжиниринг – это временная блуда, представление о том, что любой может просто разговаривать с ChatGPT ежедневно и получать работу на среднешестизначную зарплату – ничто иное как миф. Конечно, несколько чересчур энтузиастичных стартапов из Силиконовой Долины могут искать prompt-инженера, но это не жизнеспособная карьера. По крайней мере, пока нет.
В то же время, prompt-инжиниринг как концепция останется актуальным и наверняка будет приобретать все большее значение. Навык написания хорошего призыва, эффективного использования токенов и знания, как активировать определенные выводы, будет полезен не только в наукоемкой обработке данных, LLM и ИИ в целом. Мы уже видели, как ChatGPT изменил способ, которым люди учатся, работают, общаются и даже организуют свою жизнь, поэтому навыку создания призыва будет уделено еще больше внимания. Кто не в восторге от автоматизации скучных дел с помощью надежного помощника-ИИ?
Prompt-инжиниринг и его будущее: станет ли он более, чем просто блудой?
Ориентирование в сложном мире prompt-инжиниринга требует сбалансированного подхода, который признает его потенциал, оставаясь при этом основаным на реальных ограничениях. Кроме того, мы должны быть в курсе того двусмысленного значения, которое имеет prompt-инжиниринг:
- Действие, направленное на подталкивание LLMs выполнить как можно больше задач с минимальными усилиями или шагами
- Карьера, связанная с описанным выше действием
Таким образом, в будущем, по мере увеличения числа входных полей и повышения мастерства LLMs в создании чего-то большего, чем простые макеты и роботообразные тексты в социальных сетях, навык направленной инженерии станет неотъемлемым. По сути, это будет эквивалентом знания, как использовать Word в наши дни.
Заключение
В итоге, направленная инженерия стоит на перепутье, ее судьба будет определяться смесью хайпа, надежды и твёрдой реальности. Будет ли она закрепляться в качестве неотъемлемой части AI-пейзажа или отойдет на задворки технологических модных тенденций – остается вопросом открытым. Однако, то, что ее путешествие будет контроверсиальным во всех отношениях и не закончится скоро, лучше или хуже – это бесспорно.
****[Nahla Davies](http://nahlawrites.com/)**** является разработчиком программного обеспечения и техническим писателем. Прежде чем полностью посвятить свою карьеру техническому писательству, она управляла, среди других интересных вещей, ведущим программистом в компании по созданию экспириентальных брендов из списка Inc. 5,000, клиентами которой являются Samsung, Time Warner, Netflix и Sony.