Джефф Кофман, основатель и генеральный директор Trint – серия интервью

Джефф Кофман - Основатель и Генеральный директор Trint Серия интервью

Джефф Кофман – основатель и генеральный директор Trint, после 30-летней карьеры в ABC, CBS и CBC News Джефф устал сталкиваться со стеной ручной транскрипции и наблюдать, как каждая история бессмысленно останавливается. В 2014 году Джефф и команда разработчиков использовали искусственный интеллект для автоматического транскрибирования, и родился Trint.

Сегодня Trint – это платформа на основе искусственного интеллекта, которая улучшает каждый этап рабочего процесса создания контента.

От транскрибирования до редакторских инструментов, совместного редактирования в реальном времени, экспорта и публикации – делая каждый шаг легче для новостных команд, подкастеров, местных бизнесов и глобальных организаций, чтобы делиться историями быстрее и проще, чем когда-либо.

У вас была замечательная 30-летняя карьера в ABC, CBS и CBC News, с какими проблемами вы сталкивались при использовании традиционной ручной транскрипции?

Я каждый день сталкивался с проблемами ручной транскрипции, работая журналистом. Долгое время до того, как я придумал и создал Trint, я задавался вопросом: почему нет более эффективного способа?

Ручная транскрипция всегда была узким местом моего рабочего процесса как телерепортера. Я брал интервью, слушал пресс-конференции, читал исследования, смотрел видеоматериалы, и затем… мой продюсер и я терялись в «черной дыре транскрипции».

Я не мог писать свою новостную историю, пока не получил точный транскрипт цитат или звуковых отрывков, которые я хотел использовать. Мне нужно знать, что они сказали и как долго продолжается этот звуковой фрагмент. Для этого приходилось сидеть в комнатах просмотра или за нашими столами в наушниках, нажимая “Воспроизведение” и “Пауза”. Затем печатать некоторые слова. Снова “Воспроизведение”. “Пауза”. И так далее. Это занимало несколько часов. Так утомительно. Так необходимо.

Trint был создан в 2014 году. Можетe рассказать, как возникла идея?

Я никогда не представлял себе, что стану техническим специалистом. Это никогда не было частью моего жизненного плана. Это случайно произошло.

В 2013 году я случайно поговорил с несколькими разработчиками программного обеспечения, которые проводили некоторые элементарные эксперименты с аудио и текстом (но не с транскрипцией).

Я задал наивный вопрос: почему я не могу использовать автоматическую речь-в-текст для транскрибации своих интервью.

Я помню, что один из ребят спросил меня: зачем ты это хочешь сделать?

Я ответил: потому что ручная транскрипция – это большая проблема в моей работе как репортера, я ее ненавижу.

Мы поддерживали связь и проводили некоторые эксперименты. Скоро стало ясно, что мы придумали будущее. Год спустя я ушел с работы в Лондонском корреспонденте ABC News, и мы начали создавать Trint.

Какие проблемы возникли при запуске услуги транскрипции в те ранние дни?

Автоматическая транскрипция – это конкретная проблема. Люди, не знакомые с рабочим процессом репортеров и создателей контента, не представляют, как они создают истории. Я помню, что в ранние дни я встречался с очень богатыми ангельскими инвесторами, которым было сложно понять, зачем понадобился транскрипт для репортеров, как я. Это потребовало много объяснений, чтобы они поняли, как работает репортер.

Я думаю, что сегодня это проще. Мы все создатели контента.

Какие алгоритмы машинного обучения используются в Trint?

У нас работает группа очень умных инженеров и исследователей в области данных, которые постоянно экспериментируют с тем, с чем им доступно и с чем их фантазия может работать. Как вы понимаете, наш фокус – это то, как автоматическая транскрипция может ускорить рабочие процессы наших клиентов в медиа, что означает, что мы всегда работаем над речью, дикторами, языками и акустикой. Алгоритмы обработки естественного языка и речи являются частью нашей повседневной работы, но мы также изучаем любые творческие способы использования искусственного интеллекта, чтобы помочь журналистам извлечь информацию из видео, аудио и изображений. Богатая транскрипция позволяет нам давать больше контекста их контенту, делает его более поисковым, и в конечном итоге позволяет им быстрее найти моменты, действительно важные для их аудитории.

Какие языки в настоящее время поддерживаются, есть ли разница в качестве транскрипции для различных языков?

Мы предлагаем около 45 языков, которые можно транскрибировать, и всегда добавляем новые. Некоторые находятся в “бета” версии, а другие более зрелые, в зависимости от объема использованных данных обучения, которые помогают построить модели. Мы постоянно измеряем точность наших моделей для каждого языка, чтобы постоянно развивать их и улучшать их производительность.

Мы всегда смотрим на то, какие новые модели становятся доступными, чтобы понять, можем ли мы внедрить их в нашу безопасную среду обработки ASR.

Но дело не только в языках, которые мы транскрибируем – наши клиенты также могут заказать перевод транскрипта на практически любой язык.

Помимо транскрибации, Trint – это платформа на основе искусственного интеллекта SaaS, разработанная для улучшения рабочего процесса создания контента. Можете ли вы рассказать о других предлагаемых инструментах?

Хотя в основе Trint лежит транскрибация, нас интересует то, для чего наши пользователи используют эти транскрипты и как мы можем помочь им получить быстро и легко максимальную пользу. Это означает глубокое понимание их рабочих процессов, чтобы мы могли сделать каждый шаг максимально гладким.

В конечном итоге, мы хотим, чтобы они могли записывать пресс-конференции, интервью или события на любом месте, в любое время, на любом языке и использовать это в режиме реального времени. Это означает, что мы должны сделать это легким для них или их команды – проверять и использовать живую транскрипцию по мере развития событий – проверять, делиться и переводить ключевые цитаты всего за несколько секунд после их произнесения.

Наше мобильное приложение позволяет это делать даже при наличии только телефона у вас и гарантирует безопасную передачу всего вашей команде, даже если соединение нестабильное.

Наш Story Builder разработан для помощи в нахождении ключевых моментов во всем вашем контенте и их превращении в новый сюжет, который можно экспортировать в другие основные инструменты рабочего процесса производства контента. Будь то редактирование видео, транскрипт подкаста или статья. Если вам нужно использовать текст аудиофайла в качестве заголовков, наш совместный редактор также может помочь.

У вас также есть подкаст, которым вы лично ведете, называемый StoryTech, в котором исследуется, как технологии формируют истории. Не могли бы вы рассказать подробнее, в чем заключается этот подкаст, чего ожидать от слушателей и почему им стоит настраиваться?

StoryTech на самом деле является пересечением моих двух карьер: журналиста и изобретателя в области технологий. Он исследует то, как технологии и инновации формируют способы рассказа историй.

Ранние эпизоды рассказывают о том, как использовалась компьютерная графика для разрушения ледяной стены в “Игре престолов” и как изобретение 35-мм камеры Лейка в 1920-х годах привело к распространению фотожурналистики и созданию журнала LIFE.

Меня увлекает влияние инноваций на рассказывание историй. Вот о чем рассказывает StoryTech.

Какова ваша видение будущего Trint?

Это вызов, с которым сегодня борется каждый инноватор. Как быстрые темпы инноваций открывают возможности для моего продукта?

Нашим клиентам нужен продукт, который создает простые и интуитивные эффективности, легко вписывающиеся в их рабочий процесс. Это означает переход куда дальше транскрипции.

Trint будет использовать искусственный интеллект для выполнения таких задач, о которых не могли мечтать всего несколько лет назад: распознавание голоса, лиц, эмоциональной окраски, контекста, фактов и ложных утверждений. Это будет работать на любом языке – переводя с него на ходу. Ключевой момент заключается в том, чтобы сделать это и многое другое таким образом, чтобы вписываться в другие продукты и создавать единый безболезненный рабочий процесс.

Я не вижу, что Trint заменит репортеров, писателей и создателей контента. Речь идет о том, чтобы освободить их от нудного труда и позволить им сосредоточить свое время на творчестве. Ответственность представлять будущее – это захватывающе. Честно признаюсь, это также вызывает тревогу.

Спасибо за отличное интервью, читатели, которым хочется узнать больше, могут посетить Trint или посмотреть подкаст StoryTech.