Создание контента — один из самых частых сценариев использования генеративных нейросетей. Рассказываем, как ИИ становится помощником копирайтеров и заказчиков текстовых проектов

В чем особенность Text.ru и почему им нужен ИИ

Text.ru существует на российском рынке с 2011 года, а количество уникальных пользователей ежемесячно составляет более трех миллионов. Как рассказал генеральный директор компании Никита Камышников, Text.ru развивает несколько направлений. Основной продукт — сервис проверки текстов на уникальность, или антиплагиат. Также у Text.ru есть другие инструменты для работы с текстами:

  • SEO-анализ — сервис, позволяющий определять процент заспамленности и «водности», считать количество слов, искать смешанные слова;
  • проверка орфографии — поиск ошибок и опечаток;
  • словарь синонимов — подбор аналогов слов любой тематики.

По словам Никиты, было понятно, что для улучшения качества сервисов команда будет интегрировать нейросети. «Мы сразу для себя решили, как только пошла волна всеобщего интереса к нейросетям, что нужно быстрее обозначить себя как действующее лицо на этом рынке. Поэтому была выбрана стратегия партнерства с крупными игроками в отрасли. Мы использовали сторонние продуктовые решения, которые на своей стороне уже дотачивали и упаковывали под свои нужды и аудиторию. Постепенно ключевым партнером в этом направлении, получившем в Text.ru название „Нейропомощник“, для нас стала платформа Yandex Cloud, с которой мы начали взаимодействовать в 2023 году для наших инструментов проверки текстов на уникальность», — пояснил спикер.

Сейчас с помощью «Нейропомощника» заказчики могут написать текст с нуля, повысить его уникальность, исправить орфографические и пунктуационные ошибки и проверить, кем написан текст. «Наиболее востребован детектор ИИ. Всем интересно узнать, кто же написал текст: человек или бездушная машина. И большим спросом пользуется инструмент „нейропомощник-копирайтер“ на базе YandexGPT. В нем есть несколько типов заданий: произвольный текст, текст для соцсетей, рекламное объявление, текст для карточки товара», — объяснил Камышников.

В нейросети нет «волшебной кнопки», которая сразу сделает все идеально. Чтобы вывести инструмент на нужный ответ, необходимо прописать подробный промпт (запрос или набор инструкций, которые пользователь передает нейросети или другой программе с ИИ для выполнения определенной задачи. — РБК). В Text.ru экономят время пользователей, зашивая готовые промпты в отдельные инструменты. Например, если нужно описание карточки товара для маркетплейса, то будет достаточно указать название продукта и характеристики.

«В последнее время мы все больше погружаемся в процесс дообучения генеративных моделей под наши запросы и задачи. Свежий пример — рерайт неуникальных фрагментов текста. Инструмент на стыке проверки уникальности и GPT, который позволяет после обнаружения неуникальных фрагментов переписать их нейросетью без ущерба для содержания, цельности, качества текста. Чтобы получить нужный результат, мы совместно с коллегами из Yandex Cloud долго и тщательно обучали YandexGPT высоким стандартам рерайта на основе огромного массива рукописных материалов с нашей биржи», — подытожил генеральный директор компании Text.ru.

Как у Text.ru — c чего начать процесс внедрения

Есть простые бизнес-сценарии, для которых не нужно специально дообучать большие языковые модели и нанимать для этого команду специалистов по работе с большими данными (data scientist). Достаточно простым языком описать задачу и проконтролировать ее выполнение. Сейчас компании, предоставляющие доступ к нейросетям, создают единые платформы для легкого старта. Для реализации своего решения в Text.ru использовали сервис Yandex Foundation Models, который предоставляет доступ к модели YandexGPT по API.

Если подобрать промпт не удалось с нескольких попыток, то в таких случаях поможет обучение моделей. «Вся техника находится „под капотом“. Все, что нужно сделать пользователю, — подготовить набор данных. Это набор эталонных пар того, какими мы хотели бы видеть ответы модели. Общее правило для всех таких технологий: чем больше данных, тем лучше», — уточнил архитектор ML-сервисов Yandex Cloud Дмитрий Рыбалко.

Процесс внедрения языковых моделей не всегда прост. В Yandex Cloud как раз и помогают пользователям понять, какие технологии сработают для решения конкретной задачи бизнеса, как выбрать методологию и оценить качество работы нейросетей.