Что такое GPTZero и зачем он нужен

GPTZero — это сервис, который анализирует загруженный текст и пытается определить, использовалась ли при его написании одна из больших языковых моделей (LLM). К таким моделям относится, например, нейронная сеть на основе ChatGPT. Система была разработана выпускником Принстонского университета Эдвардом Тианом, чтобы помочь преподавателям проверять студенческие работы на предмет плагиата.

Формально система принимает русский язык для проверки, но не может его полностью просканировать. Поэтому сервис пока следует использовать только с английским языком. Возможно в будущем появится поддержка других языков.

Для определения оригинальности текста GPTZero ориентируется на два основных критерия — уровень случайности в составленных предложениях (Perplexity) и прерывистость, или вариативность, этих предложений (Burstiness).

Недоумение указывает, выглядят ли отдельные предложения или выражения из входного текста как нечто, собранное языковой моделью. Чем выше этот показатель, тем больше вероятность того, что контент написан человеком.

Взрывность больше относится к распределению случайности среди всех предложений. Нейронные сети обычно генерируют правильно сформированный текст с фразами примерно одинаковой длины. В работах людей может быть больше вариаций длины и нетипичных выражений. Как и в случае с первым показателем, чем выше уровень Вспыльчивости, тем больше вероятность авторства реального человека.

Стоит отметить, что на данный момент GPTZero нельзя назвать идеальным инструментом для проверки текстов. Система не всегда дает правильный результат. Алгоритм хорошо справляется с идентификацией сгенерированных предложений, но работы, полностью написанные человеком, часто классифицируются как плагиат. Иногда возникает обратная ситуация: GPTZero берет за оригинальные тексты абсурдные истории из нейросети GPTZero.

Скорее всего, «проницательность» сервиса в будущем будет улучшаться, а пока его стоит использовать только как дополнение к другим инструментам и собственным знаниям.

Как использовать GPTZero

Если вам нужно быстро проанализировать небольшой текст, то регистрация не требуется. Просто зайдите на сайт GPTZero и активируйте эту функцию. Для регулярного использования и одновременной проверки нескольких файлов вам придется создать учетную запись. Это бесплатно и занимает не более пары минут.

Материал можно вставить в текстовое поле или скачать в виде документа. Допустимые форматы: PDF, DOCX и TXT. Текст должен быть не менее 250 символов, чтобы алгоритм смог его полностью проанализировать.

Перед началом проверки необходимо подтвердить галочкой, что вы согласны с условиями использования сервиса. Имейте в виду, что при добавлении текстов или загрузке документов в GPTZero разработчик или владельцы серверов могут получить доступ к вашей информации и сохранить ее для себя. Поэтому этот инструмент не следует использовать для работы с конфиденциальной информацией. Когда будете готовы, нажмите кнопку «Получить результаты».

После активации проверки GPTZero быстро проанализирует текст и представит результаты ниже на странице под полем ввода. Из названия сразу будет понятно, какой вердикт вынесла система.

Сервис дает один из нескольких вариантов: текст полностью написан человеком, целиком создан ботом или может содержать части, которые компилирует нейросеть.

Если GPTZero найдет отдельные подозрительные кусочки, которые могут быть за нейросетью, то окрасит их в желтый цвет. Иногда система ошибается и выделяет авторские абзацы как сгенерированные.

Прокрутите страницу вниз, чтобы изучить показатели Perplexity и Burstiness в разделе статистики. Эти два свойства определяются точками. Четкой градации оценок пока нет. Можно ориентироваться на степень «заштрихованности» шкалы.

В конце блока GPTZero также отображает предложение с наивысшей степенью оригинальности и его индивидуальным баллом. С такими результатами система тоже может ошибаться. Часто алгоритм выдает сгенерированный текст, а не написанный человеком. Поэтому стоит с осторожностью полагаться на результаты.

Базовая версия GPTZero доступна бесплатно, но с ограничениями. Вы можете проверять тексты объемом до 5000 символов и загружать не более трех документов одновременно. Платные подписки за 10 и 20 долларов в месяц расширяют лимит до 50 000 символов и позволяют преподавателям или организациям регулярно работать с большим объемом записей.