Считается, что т.н. искусственный интеллект Dall-E хорошо рисует, Vall-E прикольно говорит, а теперь есть еще и ChatGPT, который помимо прочего пишет тексты.
Притом эти самые тексты ИИ пишет (составляет) до такой степени складно (есть и такое мнение), что выявить их «искусственное» происхождение иногда можно только с применением специальных программных инструментов. Благо, такие тоже существуют.
Правда, и мы намеренно акцентируем Ваше внимание на данном факте, такие инструменты пока очень далеки от совершенства (проще говоря, работают они так себе).
Но за неимением других пользоваться приходится тем, что есть. И сейчас вкратце о нескольких наиболее удачных (на наш взгляд) решениях.
Не пропустите: OPENAI S SERVICES ARE NOT AVAILABLE — КАК ОБОЙТИ И ЗАРЕГИСТРИРОВАТЬСЯ В CHATGPT
Итак,..
GPT-2 Output Detector
Самый что ни есть непосредственный родственник ChatGPT. В том смысле, что «детектор» этот тоже разработан специалистами OpenAI и в настоящее время является одним из самых инновационных инструментов такого типа в мире.
А OpenAI, напомним, технологиями «имитации и дублирования» художественных способностей человека официально занимается аж с 2015 года. То есть, начали ребята задолго до нынешнего хайпа вокруг ChatGPT.
Вокруг сервиса GPT-2 Output Detector хайпа вообще никакого не наблюдается. Тем не менее он уже тоже функционирует, притом сравнительно давно. Но пока только в демо-режиме. Но работает. Вот [ССЫЛКА] на страницу проверки текстов.
Организовано все просто и понятно: открываем страницу по ссылке, вставляем текст в поле — и прога тут же определяет (а точнее, «предсказывает»), написан ли он человеком (Real) или сгенерирован ИИ (Fake).
Не пропустите: КРИПТОГРАФИЧЕСКИЙ ВОДЯНОЙ ЗНАК В CHATGPT: ЧТО ЭТО И КАК «УДАЛЯТЬ»
GLTR
Это сокращенно от Giant Language Model Test Room. Система создана в 2019 году совместно специалистами компании MIT-IBM Watson AI Lab и Гарвардского университета.
Что характерно, создана она была именно как инструмент выявления сгенерированных ИИ текстов и в ответ на выпуск OpenAI как раз программы GPT-2.
Работает GLTR по принципу «takes one to know one», то бишь «…сам такой». В том смысле, что тест GLTR анализирует тоже с помощью ИИ путем «предсказывания» слов — [ССЫЛКА].
И если прога сама правильно угадывает слова по тексту, то делает вывод, что текст сгенерирован. В противном же случае, т.е. угадывать каждое следующее слово у неё не получается, она скажет, что текст, вероятнее всего, написан человком.
Не пропустите: КАК ВЫЯВИТЬ НЕВИДИМЫЕ СИМВОЛЫ В ТЕКСТЕ НА САЙТАХ?
GPTZero
А это программное изделие создал не кто иной, как лично Эдвард Тиан (студент Принстонского университета). Который с некоторых пор обрел широкую известность (в узких кругах) публичными заявлениями относительно того, что студенты уже во всю делают учебные задания с помощью ChatGPT и прочих аналогичных программ.
И одними лишь заявлениями Тиан, как видим, не ограничился. Его GPTZero умеет рассчитывать «случайность» в предложениях и на основе эти данных определяет авторство.
Вот [ССЫЛКА] — переходим на сайт, вставляем текст в поле, затем прокручиваем экран в самый низ и жмем кнопку «Get GPTZero Result». Работает сервис довольно медленно (и непонятно), но тоже может быть где-то полезен.
Общая проблема детекторов текста ИИ
Если взять два теста — написанный собственноручно и сгенерированный в ChatGPT — и прогнать из через детекторы, то все проги (и перечисленные в этом посте и другие), вероятнее всего покажут, что оба теста «искусственные».
И это таки проблема! НО что еще «интереснее», не понятно, как с нею быть дальше.
Дело в том, что авторы, которые сегодня профессионально или полупрофессионально пишут онлайн, уже очень давно пишут не толко для читателей-людей, но и для алгоритмов тоже. Поисковых систем. И ходу работы уже на автомате руководствуются определенными алгоритмами (упрощают и сокращают предложения, расставляют ключевые фразы, выделяют заголовки, цитаты и т.д.).
Другими словами, сами авторы пишут как ИИ, это во-первых. А во-вторых, все ИИ учились и учатся на тех тестах, которые по алгоритмам и для алгоритмов пишут люди. Такая вот загогулина…
[irp]