Как понять, что автор текста — нейросеть фото

Как понять, что автор текста — нейросеть

Содержание:
    author
    Сергей
    Бондаренко

    Автор статьи

    Тексты нейросетей в целом становятся лучше. Но они до сих пор не умеют понимать главное — смысл вопроса и ответа. Например, попугая тоже можно заставить выучить слова из словаря, но разве он начнет понимать смысл?

    Поэтому и проблемы остаются — текст может оказаться нелогичным, неправдоподобным или просто глупым. Рассказываем, как определить автора текста самостоятельно и через сервисы, а также объясняем, почему нейросетям нельзя доверять на 100%.

    Когда нейросети только появились — многие считали именно так

    Относитесь осторожнее к текстам от ИИ

    Казалось бы, люди создали высокотехнологичный инструмент, который в короткие сроки будет создавать рефераты, дипломные работы, книги, статьи и т. д. Что в этом плохого? А тут дело в том, что ИИ может бездумно выполнять ваш запрос, даже если он заранее неправильный или просто создаст непонятный текст, который сложно понять.

    Нет времени объяснять, да и расчеты не ясны — просто дели на 2

    Поэтому к текстам, созданным искусственным интеллектом, следует относиться с осторожностью. ИИ способен генерировать тексты на различные темы, но он не обладает эмоциональным интеллектом человека, не проверяет факты и не углубляется в тему. Нейросеть может написать любой текст, но он будет лишен эмпатии, субъективности, глубины понимания человеческих чувств и жизненного опыта, а также может содержать фактические ошибки.

    На агрегаторе нейросетей все описания сервисов сгенерированы нейросетью — сложно понять что-то в этом наборе слов

    Например, если попросить нейросеть написать материал с алгоритмом постройки дома, то она вполне справится. А вопрос «Что такое любовь» вызовет у нее сложности. Она предоставит сухие формулировки и описания из поиска, но проанализировать чувство не сможет.

    Нейросеть училась на разных историях и рассказах

    Кроме того, ученые из Стэнфорда считают, что ChatGPT деградирует из-за попыток его улучшить. Они модернизируют одну часть модели, в это время ухудшается работа в других. В результате модель стала хуже выполнять отдельные операции и неверно отвечать на запросы. Это еще один довод к тому, что каждую мысль за нейросетями стоит проверять.

    Давайте разберемся в том, почему нужно осторожно обращаться с нейросетями и их продуктами.

    Почему нейросети пишут хуже людей

    Они могут выдумывать факты

    В США юриста привлекли к ответственности за использование цитат из несуществующих дел, которые ему предоставил ChatGPT. Это говорит о том, что если вы пользуетесь нейросетью, проверяйте факты, которые она вам дает.

    ChatGPT обучался на огромном количестве текстов, собранных из сети, включая книги, статьи, сайты, научные статьи и другие источники. Поэтому нейросеть способна легко сгенерировать какую-нибудь чушь, которая будет похожа на правду.

    Например, я спросил ChatGPT или GigaChat о том, можно ли использовать провод ПУНП для проводки в доме. ChatGPT радостно рассказал, что он имеет хорошую гибкость и подходит для прокладки в стенах. GigaChat подумал и порекомендовал не монтировать его открытым способом. А между тем его вообще нельзя использовать в монтаже в домах с 2007 года.

    Каждый факт от нейросети нужно перепроверять

    Они не владеют опытом

    Ни одна нейросеть не сможет передать опыт и мысли человека — она может только имитировать опыт миллионов людей, на чьих текстах обучалась.

    У таких материалов нет и не может быть личного ощущения, мыслей, рассуждений. Из-за отсутствия личного опыта нейросеть не может давать подходящие советы для решения той или иной ситуации — она их не прожила, отчего не знает, как правильнее решить вопрос. Все, что нейросеть может сделать — скомпилировать непроверенную информацию и выдать ответ.

    С запросом «Как я провел лето» она сможет справиться только с хорошо продуманным промтом. В таком тексте вряд ли будут ощущения, мысли, события конкретного человека. Скорее всего, это будет поверхностный алгоритм или рассказ, построенный на том, что нейросеть запомнила, пока обучалась. Потребуется несколько промтов или уточнений, чтобы добиться нормального результата.

    Они не владеют эмоциями

    Как и в предыдущем пункте, нейросети могут выдавать информацию по запросу, но это не будут эмоциональные высказывания или понимания чувств.

    Если смотреть с практической точки зрения — нейросети не могут писать отзывы на товары или услуги. Результаты такой генерации пока еще остаются заметно пластмассовыми и не вызывают доверия.

    Мне довольно трудно ответить на вопрос, могу ли я отличить текст, написанный нейросетью, от текстов живых авторов, потому что процентов 90 контента по маркетингу в сети — это низкопробный контент, который собран авторами из информации в интернете. Фундаментальной разницы между подобными компиляциями и работой нейросети я не вижу.

    Если лично мне пришлют контент, написанный нейросетью, я его смогу отличить просто потому, что все статьи Студии Чижова основаны на опыте наших спецов. Информацию из открытых источников мы используем мало, это специфика нашей работы. Соответственно, нейросети просто не на чем обучаться, чтобы создавать для нас контент.

    Когда нейросети научатся собирать информацию из проектных чатов в Битриксе, из отчетов в GDS, из наших созвонов со специалистами, а желательно — напрямую из голов наших тим-лидов, проект-менеджеров, контентщиков, таргетологов, то тогда я признаю, что нейросети нам полезны. А пока — нет.

    Как нейросети могут навредить

    Непроверенный материал от ИИ может быть риском для бизнеса. В них может быть много плагиата, начиная от фрагментов текста и заканчивая целыми абзацами и разделами, которые приводят к понижению позиций в результатах поиска всего сайта.

    Например, в конце мая 2023 года в сети завирусилось фото взрывов в Пентагоне. Это сразу же повлияло на индексы крупнейших компаний США и обвалило финансовые рынки — например, S&P 500 упал на 30 пунктов, а Dow Jones Industrial Average — на целых 50.

    Или другой пример — разразился скандал вокруг интервью, которое Михаэль Шумахер дал немецкому журналисту после 10 лет молчания. Как позже оказалось — все ответы Шумахера журналист сгенерировал с помощью нейросетей. Газете пришлось оправдываться из-за возмущений общественности, продажи тоже упали, руководство уволило журналиста и редактора, который отвечал за публикацию.

    Как видите, бездумное использование нейросетей может обернуться не только дезинформацией, но и существенным уроном — финансовым и репутационным.

    Как самому определить, что текст написала нейросеть

    Различить текст, созданный ИИ и написанный человеком, не так уж просто. Глубокое понимание темы может помочь обнаружить ошибки нейросети — например, фейковые утверждения в тексте. Однако некоторые нейросети способны быть очень убедительными для людей, которые не слишком погружены в тему, а еще могут заставить сомневаться и перепроверять информацию даже экспертов.

    Но при должном опыте с нейросетями их можно вычислить — у них своя, характерная манера работы с текстом.

    Тексты нейросети — более шаблонные и «правильные». Они написаны как по учебнику, реальный же человек пишет иначе. Особенно если речь идет об опытном авторе, который хорошо разбирается в теме: в тексте он использует профессиональный сленг, может упомянуть о личном опыте или сделать отсылку к актуальным инфоповодам — например, свежим кейсам или законам, о которых нейросеть ещё просто не знает.

    Также ИИ плохо пишет некоторые форматы текста. К примеру, короткие коммуникации для клиентов или тексты брендовых email-рассылок. Это не статьи — тут нужно 100%-ное попадание в tone of voice, поэтому текст, написанный нейросетью, сразу виден.

    И конечно, нейросеть несложно распознать, если давно работаешь с человеком. У каждого автора есть свои особенности — любимые выражения, типичные ошибки и едва уловимые стилистические нюансы, которые помогают редактору понять, чей текст, даже если он этого не знает. Если стилистика вдруг резко поменялась — повод заподозрить, что вся статья или её кусок написан кем-то другим. Например, нейросетью.

    При этом я не исключаю, что наши авторы пользуются нейросетями при подготовке статей. Не вижу в этом ничего страшного при условии, что ИИ используется как помощник, а не для того, чтобы бездумно скопипастить кусок текста в свой материал. Технологии быстро развиваются, и глупо не осваивать новые инструменты, чтобы оптимизировать свою работу.

    В качестве примера вспомню случай, который произошел совсем недавно. Мне пришлось искать экспертов для статьи, которые могли бы ответить на вопросы и дополнить ее важными мыслями. Я их нашел, но они решили экономить свое время и прислали ответы, сгенерированные ИИ. Разумеется, это сразу стало заметно. Самое смешное то, что четыре эксперта прислали практически идентичный ответ на один вопрос. Брать такие комментарии в статью я, конечно, не стал.

    Есть несколько конкретных зацепок, которые помогут вам определить, кто автор текста перед вами — нейросеть или человек.:

    • Длина текста. Если текст существенно превышает ожидаемый объём или содержит излишне подробное описание и длинные предложения, это может говорить о его генерации нейросетью. ИИ могут создавать длинные тексты без потери единой нити повествования. Смысл часто бывает водянистым, его сложно уловить и усвоить. Весь текст не покидает ощущение пластмассовой жвачки. 
    • Отсутствие эмоций. Нейросети не обладают эмоциональным интеллектом, поэтому текст может казаться лишенным эмоций или иметь искусственный оттенок. Обычно в нем подобраны максимально нейтральные слова и пояснения, нет ярких примеров или даже эмоционально окрашенных слов. Нейросеть можно попросить сделать эмоциональный текст, но он все равно не станет от этого естественным и живым, чаще эмоции выглядят в таких текстах искусственными и лишними. 
    При попытке получить от нейросети понимание чувства нейросеть выдала мысли по бумажке
    • Списки. Нейросети не всегда правильно оформляют списки и включают их там, где это неуместно или нелогично. И почти всегда ставят «:» в конце общего предложения в начале каждого пункта списка. 
    Почти каждый список нейросеть оформляет именно так
    • Отсутствие опечаток и ошибок. Нейросети, как правило, генерируют тексты без опечаток, орфографических и пунктуационных ошибок. А если они есть, то они слишком глупые и не зависят от профессионального уровня текста. Например, в тексте про использование помидоров в блюдах нейросеть советовала исключить «новый плод из кулинарии» (а это овощ), и писала слово «овощ» с «ъ» в конце.  
    • Необычное или нелогичное использование фраз и выражений. Нейросети могут создавать тексты, которые не типичны для естественного человеческого стиля письма. Это может проявиться в неожиданных синонимах, странных ассоциациях или нелепых переходах между идеями. Например, на запрос «что такое компьютер» она заявляла, что это «сеть искусства для страны и мышь науки».
    Люди так не говорят и не пишут
    • Отсутствие глубины. Нейросети пишут тексты на темы, в которых не имеют личного опыта или экспертного знания. Это может проявиться в поверхностном или неверном описании сложных концепций, ошибочных фактах или нелепых утверждениях. Их можно попросить привести примеры, но они чаще всего оказываются поверхностными и искусственными. Например, можно попросить нейросеть придумать блюда для семьи из 8 человек, в которой 3 детей и одному человеку нельзя мясо. Но она в ответ придумает 3-4 блюда, а для вегетарианца посоветует есть только шпинат.
    • Использование устаревших данных. Нейросети могут включать в текст устаревшие или нелогичные данные, если на такой информации они и обучались.

    Можно ли понять, что автор текста — нейросеть? И да и нет. Если смотреть на статью мельком, то нет, не смогу. Но если статья нужна для получения информации, то это сразу видно — в текстах если и есть факты, то они или описаны слишком сухо (без примеров, личного опыта), или могут быть с ошибками. Если же смотреть по стилю написания, то у нейросети он более сухой, с канцеляризмами вроде «является», которые более-менее нормальные авторы давно не употребляют.

    Как с помощью сервисов понять, что текст написан нейросетью

    Рассмотрим несколько сервисов, которые помогут определить, что текст сгенерирован нейросетью. На них нельзя возлагать большие надежды, так как материалы на русском языке тяжело воспринимаются программами.

    GPTZero

    Простой сервис, который поможет определить любой текст, созданный искусственным интеллектом. Просто вставьте текст в окно или загрузите материал файлом в формате pdf, docx или txt.

    Этот инструмент был специально разработан для преподавателей с целью проверки домашних заданий учеников. GPTZero позволяет убедиться, что домашние задания написаны учениками, а не чат-ботами.

    GPTZero обучали с помощью наборов данных парного текста, который был написан людьми и искусственным интеллектом. По статистике разработчиков в 99% случаях текст распознается корректно, но только если он на английском языке.

    Сгенерированный текст на английском языке GPTZero четко определил как созданный AI

    На русском языке сервис не распознает нейросетевые тексты. Я попробовал проверить полностью сгенерированный текст. Сервис утверждает, что его писал человек.

    Текст на русском GPTZero определил как созданный человеком, хотя это не так

    Если вам нужно проверять на подлинность тексты на английском языке, GPTZero — отличная программа.

    GPT-2 Output Detector

    GPT-2 Output Detector — сервис на базе машинного обучения RoBERTa с 1,5 миллиардами параметров, который настроен на определение текста созданного на модели GPT-2. Детектор GPT-2 разработан для определения авторства текста и поиска сгенерированных материалов.

    Если вас смущает подлинность текста, проверьте его с помощью этого инструмента на базе искусственного интеллекта. Он определяет текст, созданный нейросетями и предоставляет результаты вероятности в процентах.

    Понимает как английский, так и русский языки.

    Этот сервис хорошо определяет искусственно созданные тексты на любом языке

    Было бы здорово знать алгоритмы, на которых работает эта программа, чтобы уметь самостоятельно видеть сгенерированные тексты.

    Главное — понимать, что нейросети призваны быть помощником в работе

    Неужели нейросети так вредны?

    На самом деле нет. Вредно злоупотреблять ими и использовать их бездумно.

    Искусственный интеллект был создан человеком для помощи. То есть он призван помогать, а не делать за нас нашу работу. Ему можно доверить подготовку плана, отдельных частей материала, перефразировать готовый текст или сжать его. Но не стоит доверять ему писать готовые материалы, не проверяя их.

    Это может закончиться потерей доверия к ресурсу, понижению сайта в выдаче, даже к финансовым и репутационным потерям компании. Идеальный вариант — доверить часть работы нейросети, но проверить за ней каждый факт, каждое утверждение, использовать ее как помощника и работника.

    А теперь вопрос со звездочкой. Как вы думаете, кто написал эту статью — нейросеть или человек? Обсудить этот вопрос и другие наши статьи можно в телеграм-канале Awake Journal, где мы публикуем анонсы ко всем новым статьям и рады вашим комментариям. Подписывайтесь, чтобы ничего не пропустить 😉

    Подпишитесь
    на журнал
    Чтобы знать о выходе новых статей