Проблема ИИ текстов, но не та, которую обсуждают все
Сижу, читаю отчёт GPTZero по своему же тексту. Текст писал я. Руками. Без всяких подсказок от ИИ. Детектор уверенно говорит: 78% вероятность, что это ИИ. Открываю соседний материал, который накидал через Webwize с парой моих правок, прогоняю – 2%, «скорее всего, человек». И вот тут начинается самое интересное, потому что это не баг конкретного сервиса. Это дыра во всей логике, по которой сейчас поисковики и детекторы пытаются отделить машинный текст от человеческого.Все обсуждают ИИ-тексты с одной стороны: мол, контент стал массовым, выдача замусоривается, Google и Яндекс должны как-то с этим бороться. Окей, согласен. Но мало кто говорит вслух о другой части уравнения – а по каким именно признакам они собираются ловить машину. И когда начинаешь смотреть на эти признаки внимательно, понимаешь: ловят они не ИИ. Ловят хороший текст.Если разобрать, что считается маркером «машинности» в популярных детекторах вроде GPTZero и в логике алгоритмов поисковиков, картина получается забавная. Маркер первый – точный и технический подбор слов. Маркер второй – единообразный стиль на протяжении всего материала. Третий – точность и последовательность изложения. Четвёртый – отсутствие творческих отступлений, лирики, ухода в сторону. Пятый – чёткая структура с заголовками, подзаголовками, списками и логичными переходами. Я осознано опускаю истории про длинное тире, "в современном мире" и "это не, а..." и прочие самые очевидные ИИ маркеры. Так как уж бороться с нимим умеет любой мало мальски уважающий себя ИИ генератор текста. Читать далее

Сижу, читаю отчёт GPTZero по своему же тексту. Текст писал я. Руками. Без всяких подсказок от ИИ. Детектор уверенно говорит: 78% вероятность, что это ИИ. Открываю соседний материал, который накидал через Webwize с парой моих правок, прогоняю – 2%, «скорее всего, человек». И вот тут начинается самое интересное, потому что это не баг конкретного сервиса. Это дыра во всей логике, по которой сейчас поисковики и детекторы пытаются отделить машинный текст от человеческого.
Все обсуждают ИИ-тексты с одной стороны: мол, контент стал массовым, выдача замусоривается, Google и Яндекс должны как-то с этим бороться. Окей, согласен. Но мало кто говорит вслух о другой части уравнения – а по каким именно признакам они собираются ловить машину. И когда начинаешь смотреть на эти признаки внимательно, понимаешь: ловят они не ИИ. Ловят хороший текст.
Если разобрать, что считается маркером «машинности» в популярных детекторах вроде GPTZero и в логике алгоритмов поисковиков, картина получается забавная. Маркер первый – точный и технический подбор слов. Маркер второй – единообразный стиль на протяжении всего материала. Третий – точность и последовательность изложения. Четвёртый – отсутствие творческих отступлений, лирики, ухода в сторону. Пятый – чёткая структура с заголовками, подзаголовками, списками и логичными переходами. Я осознано опускаю истории про длинное тире, "в современном мире" и "это не, а..." и прочие самые очевидные ИИ маркеры. Так как уж бороться с нимим умеет любой мало мальски уважающий себя ИИ генератор текста.
Читать далее
admin