Почему парсинг контента и копирование статей — действительно плохая идея

Опубликовано: 2022-12-03

Content Scraping And Copying Articles

Вы начали новый блог, и у вас мало страниц или сообщений. Итак, вы рассматриваете возможность очистки контента и копирования статей со всего Интернета.

Да, вы можете опубликовать много страниц за короткое время путем копирования. Но, прежде чем начать, знаете ли вы, что собираетесь делать?

Есть ли уведомление об авторских правах на сайтах, которые вы собираетесь копировать? Если да, то вы будете в худшем случае воровать, а в лучшем — заниматься вопиющим плагиатом.

Вдобавок ко всему, какая польза для вас, кроме большего количества страниц в вашем блоге? Скопированный контент почти не имеет ценности для SEO, поэтому он никак не поможет вам в привлечении трафика на ваш сайт.

В этой статье скрыть
Бороться или игнорировать скребки контента?
Как воспользоваться парсерами контента
Некоторые сайты по извлечению и копированию контента просто глупы.
Все ли копируют плохо?
Пишите хорошо, не копируйте и не воруйте
Сводная информация об очистке и копировании контента

Бороться или игнорировать скребки контента?

Каждый день я сталкиваюсь с сайтами, использующими парсинг и копирование контента для полной перепубликации моих статей.

Могу ли я принять меры против них?

Да, я могу отправить электронное письмо с просьбой к веб-мастеру удалить скопированный контент.

Существует также возможность заблокировать IP-адрес пользователя, чтобы он не мог получить доступ к моему сайту.

Другой вариант — отправить уведомление DMCA (Закон о защите авторских прав в цифровую эпоху) веб-узлу сайта.

Но представляете, сколько времени все это занимало бы у меня каждый день?

Я бы ничего не делал, кроме как пытался охранять свой сайт.

Я давно отказался от этого трудоемкого процесса. Теперь я придерживаюсь бесполезного подхода к копированию контента.

Кроме одного: я ими пользуюсь.

Да, в своей дури и лени мне помогают копировщики контента.

Как воспользоваться парсерами контента

Первый шаг — добавить строку кода в ваш RSS-канал. Это легко настроить, если вы используете Yoast.

Совет от Yoast гласит следующее:

Эта функция используется для автоматического добавления контента в ваш RSS, в частности, она предназначена для добавления ссылок обратно в ваш блог и ваши сообщения в блоге, поэтому тупые парсеры также автоматически добавят эти ссылки, помогая поисковым системам идентифицировать вас как первоисточник. содержание.

RSS feed code

Ссылка появится, когда сообщение в блоге будет просмотрено в RSS полностью или в виде резюме.

RSS code in content feeds

Даже если блоггер достаточно умен, чтобы удалить ссылку при копировании поста, уже слишком поздно. Google и все другие поисковые системы проиндексируют сообщение и будут знать, что мои сообщения являются оригинальными версиями.

Поисковые системы используют не только ссылки. Они также очень хорошо распознают скопированный и плагиатный текст.

Вторая тактика заключается в том, чтобы включать ссылки и особенно внутренние ссылки в мои посты. Большинство блоггеров, которые воруют контент, ленивы, поэтому они редко утруждают себя удалением ссылок.

Вот отличный пример парсера RSS, который мне помогает.

Links in scraped and copied content

Первое, что следует отметить, это то, что это сайт издателя, и он должен знать лучше, чем копировать контент.

Справа вы можете видеть, что мои внутренние ссылки помогли мне получить несколько обратных ссылок. Это хорошо для моего SEO, но не для этого парсинг-сайта.

В качестве бонуса для меня, поскольку ссылки копируются, все они будут вести на мой сайт при нажатии. Вдобавок ко всему, если я включу партнерские ссылки, они будут работать на копиях и могут принести мне несколько дополнительных долларов.

Некоторые сайты по извлечению и копированию контента просто глупы.

Plain stupid

Google Search Console — это самый простой способ найти блоггеров, копирующих ваш контент.

Перейдите к разделу «Ссылки», а затем — «Самые популярные сайты».

Вот пример.

proof of content scraping and copying of my blog articles

Только на этом сайте было украдено, скопировано и полностью опубликовано 176 моих статей.

Я отправил множество электронных писем с просьбой прекратить и воздержаться, но безрезультатно.

Но владельцы сайта вообще не имеют ни малейшего представления о том, как поддерживать сайт.

Если вы попытаетесь получить доступ к сайту, вы получите предупреждение системы безопасности в большинстве браузеров, поскольку у него нет простого SSL-сертификата.

Security risk site

Однако угадайте, что?

Google может получить доступ к сайту без проблем, поэтому мне приписывают 176 обратных ссылок на статьи, а также 210 внутренних ссылок на другие статьи.

Хорошо, все вместе они не стоят и близкой ссылки из Guardian, New York Times или Wikipedia.

Но Google распознает ссылки, так что они немного помогают моему сайту.

Что ж, спасибо, приятно. Но насколько глупым ты можешь быть?

Но если вы снова посмотрите на изображение выше, сайт в верхней части списка связан с 256 моими страницами.

Сайт представляет собой хорошо управляемый агрегированный блог.

Он публикует фрагмент введения моих статей со ссылкой, чтобы продолжить чтение полной статьи на моем сайте.

Это правильный способ использования моего контента.

Все ли копируют плохо?

Нет, нет, совсем нет!

На самом деле, верно обратное.

Копирование, упоминание и ссылки на выбранный текст (или изображения) с авторитетных веб-сайтов для поддержки вашего сообщения в блоге отлично подходят для вашего SEO.

Но делать это нужно правильно.

SmartBug опубликовал эту статью « Контент, атрибуция и плагиат: как отдать должное там, где это необходимо».

Это говорит об атрибуции.

Если вы берете текст непосредственно из другого источника, без каких-либо перефразировок или перефразировок, поместите его в кавычки, назовите источник и дайте ссылку на его веб-сайт.

Это очень хороший совет, но я предпочитаю использовать курсив вместо кавычек.

Правильно цитируя и ссылаясь, вы поддерживаете тему своего поста или свое мнение.

Вы также посылаете положительный сигнал поисковым системам о том, что ваш блог хорошо изучен и заслуживает доверия.

При разумном использовании выборочное копирование текста с правильным указанием и ссылками имеет очень хорошую ценность для SEO.

Но парсинг контента, копирование всей статьи и ее повторная публикация не имеют абсолютно нулевой ценности для SEO.

Пишите хорошо, не копируйте и не воруйте

A poor copy

Копирование - это копирование, а плагиат - это плагиат.

Я отношусь к копированию и переизданию моих статей в полном объеме так же, как и воры, укравшие мои книги.

В обоих случаях это раздражает, но в долгосрочной перспективе наносит небольшой реальный ущерб.

Но если вы начинаете новый блог, не поддавайтесь искушению копировать и вставлять работы других блоггеров.

Может показаться хорошей идеей разместить несколько быстрых сообщений на вашем сайте.

Но на самом деле вы очень быстро ухудшите и уменьшите ценность SEO вашего нового сайта, и он может никогда не восстановиться.

Каждый блог, который вы читаете, начинался с нуля сообщений, даже самых больших.

Я помню, когда я начал этот блог только с темой и страницей о себе. Но потом я принялся за работу.

Единственный способ создать новый блог — это писать фантастические посты и учиться использовать SEO.

Конечно, это занимает гораздо больше времени, но это единственный проверенный способ добиться успеха в ведении блога.

Сводная информация об очистке и копировании контента

Все в Интернете можно скопировать за считанные секунды, и вы никак не сможете защитить свой контент, даже электронные книги.

Все, что вы можете сделать, это принять то, что это происходит, и двигаться дальше.

Регулярное написание и публикация качественных и ценных статей всегда будут побеждать и занимать гораздо более высокое место, чем подражатели.

Однако, странным образом, копирование вашего контента — это своего рода двусмысленный комплимент.

Это должно означать, что парсеры считают это отличным контентом, поэтому его стоит скопировать.

И, как я понял, я могу воспользоваться их неопытностью и непониманием того, как работает SEO.

И последний момент: большинство таких копирующих сайтов терпят неудачу и довольно быстро исчезают, как только осознают бесполезность.

Но всегда есть много новых сайтов, чтобы заменить их, так что это бесконечная история.

Связанное чтение: Письму с искусственным интеллектом не хватает человеческого прикосновения