Pourquoi le scraping de contenu et la copie d'articles sont une très mauvaise idée

Publié: 2022-12-03

Content Scraping And Copying Articles

Vous avez commencé un nouveau blog et vous n'avez pas beaucoup de pages ou de messages. Vous envisagez donc de récupérer du contenu et de copier des articles sur Internet.

Oui, vous pouvez publier beaucoup de pages en peu de temps en copiant. Mais, avant de commencer, savez-vous ce que vous vous apprêtez à faire ?

Y a-t-il un avis de droit d'auteur sur les sites que vous envisagez de copier ? Si c'est le cas, vous serez, au pire, en train de voler et, au mieux, de commettre un plagiat flagrant.

En plus de cela, quel est l'avantage pour vous autre que plus de pages sur votre blog ? Le contenu copié n'a presque aucune valeur SEO, il ne vous aidera donc pas du tout à générer du trafic vers votre site.

Dans cet article Masquer
Combattre ou ignorer les scrapers de contenu ?
Comment tirer parti des scrapers de contenu
Certains sites de grattage et de copie de contenu sont tout simplement stupides
Est-ce que tout copier est mauvais ?
Écrivez bien, ne copiez pas et ne volez pas
Résumé du grattage et de la copie de contenu

Combattre ou ignorer les scrapers de contenu ?

Chaque jour, je tombe sur des sites utilisant le scraping et la copie de contenu pour republier mes articles dans leur intégralité.

Puis-je intenter une action contre eux ?

Oui, je peux envoyer un e-mail demandant au webmaster de supprimer le contenu copié.

Il y a aussi le choix de bloquer l'adresse IP de l'utilisateur afin qu'il ne puisse pas accéder à mon site.

Une autre option consiste à envoyer un avis DMCA (Digital Millennium Copyright Act) à l'hébergeur du site.

Mais pouvez-vous imaginer combien de temps tout cela me prendrait chaque jour ?

Je ne ferais rien d'autre que d'essayer de surveiller mon site.

J'ai abandonné ce processus chronophage il y a longtemps. Maintenant, j'adopte l'approche de ne rien faire pour les copieurs de contenu.

Sauf une chose : j'en profite.

Oui, dans leur bêtise et leur paresse, les copieurs de contenu m'aident.

Comment tirer parti des scrapers de contenu

La première étape consiste à ajouter une ligne de code à votre flux RSS. Il est facile à configurer si vous utilisez Yoast.

Le conseil de Yoast dit ceci:

Cette fonctionnalité est utilisée pour ajouter automatiquement du contenu à votre RSS, plus précisément, elle est destinée à ajouter des liens vers votre blog et vos articles de blog, de sorte que les grattoirs muets ajouteront automatiquement ces liens également, aidant les moteurs de recherche à vous identifier comme la source originale du contenu.

RSS feed code

Le lien apparaîtra lorsqu'un article de blog est affiché dans RSS dans son intégralité ou sous forme de résumé.

RSS code in content feeds

Même si un blogueur est assez intelligent pour supprimer le lien lorsqu'il copie un article, il est trop tard. Google et tous les autres moteurs de recherche auront indexé le message et sauront que mes messages sont les versions originales.

Les moteurs de recherche n'utilisent pas que des liens. Ils sont également très bons pour identifier les textes copiés et plagiés.

La deuxième tactique consiste à inclure des liens et surtout des liens internes dans mes publications. La plupart des blogueurs qui volent du contenu sont paresseux, ils se donnent donc rarement la peine de supprimer des liens.

Voici un excellent exemple d'un grattoir de copie RSS qui m'aide.

Links in scraped and copied content

Le premier point à noter est qu'il s'agit d'un site d'éditeur et qu'il devrait savoir mieux que copier du contenu.

Sur la droite, vous pouvez voir que mes liens internes m'ont aidé à gagner quelques backlinks. C'est bon pour mon référencement mais pas pour ce site de grattage.

En prime pour moi, parce que les liens sont copiés, ils ramèneront tous vers mon site une fois cliqués. En plus de cela, si j'inclus des liens d'affiliation, ils fonctionnent sur des copies et pourraient me rapporter quelques dollars supplémentaires.

Certains sites de grattage et de copie de contenu sont tout simplement stupides

Plain stupid

Google Search Console est le moyen le plus simple de trouver des blogueurs qui copient votre contenu.

Accédez à Liens, puis à Principaux sites de liaison.

Voici un exemple.

proof of content scraping and copying of my blog articles

Ce site à lui seul a volé, copié et publié 176 de mes articles dans leur intégralité.

J'ai envoyé de nombreux courriels leur demandant de cesser et de s'abstenir, mais en vain.

Mais les propriétaires du site n'ont aucune idée de la façon de maintenir un site Web.

Si vous essayez d'accéder au site, vous obtenez un avertissement de sécurité dans la plupart des navigateurs car il ne dispose pas d'un simple certificat SSL.

Security risk site

Cependant, devinez quoi?

Google peut accéder au site sans problème, je suis donc crédité de 176 backlinks d'articles ainsi que de 210 liens internes vers d'autres articles.

D'accord, tous ensemble, ils ne valent pas près d'un lien du Guardian, du New York Times ou de Wikipedia.

Mais Google reconnaît les liens, ils aident donc un peu mon site.

Eh bien, merci et sympa. Mais à quel point pouvez-vous devenir stupide?

Mais si vous regardez à nouveau l'image ci-dessus, le site en haut de la liste a lié à 256 de mes pages.

Le site est un blog agrégé bien géré.

Il poste un extrait de l'introduction de mes articles avec un lien pour continuer la lecture de l'article complet sur mon site.

C'est la bonne façon d'utiliser mon contenu.

Est-ce que tout copier est mauvais ?

Non, non, pas du tout !

En fait, le contraire est vrai.

Copier, créditer et lier du texte (ou des images) sélectif à partir de sites Web faisant autorité pour soutenir votre article de blog est excellent pour votre référencement.

Mais vous devez le faire correctement.

SmartBug a publié cet article, Content, Attribution, and Plagiarism: How to Give Credit Where Credit Is Due.

Il dit ceci à propos de l'attribution.

Si vous prenez du texte directement d'une autre source, sans aucune paraphrase ou reformulation, placez-le entre guillemets, nommez la source et créez un lien vers son site Web.

C'est un très bon conseil, mais je préfère utiliser des italiques plutôt que des guillemets.

En citant et en liant de la bonne manière, vous soutenez le sujet de votre message ou vos opinions.

Vous envoyez également un signal positif aux moteurs de recherche indiquant que votre blog est bien documenté et digne de confiance.

Utilisée à bon escient, la copie sélective de texte avec des crédits et des liens corrects a une très bonne valeur SEO.

Mais le grattage et la copie de contenu d'un article entier et sa republication n'ont absolument aucune valeur SEO.

Écrivez bien, ne copiez pas et ne volez pas

A poor copy

La copie est la copie et le plagiat est le plagiat.

Je considère la copie et la republication de mes articles dans leur intégralité comme les voleurs qui ont piraté mes livres.

Dans les deux cas, c'est gênant mais cause peu de dégâts réels sur le long terme.

Mais si vous démarrez un nouveau blog, ne succombez pas à la tentation de copier et coller le travail d'autres blogueurs.

Cela peut sembler une bonne idée d'obtenir quelques messages rapides sur votre site.

Mais en réalité, vous handicaperez et diminuerez très rapidement la valeur SEO de votre nouveau site, et il se peut qu'il ne s'en remette jamais.

Chaque blog que vous lisez a commencé avec zéro article, même les plus gros.

Je me souviens quand j'ai commencé ce blog avec rien d'autre qu'un thème et une page à propos. Mais ensuite je me suis mis au travail.

La seule façon de créer un nouveau blog est d'écrire des articles fantastiques et d'apprendre à tirer parti du référencement.

Bien sûr, cela prend beaucoup plus de temps, mais c'est le seul moyen éprouvé de réussir dans les blogs.

Résumé du grattage et de la copie de contenu

Tout sur Internet peut être copié en quelques secondes, et il n'y a aucun moyen de protéger votre contenu, même les ebooks.

Tout ce que vous pouvez faire, c'est accepter que cela se produise et passer à autre chose.

Écrire et publier régulièrement des articles de qualité et de grande valeur gagnera toujours et se classera beaucoup plus haut que les imitateurs.

Cependant, d'une manière étrange, faire copier votre contenu est un peu un compliment détourné.

Cela doit signifier que les grattoirs pensent que c'est un excellent contenu, donc ça vaut la peine de le copier.

Et comme j'ai appris, je peux alors profiter de leur inexpérience et de leur manque de compréhension du fonctionnement du référencement.

Un dernier point est que la plupart de ces sites de copie échouent et disparaissent assez rapidement une fois qu'ils se rendent compte de la futilité.

Mais il y a toujours plein de nouveaux sites pour les remplacer, c'est donc une histoire sans fin.

Lecture connexe: L'écriture d'intelligence artificielle manque de contact humain