Nouvel outil: Vérifier si votre contenu a été plagié

Je viens de terminer un nouvel outil qui vous permet de vérifier si votre contenu a été dupliqué ou non. Vous pouvez soit entrer directement un texte brut ou bien un lien vers une page de votre site. L’outil va directement récupérer le texte de votre page et le couper en morceaux afin de les comparer aux résultats de google à travers l’API Search de Google.

L’outil va grouper tous les résultats trouvés par adresse et calculer un pourcentage de duplication suivant les mots mis en gras ou non par google. Voir l’outil de vérification de plagiat.

N’hésitez pas à nous aider à améliorer l’outil si vous rencontrez des erreurs ou des améliorations possibles à n’importe quel niveau :)

Bonne chasse aux voleurs de contenus !

56 thoughts on “Nouvel outil: Vérifier si votre contenu a été plagié

  1. Super outil.
    Il prend cependant en considération les pages internes du sites (que le retrouve sur la home), pas vraiment utile, si ?
    Sinon, beau travail! Outil, une nouvelle fois de plus très addictif ;-)

  2. YoyoS says:

    Salut, normalement ca ne prend, filtre et fait des recherches google que sur des morceaux de contenu de la page indiquée :) Ca ne va pas sur une autre page !

  3. Un outil pour webmaster qui a le mérite d’être utile. Je cherchais partout pour gérer mes annuaires. Merci pour le coup de pouce.

  4. Bonsoir
    Je l’utilise pour vérification de duplication de contenu lors de la soumission de sites et d’article sur mon annuaire.
    Aujourd’hui je ne peux plus me passe de cet outil :-)

  5. Idée pour la suite, tu pourrais proposer d’exclure un domaine des résultats lorsqu’on fait une recherche à partir d’une URL

    très bon outil cela dit :)

  6. fabrice says:

    bonjour,
    je viens de testé votre programme. Il me parait pas mal mais le soucis est que si je rentre par exemple l’adresse de mon site j’ai effectivement du duplicat contant…
    exemple pour une page d’accueil j’ai un 38 % de duplicate !!! mais le lien qui est donné en haut du texte que vous afficher c’est mon propre site alors je comprend pas. Mon site est son propre duplicate content ? ou alors un autre site utilise le meme texte que moi et dans se cas je ne sais pas quel site.

  7. YoyoS says:

    Les résultats ne sont pas fiables à 100% puisqu’ils résultent de traitements sur différents morceaux de textes provenant de votre site. Les résultats renvoyés par google sur les différentes requêtes exécutées à partir de ces fragments de texte peuvent renvoyer des réponses incertaines. expliquer les résultats de l’outil viendrait à expliquer l’algorithme de recherche de google. Hors personne ne le connait :p.

    Si vous voyez votre site en duplicate content, c’est normal. Cela veut dire que votre site est indexé par google et qu’il reconnait les textes provenant de votre site, ce qui est assez rassurant. Ne faites limite pas attention aux pourcentages, ce ne sont que des indices expliqués précédemment.

    Regarde plutôt les résultats de l’outil comme une manière de trouver des ressemblances frappantes entre votre site/un texte entier et les résultats provenant de google.

  8. JJ says:

    Outil très utile, qui m’a permis de trouver quelques personnes qui font du copier-coller sans citer leurs sources, alors que le site est sous « Creative Commons License »…Merci

  9. Merci pour cet outil,

    Je conseille plutôt de copier coller une partie du texte plutôt qu’une URL. Autre astuce intéressante : cachez dans vos textes une coquille volontaire.

    Les copieurs colleurs se feront vite démasquer !

  10. Un outil très utile qui me sert sur tous mes annuaires.
    Merci pour ce magnifique boulot !

    Une petite question à laquelle je n’ai pas trouvé de réponse (surtout que je vois dans les com des pseudos de « cadors ») :
    à partir de quel pourcentage est-il raisonnable de considérer le texte comme dupliqué ?

    A+
    Pat.

  11. map says:

    L’idée est bonne, mais l’outil reprend des mots, du texte qui n’a pas de rapport direct avec le contenu principal du site. (Ex: si j’ai une box Facebook sur mon site, l’outil me ressort des sites qui l’ont aussi + des mots insignifiants comme « des », « en » etc.)

    Donc pour moi, je n’en voit pas encore franchement l’intérêt.
    Je veux ma remarque positive, puisque je n’aurai pas été à même de le créer :-)

    Bonne continuation cela dit

  12. YoyoS says:

    Je suis d’accord sur le fait que l’outil n’est pas encore parfait au niveau du filtre de certains textes qui ne servent à rien. Par contre les mots comme « des » etc sont importants dans la forme quand on veut repérer du plagiat, tous les mots ainsi que leur ordre ont une importance.

    Ensuite, si vous exécutez une recherche de plagiat pour une page et qu’il ressort d’autre pages avec le même code facebook, vous pouvez vous dire 2 choses.
    – Il n’y a rien eu d’intéressant à trouver: Bonne nouvelle, on ne plagie pas votre page
    – Le code facebook fait du duplicate content ?

    Pour info les informations facebook trouvée par le moteur étaient dans un code javascript entouré des balises < script > ou non ? Le script est sensé ignorer les codes javascript dans la page normalement, c’est pour ça que je demande ça.

    Merci de vos retours d’expérience en tout cas ! :)

  13. outil que j’utilise depuis quelques temps maintenant

    Un grand merci à positeo de la part de mes annuaires

  14. J’utilise cet outil au quotidien pour vérifier le DC, c’est un outil que je recommande aux professionnels du SEO !

  15. Un très bon outil que j’utilise pour vérifier la duplication de contenu avant que je valide les sites dans mon annuaire.

  16. L’idée est très intéressante, mais malheureusement pas du tout au point.
    Il me sort de nombreux sites qui n’ont rien à voir avec mon activité et surtout avec des textes qui n’ont aucun rapport.
    Ca reste à paufiner, mais c’est tout de même pas mal ;)

  17. YoyoS says:

    Je suis d’accord mais avez-vous noté les pourcentages de fiabilité du résultat ? Il ne devait pas être folichon s’il s’agissait de résultats incohérents ;)

  18. J’ai testé avec le premier paragraphe de bloc texte sur la home d’un site d’un client, les premiers résultats (incluant lesite) sont intéréssants la suite l’est beaucoup moins. En tout cas l’idée est bonne, et cela est pourra être une alternative à Copyscape.

  19. Merci pour cet outil!

    On peut faire une recherche sur une expression en ajoutant des  » entourant les mots à rechercher.
    Ca permet d’être plus précis.
    Peut-être à ajouter dans l’aide !?

  20. C’est un outil intéressant et très pratique (surtout gratuit) pour vérifier les plagiaires quand on publie du contenu unique volé par des webmasters peu scrupuleux.

  21. Pour info, l’API Search de Google est aussi disponible via le le site plagium.. Il réalise aussi des vérifications sur yahoo et bing..
    C’est vrai aussi que les résultats sont meilleurs qu’avec copyscape (il me semble).

  22. Le test me donne beaucoup de copier de mes propres pages avec en permanence l’entête de mon site
    Sinon un concurent demasqué avec près de 42% de copie .
    Va falloir y remedier !!!

  23. Gladmore says:

    RRaaaaaa! Si les profs savent ça, on va tout de suite se faire cramer en cas d’ « étude sérieuse » (sur les réponses d’un contrôle)

  24. Merci pour ton outil, ou devrais dire, tes outils, que j’utilise toutes les semaines pour vérifier la position de certains de mes sites. C’est cool de les mettre gratuitement à disposition. Pour te remercier, je clique de temps à autre sur les pubs ^^ :)

  25. Super outil, j’ai juste une petite question, quelle est la limite de mot à copier dans la zone de texte ?

  26. Bonjour et félicitation pour ce superbe outil ! il est tres pratique pour la validation des fiches clients de notre site http://www.batilogis.fr . cependant je cherche une solution pour valider dynamiquement lors de leur soumission les dualcontent comme le fait Webrank info sur sont annuaire. Proposez vous une solution intégrable sur notre server , ou connaissez vous une solution a ce problème ?

  27. C’est effectivement un très bon outil, mise à part les différents blocages lors de 2 ou 3 recherches consécutives, c’est dommage qu’il n’existe pas un logiciel complet qui ne beug pas!

  28. YoyoS says:

    Et oui malheureusement un logiciel sur votre PC utilisera votre IP et donc vous serez filtré très rapidement par Google.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *