Google Panda : éviter le duplicate content

1) Les exports simples
2) Les exports comparatifs
3) Les petits « + »

 

1) Les exports simples

Vous avez rédigé un article en l’organisant en paragraphes et sections de choix.
Vous avez choisi les trois dictionnaires.
Vous avez procédé au choix des expressions et des correspondances.
Vous voulez maintenant avoir différentes versions de votre article.

Vous pouvez sélectionner soit un texte au hasard, soit dix textes, soit vingt textes ou cinquante textes.

Human Easy Spinner va alors procéder à la constitution de ces textes.

Pour cela, il va tenir compte de l’organisation de vos articles, des dictionnaires et de leurs priorités, des expressions et des correspondances en commençant par les expressions les plus longues et des réglages de qualité.

Human Easy Spinner vous proposera alors un ensemble de textes différents entre eux, dont le nombre peut être inférieur ou égal au nombre de textes voulus.

En effet, si les réglages de qualité sont forts et que l’article a peu de possibilités de combinaisons, le nombre de textes différenciés est alors réduit mais vous resterez dans les petits papiers de Google Panda.

 

2) Les exports comparatifs

Les exports comparatifs sont basés sur le principe des exports simples. Vos articles précédents peuvent être détectés en duplicate content par Google Panda avec vos nouveaux textes. Il est donc important d’en tenir compte pour les nouveaux textes.

Vous pouvez, par contre, sélectionner un dossier contenant des textes au format texte (.txt) encodé en utf-8.

Human Easy Spinner tiendra compte de ces textes pour la génération des textes de sortie afin que ces derniers soient non seulement différents entre eux, mais aussi différents des textes du dossier choisi.

 

3) Les petits « + »

Le réglage du nombre d’essais par passe pour obtenir le nombre de textes de sortie le plus proche de celui voulu.

Le réglage de qualité pour obtenir des textes de sortie les plus différents possible.
Plus la qualité est élevée, plus il est difficile d’obtenir le nombre de textes de sortie désiré. En effet, plus la qualité est élevée, plus les textes doivent être différents les uns des autres.

L’algorithme développé ne se contente pas de remplacer les expressions par les correspondances, il compare les textes entre eux pour ne retenir que les textes qui ne se ressemblent pas en fonction des critères précédents.

Human Easy Spinner n’utilise pas la distance de Levenshtein, ni la distance de Hamming ou l’algorithme de jaccard, méthodes peu probantes pour l’usage de spin…

Ce qu’utilise Google pour détecter le contenu dupliqué n’est pas réellement connu, mais on peut imaginer qu’un algorithme basé sur des empreintes soit une bonne piste 😉