Recherche de doublons entre deux tables dans Excel

Les listes noires sont un élément essentiel du marketing. Ce n’est pas difficile de les maintenir. À l’aide des DedupeWizard, les listes noires peuvent être traitées sans aucun problème.

Les listes noires sont un bon moyen pour respecter le vœu de certains destinataires de ne pas recevoir de publicité et même d’économiser de l’argent en même temps. De plus, vous pouvez aussi utiliser vos propres listes noires pour exclure vos compétiteurs, vos employés ou même vos clients existants, dans le cas où vous voudriez prospecter de nouveaux clients, de la liste de destinataires pour certaines campagnes de marketing.

Pour traiter les listes noires, vous avez besoin d’un logiciel qui est capable de faire une recherche floue de doublons entre deux tables tel que DedupeWizard. À l'aide de la recherche de doublons entre deux tables, vous pouvez aussi synchroniser des listes d'adresses, par exemple pour ne pas prospecter des adresses qui ont déjà été sollicités lors d’une campagne de marketing antérieure ou utiliser les résultats de la comparaison pour transférer des informations, par exemple des numéros de téléphone ou de client, d’une liste d'adresses vers une autre. Il y a de maintes possibilités de se servir de la recherche de doublons entre deux tables. Et avec DedupeWizard, la recherche de doublons entre deux tables est faite en un tour de main.

Pour ce faire, procédez avec les étapes suivantes:

  1. Si vous ne l’avez pas encore fait, téléchargez DedupeWizard gratuitement ici. Installez le logiciel et demandez une activation d’essai. Ainsi, vous pouvez travailler avec le logiciel pendant une semaine sans aucune restriction.
  2. La fonction requise est 'Dédoublonnage entre deux fichiers'.

    Dédoublonnage entre deux fichiers

  3. Suite à l’appel de cette fonction, il faut commencer par choisir le critère à utiliser pour la recherche de doublons. La recherche de doublons peut se faire basée sur l’adresse postale, le numéro de téléphone ou l'adresse e-mail. Choisissez l’adresse postale.

    Critère de recherche

  4. Cliquez sur 'Continuer', et ensuite ouvrez les deux fichiers Excel à traiter.

    Sélectionner le fichier

    Si vous voulez utiliser une feuille de calcul autre que la première dans le fichier Excel correspondant, vous pourrez le sélectionner plus tard, dans le dialogue où se fait le classement des champs.
  5. Suite à l’ouverture des deux fichiers Excel, le logiciel vous guide automatiquement vers la prochaine étape, le classement des champs. Ce faisant, il faut indiquer au logiciel dans quelles colonnes il peut trouver quelles informations dans la table, donc par exemple, la colonne dans laquelle est écrit le nom de la rue ou de la ville. Pour cela, il faut choisir, dans la liste de sélection avec les titres de colonne qui apparaissent dans la table, le champ de données qui correspond le mieux à chacune des désignations qui se trouvent juste à gauche.

    Classement de champs

    Le logiciel effectue automatiquement un classement des champs par défaut, basé sur les titres de colonnes. Puisqu’on veut rechercher des doublons en utilisant l’adresse postale, on doit aussi indiquer, pour chacune des parties constituantes de l’adresse postale, la colonne dans la table à traiter qui contient ces informations. Vous pouvez vérifier les résultats du classement des champs à l'aide de la 'Vérification du classement des champs', qui se trouve à droite sur votre écran.
  6. Pour indiquer le classement des champ de la deuxième table, cliquez simplement sur 'Continuer'. Le dialogue qui apparaît est pareil au dialogue précédent, et on s’en sert de la même façon. Faites le classement des champs de la même manière que pour la première table.
  7. En cliquant sur 'Continuer', on arrive au dialogue pour la configuration de la fonction elle-même. Ici, le plus important c’est d’indiquer la valeur seuil pour la déviation maximale permise entre deux adresses.

    Degré de concordance

    De plus, on peut aussi exclure de la comparaison certaines parties constituantes de l’adresse postale. Ce faisant, il faut bien sûr avoir indiqué, lors du classement des champs effectué dans l’étape précédente, une colonne dans la table à traiter pour chaque partie constituante de l’adresse postale qui doit être inclue dans la comparaison. Renseignement: Les deux tables utilisées pour la recherche de doublons peuvent avoir des structures complètement différentes. Par exemple, le numéro de maison pourrait être inscrit dans la même colonne que la rue dans une des tables, et dans l’autre, cette information est saisie dans deux colonnes séparées. Il est seulement important que toutes les trois colonnes soient aussi indiquées lors du classement des champs dans ces deux tables.
  8. En cliquant sur 'Continuer', vous démarrez la recherche de doublons. Ça ne prend que quelques moments et vous obtenez un sommaire des résultats.

    Résultat de la déduplication

    Si le logiciel a trouvé des doublons dans la table traitée, cliquez sur 'OK' pour parvenir aux retouches manuelles. Sinon, la valeur seuil pour le degré de concordance doit être réduite et vous devez redémarrer la comparaison.
  9. Dans les 'retouches manuelles', les résultats de la comparaison sont présentées sous forme tabellaire. Les enregistrements qui doivent être supprimés sont marqués ici avec des croix rouges, qui peuvent aussi être enlevées au besoin ou déplacées vers un autre enregistrement du groupe de doublons.

    Deletion flag fr

  10. En cliquant sur 'Continuer' encore une fois, on arrive au dialogue avec les fonctions pour traiter les résultats. Par exemple, on pourrait supprimer les enregistrements qui sont marqués d’une croix rouge directement dans le fichier source. Pour cela, il suffit de cliquer sur le bouton 'Supprimer dans le fichier source'.

    Supprimer dans le fichier source

La recherche de doublons entre deux tables peut aussi se faire avec DataQualityTools. Ce logiciel offre beaucoup plus de possibilités que DedupeWizard, et non seulement pour la recherche de doublons.

Renseignement: Il y a une vidéo d’instruction pour DedupeWizard qui vous introduit à l’opération du logiciel par l’exemple d’une recherche de doublons dans une table.

Dans l'article 'Supprimer des doublons dans Excel', vous pouvez lire comment utiliser DedupeWizard pour la recherche de doublons dans une liste d'adresses.