Supprimer les lignes dupliquées
Supprimer les lignes dupliquées tout en conservant la première occurrence de chaque valeur. Utile pour le nettoyage des listes de courriels, la sortie de journal, les exportations de mots clés, les extraits de CSV, les colonnes de tableur copiées et les entrées rapides avant de les coller ailleurs. ToolMill fonctionne entièrement dans votre navigateur, donc le texte sensible n'a jamais à quitter votre appareil.
Texte
Essaie.
Exemples
apple banana apple orange banana
apple banana orange
Alpha alpha ALPHA Beta beta
Alpha Beta
Cas d'utilisation courante pour supprimer les lignes dupliquées
Deduping lines est utile pour nettoyer les listes de courriels, les noms d'utilisateur exportés, les jeux de mots clés, les colonnes de tableur copiées, les fragments de journal, et le texte brut collé de chat ou de documents. Il vous donne un point de départ plus rapide avant de trier, comparer des versions ou importer des données dans un autre système.
Qu'est-ce qui compte comme une ligne dupliquée ?
Cet outil compare les lignes entières exactement comme elles apparaissent après la division sur les ruptures de ligne. Si deux lignes diffèrent par la capitalisation, l'espacement, la ponctuation ou des onglets cachés, elles peuvent toujours compter comme valeurs différentes. Ce qui importe quand les données collées ressemblent à l'œil mais n'est pas vraiment identique.
Comment l'ordre en ligne est-il conservé?
L'attente habituelle sur un outil de dupe est de garder la première occurrence de chaque ligne unique et jeter les répétitions ultérieures. Cela signifie que la sortie peut rester lisible et familière au lieu d'être utilisée automatiquement. Si vous voulez aussi l'ordre alphabétique, il est généralement préférable de dédouber d'abord et de trier ensuite comme une étape séparée.
Avant et après des exemples pour les entrées réelles
Un exemple réaliste est une liste collée de noms d'hôte, de balises ou d'adresses e-mail où la même valeur apparaît plusieurs fois dans différentes parties de la liste. Un autre est une colonne de tableur copiée avec des produits ou des ID répétés. Deduping ces lignes rend l'examen, la recherche et les contrôles d'importation beaucoup plus faciles.
Préparation du texte avant la déduplication
Si votre source contient des enveloppes ou des espaces de fuite incohérents, vous voudrez peut-être d'abord les normaliser. L'élimination d'espaces blancs supplémentaires ou de cas de conversion avant le dédoublement peut réduire les quasi-duplications accidentelles qui survivent seulement parce qu'elles sont orthographiées légèrement différemment.
Cas de limites et de bords
Cette page ne promet pas une correspondance floue, une réparation typographique ou une fusion sémantique. Les valeurs qui semblent équivalentes à celles d'une personne peuvent rester distinctes si elles contiennent un espacement, une ponctuation ou un cas de lettre différents. C'est généralement le bon comportement quand vous avez besoin de nettoyage prévisible, basé sur la ligne.
Confidentialité et traitement local
Avant de vous reposer sur Deduped Text
Avant d'utiliser la sortie dans un autre outil ou de la télécharger ailleurs, décidez si l'espace blanc, la capitalisation et l'ordre original ont un sens dans vos données. S'ils le font, un laissez-passer rapide de dupe est utile pour l'examen, mais ne devrait pas remplacer une vérification manuelle finale.
Ce que la sortie de Dedup ne garantit pas
L'élimination de lignes répétées ne valide pas l'orthographe, fusionne les appariements ou décide quelle variante est la bonne à conserver. C'est une étape de nettoyage, pas un examen sémantique. Si des lignes semblables diffèrent par un caractère ou un espace blanc supplémentaire, le résultat peut encore nécessiter une inspection manuelle.
Comment interpréter ce qui compte comme un duplicata
La duplication dépend des règles de comparaison exactes utilisées sur le texte d'entrée. Les différences dans les douilles, les espaces de tête ou de queue, les onglets cachés ou le style de fin de ligne peuvent changer si deux lignes sont traitées comme les mêmes. Vérifiez attentivement le texte original si la sortie ne correspond pas à votre attente.
La déduplication se produit dans votre navigateur de sorte que les listes collées restent sur votre appareil pendant le nettoyage de routine. C'est utile lorsque le texte contient des exportations de clients, des identifiants internes ou des données de travail provisoires que vous ne souhaitez pas envoyer à un service tiers.
Outils connexes
HTML vers le convertisseur de texte simple
Convertir HTML en texte simple lors du nettoyage des modèles d'email, des extraits grattés, des exportations de CMS, du support du contenu ou des pages Web copiées. Il vous aide à supprimer le balisage rapidement tout en préservant le texte lisible pour les notes, les documents, les invites ou le traitement en aval. ToolMill effectue la conversion dans le navigateur, ce qui est utile lorsque le HTML source contient du contenu privé ou sensible au client.
Texte
Marquage vers le convertisseur HTML
Convertir Markdown en HTML lors de la préparation des billets de blog, de la documentation, du contenu README, des entrées CMS, des courriels ou des articles de base de connaissances. Il est utile de vérifier comment les rubriques, l'accent, les listes et le contenu de type code seront rendus avant la publication. ToolMill fonctionne localement dans votre navigateur, ce qui en fait une alternative rapide et conviviale aux convertisseurs en ligne qui téléchargent votre projet de texte.
Texte
Supprimer les lignes vides du texte
Supprimer les lignes blanches du texte collé instantanément tout en conservant les lignes restantes dans le même ordre. Ceci est utile pour nettoyer les journaux, les listes, les colonnes de tableur copiées, les extraits CSV ou TSV, les blocs de code, les ébauches de courriel et le texte tiré des PDF ou des exportations de chat. ToolMill fonctionne entièrement dans votre navigateur, donc le texte privé reste sur votre appareil.
Texte
Slugify Text pour les URLs SEO-Friendly
Transformez les titres, les titres, les noms de produits et les idées d'articles en limaces d'URL propres pour les blogs, les entrées CMS, les pages d'atterrissage et les itinéraires de développeurs. Il est utile lorsque vous voulez des URLs lisibles, SEO-friendly sans ponctuation ou problèmes d'espacement. ToolMill vous donne un résultat rapide dans le navigateur sans annonces, murs de compte, ou l'envoi de titres de page brouillon hors site.
Texte
