ToolMill.io

重複行を削除

各値の最初の発生を保ちながら、重複行を削除します。 電子メールリストのクリーニング、ログ出力、キーワードエクスポート、CSVスニペット、コピーされたスプレッドシート列、および他の場所で貼り付ける前にプロンプト入力に便利です。 ToolMillはブラウザで完全に実行されますので、敏感なテキストはデバイスを離れる必要はありません。

テキスト

お問い合わせ

事例紹介

繰り返し行を削除
パスワード
apple
banana
apple
orange
banana
ソリューション
apple
banana
orange
ケースとスペースを無視する
パスワード
 Alpha
alpha
ALPHA  
Beta
 beta
ソリューション
Alpha
Beta

重複したラインを取除くための一般的なユースケース

電子メールリスト、エクスポートされたユーザー名、キーワードセット、コピーされたスプレッドシートの列、ログのフラグメント、チャットや文書から貼り付けられたラフなテキストを清掃する際には、行をダンプすることは便利です。 バージョンをソート、比較、または別のシステムにデータをインポートする前に、より迅速に開始点を提供します。

重複する行としてカウントする?

このツールは、行の分割後に表示されるように、全行を正確に比較します。 2行が増大、間隔、句読点、または隠しタブによって異なる場合、彼らはまだ異なる値としてカウントすることができます。 過去のデータが目と似ているが、真に同一ではないときの問題です。

ライン注文が予約される方法

デデュープツールの通常の期待は、各ユニークなラインの最初の発生を抑え、後で繰り返すことです。 つまり、出力は、自動的に頼まれているのではなく、読みやすく馴染みのあるままにすることができます。 アルファベット順にしたい場合、通常は最初を解読して別のステップとして並べ替える方が良いです。

実際の入力の前後例

実際の例は、リストの異なる部分で何度も同じ値が表示されるホスト名、タグ、またはメールアドレスの貼り付けされたリストです。 もう1つは、コピーされたスプレッドシートの列で、繰り返し製品やIDが使用されます。 これらの行のデューピングは、レビュー、検索、およびインポートチェックをはるかに簡単にします。

複製前のテキストの準備

ソースに一貫性のないケーシングやスペースの追跡が含まれる場合、最初に正規化したい場合があります。 余計な空白を取除くか、またはdedupingの前に箱を転換することはわずかに異なって綴られるのでだけ生き残る偶然の近重複を減らすことができます。

限界とエッジケース

このページは、ファジーマッチング、チポ修理、またはセマンティックマージを約束しません。 異なる間隔、句読点、またはレターケースが含まれている場合は、人と同等に見える値が分離されることがあります。 これは、通常、予測可能なラインベースのクリーンアップが必要なときに正しい動作です。

プライバシーとローカル処理

拒否されたテキストに頼る前に

別のツールで出力を使用するか、他の場所でアップロードする前に、空白、増大、元の注文がデータに意味を運ぶかどうかを決定します。 彼らが行う場合, クイックデュープパスは、レビューのために有用であるが、最終的なマニュアルチェックを交換しないでください.

重複した出力は保証しません

繰り返し行を削除すると、スペルを検証したり、近くのマッチをマージしたり、どのバリアントが保持するべきかを決定しません。 清潔なステップで、セマンティックなレビューではありません。 類似線が1文字または空白文字で異なる場合、手動検査が必要な場合があります。

重複する数を解釈する方法

重複排除は、入力テキストで使用される正確な比較ルールに依存します。 ケーシング、リーディング、またはスペースの追跡、隠しタブ、または2行が同じように扱われるかどうかを変更することができます。 出力が期待に合わないと、元のテキストを慎重に見直してください。

重複排除はあなたのブラウザで起こるので、貼り付けられたリストは、定期的なクリーンアップ中にデバイスに滞在します。 テキストに顧客のエクスポート、内部識別子、またはサードパーティサービスに送信したくない作業データを草案が含まれる場合に便利です。

関連ツール