डुप्लिकेट लाइन निकालें
प्रत्येक मूल्य की पहली घटना रखते हुए डुप्लिकेट लाइनों को हटा दें। ईमेल सूचियों, लॉग आउटपुट, कीवर्ड निर्यात, CSV स्निपेट्स, कॉपी किए गए स्प्रेडशीट कॉलम की सफाई के लिए उपयोगी है, और इससे पहले कि आप उन्हें कहीं और पेस्ट करें। टूलमिल पूरी तरह से आपके ब्राउज़र में चलता है, इसलिए संवेदनशील टेक्स्ट को कभी भी अपने डिवाइस को छोड़ने की जरूरत नहीं है।
पाठ
इसे आज़माएं
उदाहरण
apple banana apple orange banana
apple banana orange
Alpha alpha ALPHA Beta beta
Alpha Beta
डुप्लिकेट लाइन्स को हटाने के लिए आम उपयोग के मामले
Deduping लाइनों जब ईमेल सूची, निर्यात उपयोगकर्ता नाम, कीवर्ड सेट, कॉपी स्प्रेडशीट कॉलम, लॉग टुकड़े, और मोटे पाठ चैट या दस्तावेजों से चिपकाया सफाई उपयोगी है। यह आपको किसी अन्य सिस्टम में सॉर्ट करने, संस्करणों की तुलना करने या डेटा आयात करने से पहले एक त्वरित प्रारंभिक बिंदु देता है।
एक डुप्लिकेट लाइन के रूप में क्या मायने रखता है?
यह उपकरण पूरी लाइनों की तुलना करता है क्योंकि वे लाइन ब्रेक पर विभाजन के बाद दिखाई देते हैं। यदि दो लाइनें पूंजीकरण, रिक्ति, punctuation, या छिपे हुए टैब से भिन्न होती हैं, तो वे अभी भी अलग-अलग मानों की गिनती कर सकते हैं। जब पेस्ट डेटा आंख के समान दिखता है तो यह वास्तव में समान नहीं है।
कैसे लाइन ऑर्डर संरक्षित है
एक उपकरण पर सामान्य उम्मीद है कि प्रत्येक अद्वितीय लाइन की पहली घटना को बनाए रखना और बाद में दोहराना। इसका मतलब है कि आउटपुट स्वचालित रूप से सहारा लेने के बजाय पठनीय और परिचित रह सकता है। यदि आप वर्णमाला क्रम भी चाहते हैं, तो यह आमतौर पर एक अलग कदम के रूप में पहले डिडुप और बाद में क्रमबद्ध करने के लिए बेहतर होता है।
इससे पहले और बाद में रियल इनपुट के लिए उदाहरण
एक यथार्थवादी उदाहरण मेजबान नाम, टैग या ईमेल पते की एक पेस्ट सूची है जहां सूची के विभिन्न हिस्सों में समान मूल्य कई बार दिखाई देता है। एक अन्य दोहराया उत्पादों या आईडी के साथ एक कॉपी स्प्रेडशीट कॉलम है। उन पंक्तियों को देखते हुए समीक्षा, खोज और आयात की जांच बहुत आसान हो जाती है।
Deduplication से पहले पाठ तैयार करना
यदि आपके स्रोत में असंगत आवरण या ट्रेलिंग स्पेस हैं, तो आप इसे पहले सामान्य बनाना चाहते हैं। अतिरिक्त व्हाइटस्पेस को हटाने या डिडपिंग से पहले मामले को परिवर्तित करने से आकस्मिक निकट-डुप्लिकेट को कम किया जा सकता है जो केवल तभी जीवित रह सकता है क्योंकि उन्हें थोड़ा अलग तरीके से वर्तनी होती है।
सीमाएँ और एज मामले
यह पृष्ठ फजी मिलान, टाइपो मरम्मत, या सेमनेटिक विलय का वादा नहीं करता है। मान जो किसी व्यक्ति के बराबर दिखते हैं, अलग रह सकते हैं यदि वे अलग-अलग रिक्ति, punctuation, या पत्र मामले होते हैं। यह आमतौर पर सही व्यवहार है जब आपको पूर्वानुमान योग्य, लाइन-आधारित सफाई की आवश्यकता होती है।
गोपनीयता और स्थानीय प्रसंस्करण
इससे पहले कि आप Rely on Deduped Text
किसी अन्य उपकरण में आउटपुट का उपयोग करने से पहले या इसे अन्य जगहों पर अपलोड करने से पहले निर्णय लें कि क्या व्हाइटस्पेस, पूंजीकरण और मूल ऑर्डर आपके डेटा में अर्थ ले रहा है। यदि वे करते हैं, तो समीक्षा के लिए एक त्वरित डीड्यूप पास सहायक है लेकिन अंतिम मैनुअल चेक को प्रतिस्थापित नहीं करना चाहिए।
क्या Deduped आउटपुट की गारंटी नहीं है
बार-बार लाइनों को हटाने से वर्तनी को मान्य नहीं किया जाता है, निकट-मार्चों को मर्ज किया जाता है, या यह तय किया जाता है कि किस संस्करण को रखने का अधिकार है। यह एक साफ-सफाई कदम है, एक अर्थपूर्ण समीक्षा नहीं है। यदि समान रेखाएं एक चरित्र या अतिरिक्त व्हाइटस्पेस से भिन्न होती हैं, तो परिणाम को अभी भी मैनुअल निरीक्षण की आवश्यकता हो सकती है।
कैसे व्याख्या करने के लिए क्या एक Duplicate के रूप में गिनती
Deduplication इनपुट टेक्स्ट पर उपयोग किए जाने वाले सटीक तुलना नियमों पर निर्भर करता है। आवरण, अग्रणी या ट्रेलिंग स्पेस, छिपे हुए टैब या लाइन-एंड शैली में अंतर बदल सकता है कि क्या दो लाइनों को उसी के रूप में इलाज किया जाता है। यदि उत्पादन आपकी उम्मीद से मेल नहीं खाता है तो मूल पाठ को ध्यान से समीक्षा करें।
डिडुप्लिकेशन आपके ब्राउज़र में होता है इसलिए पेस्ट की सूची नियमित सफाई के दौरान आपके डिवाइस पर रहती है। यह तब उपयोगी होता है जब पाठ में ग्राहक निर्यात, आंतरिक पहचानकर्ता या मसौदा कार्य डेटा होता है जिसे आप तृतीय-पक्ष सेवा में नहीं भेजना चाहते हैं।
संबंधित उपकरण
HTML से सादा पाठ कनवर्टर
ईमेल टेम्पलेट्स, स्क्रैप स्निपेट्स, सीएमएस निर्यात, समर्थन सामग्री, या कॉपी किए गए वेब पृष्ठों की सफाई करते समय HTML को सादे टेक्स्ट में कनवर्ट करें। यह आपको नोट्स, दस्तावेज़, प्रॉम्प्ट, या डाउनस्ट्रीम प्रोसेसिंग के लिए पठनीय पाठ को संरक्षित करते समय मार्कअप को जल्दी से हटाने में मदद करता है। टूलमिल रूपांतरण इन-ब्रोशर करता है, जो तब उपयोगी होता है जब स्रोत HTML में निजी या ग्राहक-संवेदनशील सामग्री होती है।
पाठ
HTML कनवर्टर करने के लिए मार्कडाउन
ब्लॉग पोस्ट, प्रलेखन, README सामग्री, CMS प्रविष्टियों, ईमेल या ज्ञान-आधारित लेख तैयार करते समय मार्कडाउन को HTML में कनवर्ट करें। यह जांचने में सहायक है कि प्रकाश व्यवस्था से पहले शीर्षकों, जोरों, सूचियों और कोड-शैली की सामग्री कैसे प्रस्तुत की जाएगी। टूलमिल आपके ब्राउज़र में स्थानीय रूप से चलाता है, जिससे यह आपके ड्राफ्ट टेक्स्ट को अपलोड करने वाले ऑनलाइन कन्वर्टर्स के लिए एक त्वरित गोपनीयता-अनुकूल विकल्प बनाता है।
पाठ
पाठ से खाली लाइन निकालें
एक ही क्रम में शेष लाइनों को रखते हुए तुरंत चिपकाए गए पाठ से रिक्त रेखाओं को हटा दें। यह लॉग्स, सूचियों, कॉपी स्प्रेडशीट कॉलम, CSV या TSV स्निपेट्स, कोड ब्लॉक, ईमेल ड्राफ्ट और पीडीएफ या चैट एक्सपोर्ट से खींचे गए टेक्स्ट की सफाई के लिए उपयोगी है। टूलमिल पूरी तरह से आपके ब्राउज़र में चलता है, इसलिए निजी टेक्स्ट आपके डिवाइस पर रहता है।
पाठ
SEO-Friendly URLs
शीर्षकों, शीर्षकों, उत्पाद नाम, और लेख विचारों को ब्लॉग, सीएमएस प्रविष्टियों, लैंडिंग पृष्ठों और डेवलपर मार्गों के लिए साफ यूआरएल स्लग में बदल दें। यह उपयोगी है जब आप punctuation या रिक्ति मुद्दों के बिना पठनीय, एसईओ-अनुकूल यूआरएल चाहते हैं। टूलमिल आपको विज्ञापन, खाता दीवारों, या ऑफ साइट पर ड्राफ्ट पेज शीर्षक भेजने के बिना एक तेज़ इन-ब्रोशर परिणाम देता है।
पाठ
