HTML से सादा पाठ कनवर्टर
ईमेल टेम्पलेट्स, स्क्रैप स्निपेट्स, सीएमएस निर्यात, समर्थन सामग्री, या कॉपी किए गए वेब पृष्ठों की सफाई करते समय HTML को सादे टेक्स्ट में कनवर्ट करें। यह आपको नोट्स, दस्तावेज़, प्रॉम्प्ट, या डाउनस्ट्रीम प्रोसेसिंग के लिए पठनीय पाठ को संरक्षित करते समय मार्कअप को जल्दी से हटाने में मदद करता है। टूलमिल रूपांतरण इन-ब्रोशर करता है, जो तब उपयोगी होता है जब स्रोत HTML में निजी या ग्राहक-संवेदनशील सामग्री होती है।
पाठ
इसे आज़माएं
उदाहरण
<h1>Hello</h1><p>World</p>
Hello World
<div><strong>Bold</strong> and <em>italic</em></div>
Bold and italic
कैसे HTML से सादा पाठ रूपांतरण वर्क्स
यह उपकरण HTML को चिपका देता है, पठनीय पाठ सामग्री निकालता है, मार्कअप को हटा देता है और एक सरल सादे पाठ संस्करण लौटाता है। यह उपयोगी है जब आपको टैग, इनलाइन शैलियों, या नोटों, प्रॉम्प्ट्स या अन्य प्रणालियों में प्रस्तुति मार्कअप के बिना एक स्निपेट से शब्दों की आवश्यकता होती है।
क्या निकाला जाता है और क्या रहता है?
टैग, विशेषताओं और स्वरूपण निर्देश दूर छीन रहे हैं, जबकि पठनीय पाठ रहता है। लक्ष्य बिल्कुल लेआउट को बनाए रखने के लिए नहीं है। इसके बजाय, यह पाठ को ही रखता है और HTML संरचना को छोड़ देता है जो मुख्य रूप से ब्राउज़र या ईमेल क्लाइंट में प्रस्तुति को नियंत्रित करता है।
जब HTML से Text Converter में उपयोग किया जाता है
विशिष्ट उपयोग के मामलों में शामिल हैं सफाई कॉपी किए गए ईमेल टेम्पलेट्स, CMS सामग्री से शब्दों को निकालने, स्क्रैप किए गए स्निपेट्स से मार्कअप को हटाने, और सादे पाठ नोटों या खोज अनुक्रमण के लिए वेब सामग्री तैयार करना। यह देखने का एक त्वरित तरीका भी है कि अगर स्वरूपण परत पूरी तरह से हटा दिया जाता है तो क्या रहता है।
उदाहरण: लिंक, शीर्षक और पैराग्राफ
एक शीर्षक या लिंक्ड वाक्यांश आमतौर पर क्लिक करने योग्य विशेषताओं के साथ एक स्टाइल ब्लॉक के बजाय सादे पठनीय पाठ बन जाता है। यही कारण है कि परिणाम को टेक्स्ट-केवल गंतव्यों में पेस्ट करना आसान बनाता है, लेकिन इसका मतलब दृश्य पदानुक्रम और लिंक मेटाडाटा भी अब उसी रूप में जीवित नहीं है।
उदाहरण: सूची, लाइन ब्रेक और अतिरिक्त स्पेसिंग
सूची आइटम और लाइन ब्रेक एक हाथ से संपादित रूपांतरण की तुलना में अधिक flatten हो सकता है। यह हल्के सादे पाठ निष्कर्षण के लिए सामान्य है। यदि सटीक रिक्ति मामले हैं, तो आउटपुट को एक प्रारंभिक बिंदु के रूप में उपयोग करें और फिर उस गंतव्य के लिए मैन्युअल रूप से पाठ को सुव्यवस्थित करें जिसके बारे में आप परवाह करते हैं।
एचटीएमएल क्लीनअप में आम एज मामले
एचटीएमएल संस्थाएं, गैर-ब्रेकिंग स्पेस, नेस्टेड टैग, टिप्पणियां और विकृत पेस्ट मार्कअप सभी अंतिम सादे पाठ परिणाम को प्रभावित कर सकते हैं। जब स्रोत गन्दा होता है, तो सबसे सुरक्षित उम्मीद मूल दृश्य संरचना के सही मनोरंजन के बजाय पठनीय निष्कर्षण है।
सादा पाठ रूपांतरण की सीमा
यह एक स्वरूपण संरक्षण निर्यात उपकरण नहीं है। टेबल्स, सटीक लेआउट, सीएसएस अर्थ और कुछ दस्तावेज़ संरचना को कम या खो दिया जा सकता है। कई सफाई कार्यों के लिए जो स्वीकार्य है, लेकिन इससे पहले कि आप प्रकाशन या संग्रह के लिए आउटपुट पर भरोसा करते हैं, यह जानने योग्य है।
संवेदनशील एचटीएमएल सामग्री के लिए गोपनीयता नोट्स
इससे पहले कि आप Rely on एक्सट्रैक्टेड टेक्स्ट फॉर प्रकाशन या विश्लेषण
किसी अन्य सिस्टम में आउटपुट का पुन: उपयोग करने से पहले, जांचें कि क्या हेडिंग्स, लिंक्स, टेबल्स और छिपी हुई या दोहराई गई सामग्री को आपके वर्कफ़्लो की उम्मीदों के तरीके को संभाला गया था। एक त्वरित स्थानीय रूपांतरण सफाई और निरीक्षण के लिए उपयोगी है, लेकिन महत्वपूर्ण प्रकाशन या विश्लेषण कार्य अभी भी एक अंतिम मैनुअल समीक्षा से लाभ उठाते हैं।
क्या HTML-to-Text रूपांतरण मई Omit, Flatten, या रियररेंज
एचटीएमएल में संरचना होती है कि सादे पाठ वास्तव में संरक्षित नहीं हो सकता है। सूची, तालिकाओं, घोंसले तत्वों, स्टाइलिंग और कुछ अर्थात्मक भेदों को आउटपुट में समतल या सरलीकृत किया जा सकता है। परिणाम समीक्षा और पुन: उपयोग के लिए उपयोगी है, लेकिन इसे हर वर्कफ़्लो में मूल मार्कअप के लिए एक सही विकल्प के रूप में नहीं माना जाना चाहिए।
एचटीएमएल से निकाले गए पाठ को कैसे व्याख्या करें
निकाले गए पाठ स्रोत एचटीएमएल में प्रतिनिधित्व की गई सामग्री का एक पठनीय अनुमान है, इस बात का एक सही दर्पण नहीं है कि ब्राउज़र हर तत्व को दृष्टि से कैसे प्रस्तुत करेगा। लाइन ब्रेक, रिक्ति, छिपी हुई सामग्री, लिंक हैंडलिंग और संरचनात्मक संकेतों को रूपांतरण के दौरान सरलीकृत किया जा सकता है, इसलिए परिणाम को लेआउट-faithful आउटपुट के बजाय साफ पाठ के रूप में पढ़ा जाना चाहिए।
यदि आप ग्राहक ईमेल, आंतरिक टेम्पलेट्स की सफाई कर रहे हैं, या व्यवस्थापक पैनल HTML की प्रतिलिपि बना रहे हैं, तो ब्राउज़र के अंदर रूपांतरण को बनाए रखने के लिए अक्सर उस सामग्री को दूरस्थ सेवा में चिपकाने की तुलना में अधिक आरामदायक होता है। यह पृष्ठ उस त्वरित स्थानीय वर्कफ़्लो के लिए डिज़ाइन किया गया है।
संबंधित उपकरण
डुप्लिकेट लाइन निकालें
प्रत्येक मूल्य की पहली घटना रखते हुए डुप्लिकेट लाइनों को हटा दें। ईमेल सूचियों, लॉग आउटपुट, कीवर्ड निर्यात, CSV स्निपेट्स, कॉपी किए गए स्प्रेडशीट कॉलम की सफाई के लिए उपयोगी है, और इससे पहले कि आप उन्हें कहीं और पेस्ट करें। टूलमिल पूरी तरह से आपके ब्राउज़र में चलता है, इसलिए संवेदनशील टेक्स्ट को कभी भी अपने डिवाइस को छोड़ने की जरूरत नहीं है।
पाठ
HTML कनवर्टर करने के लिए मार्कडाउन
ब्लॉग पोस्ट, प्रलेखन, README सामग्री, CMS प्रविष्टियों, ईमेल या ज्ञान-आधारित लेख तैयार करते समय मार्कडाउन को HTML में कनवर्ट करें। यह जांचने में सहायक है कि प्रकाश व्यवस्था से पहले शीर्षकों, जोरों, सूचियों और कोड-शैली की सामग्री कैसे प्रस्तुत की जाएगी। टूलमिल आपके ब्राउज़र में स्थानीय रूप से चलाता है, जिससे यह आपके ड्राफ्ट टेक्स्ट को अपलोड करने वाले ऑनलाइन कन्वर्टर्स के लिए एक त्वरित गोपनीयता-अनुकूल विकल्प बनाता है।
पाठ
पाठ से खाली लाइन निकालें
एक ही क्रम में शेष लाइनों को रखते हुए तुरंत चिपकाए गए पाठ से रिक्त रेखाओं को हटा दें। यह लॉग्स, सूचियों, कॉपी स्प्रेडशीट कॉलम, CSV या TSV स्निपेट्स, कोड ब्लॉक, ईमेल ड्राफ्ट और पीडीएफ या चैट एक्सपोर्ट से खींचे गए टेक्स्ट की सफाई के लिए उपयोगी है। टूलमिल पूरी तरह से आपके ब्राउज़र में चलता है, इसलिए निजी टेक्स्ट आपके डिवाइस पर रहता है।
पाठ
SEO-Friendly URLs
शीर्षकों, शीर्षकों, उत्पाद नाम, और लेख विचारों को ब्लॉग, सीएमएस प्रविष्टियों, लैंडिंग पृष्ठों और डेवलपर मार्गों के लिए साफ यूआरएल स्लग में बदल दें। यह उपयोगी है जब आप punctuation या रिक्ति मुद्दों के बिना पठनीय, एसईओ-अनुकूल यूआरएल चाहते हैं। टूलमिल आपको विज्ञापन, खाता दीवारों, या ऑफ साइट पर ड्राफ्ट पेज शीर्षक भेजने के बिना एक तेज़ इन-ब्रोशर परिणाम देता है।
पाठ
