删除重复行
删除重复行,同时保留每个值的第一个出错。 用于清理电子邮件列表,日志输出,关键词导出, CSV 片段, 复制电子表格列, 在您粘贴到别处之前及时输入 。 ToolMill完全运行在您的浏览器中,所以敏感文本从不用离开您的设备.
文本
试试看
实例
apple banana apple orange banana
apple banana orange
Alpha alpha ALPHA Beta beta
Alpha Beta
用于去除重复行的常用例
在清理邮件列表,导出用户名,关键词集,复制电子表格列,日志片段,以及粗略的文本粘贴从聊天或文档时,除去行是有用的. 它让你在排序,比较版本或者将数据导入到另一个系统之前有一个更快的起点.
什么是重复线?
该工具精确地比较了整行在分行间隔后出现的行. 如果两行在资本化,间距,平分,或隐藏的分页上存在差异,它们仍可能算作不同的值. 当贴上的数据看起来与眼睛相似但并不完全相同时,这一点很重要。
线条顺序如何保留
通常对去dupe工具的期望是保持每个独特行的首次出现,而丢弃在后重复. 这意味着输出可以保持可读和熟悉,而不是被自动使用. 如果您也想要按字母顺序排序, 通常最好先去除后去排序, 作为单独的步骤 。
真实输入实例的前后
一个现实的例子是一个被贴上的主机名,标记,或电子邮件地址的列表,其中同一值在列表的不同部分多次出现. 另一个是带有重复产品或ID的被复制的电子表格列. 将这几行分拆后,审查、搜索和进口检查就容易多了。
复制前准备文本
如果您的来源包含不一致的外壳或跟踪空格, 您可能想要先将其正常化 。 脱落前去掉多余的白空或转换外壳,可以减少偶然的近似重复,仅仅因为拼法略有不同而幸存.
限额和边际案件
此页面不承诺模糊匹配, 重写修复, 或语义合并 。 视同一个人的数值,如果包含不同的相距、相接或字母大小写,则可能保持相隔。 这通常是正确的行为 当你需要可预测的, 线性清理。
隐私和本地处理
在您在 Deduped 文本上重现前
在使用另一个工具的输出或将其上传到其它工具之前,先决定白空间,资本化,以及原始顺序在您的数据中是否具有意义. 如果有的话,快速调试通行证有助于审查,但不应取代最后人工检查。
哪些调值输出不保证
删除重复行不会验证拼写,合并了近比特,或者决定哪个变体是合适的保存. 这是一个清理步骤,而不是语义评论。 如果类似行因一个字符或额外白空而相异,结果可能需要人工检查.
如何将什么算作复制
复制取决于输入文本中使用的确切比较规则. 外壳,前导或后导空格,隐藏分页,或行端样式的差异,可以改变两行是否被作为同一种处理. 如果输出不符合您的预期, 请仔细审查原始文本 。
复制在浏览器中发生, 因此在例行清理时粘贴的列表会留在设备上 。 如果文本中包含客户出口、内部识别符或起草工作数据,而您不想将这些数据发送给第三方服务,则这样做是有用的。
相关工具
HTML 到纯文本转换器
在清理电子邮件模板时将 HTML 转换为纯文本, 删除片段, CMS 导出, 支持内容, 或复制网页 。 它帮助您快速去除标记,同时为注释,文档,提示或下游处理保留可读文本. ToolMill 进行内浏览器的转换,当源 HTML 包含私有或客户端敏感的内容时,此功能是有用的.
文本
向下标记到 HTML 转换器
在准备博客文章、文档、 README 内容、 CMS 条目、 电子邮件或基于知识的文章时, 将 Markdown 转换为 HTML 。 它有助于检查标题、重点、清单和密码式内容在出版前如何提供。 ToolMill在您的浏览器中本地运行, 使它成为一个快速的隐私友好的替代品, 而不是在线转换器上传您的文本草稿 。
文本
从文本中删除空行
立即从粘贴文本中去掉空白行,同时将所剩行保持相同的顺序. 这可用于清理日志、列表、复制电子表格列、 CSV 或 TSV 片段、 代码块、 电子邮件草稿, 以及从 PDF 或聊天导出处提取的文本 。 ToolMill完全运行在您的浏览器中,所以私人文本会留在您的设备上.
文本
SEO- Friendly URL 的污名文字
将标题、标题、产品名称和文章创意变成博客、CMS条目、登陆页和开发者路线的干净的URL sults。 当您想要可读的、 方便 的 SSO URL 时, 无需标出或间隔问题 。 ToolMill在不发布广告,账面墙壁,或将页面标题草稿发出场外的情况下,会给你一个快速的浏览结果.
文本
