ToolMill.io

Poista kaksoiskappaleet

Poista kaksoisviivat säilyttäen kunkin arvon ensimmäisen esiintymisen. Hyödyllistä siivota sähköpostiluetteloita, log-ulostuloa, avainsanavientiä, CSV-snippejä, kopioida taulukkolaskenta sarakkeita, ja nopeasti syötteitä ennen liitä ne muualle. ToolMill toimii kokonaan selaimessasi, joten herkän tekstin ei tarvitse koskaan poistua laitteesta.

Teksti

Kokeile.

Esimerkkejä

Poista toistuvat viivat
Syöttö
apple
banana
apple
orange
banana
Tulos
apple
banana
orange
Jätä huomiotta kotelo ja lisätilat
Syöttö
 Alpha
alpha
ALPHA  
Beta
 beta
Tulos
Alpha
Beta

Kaksoislinjojen poistoa koskevat yhteiset käyttötapaukset

Rivien poistaminen on hyödyllistä, kun siivotaan sähköpostiluetteloita, vietyjä käyttäjänimiä, avainsanoja, kopioituja taulukkolaskentapalstoja, lokin palasia ja karkeaa tekstiä chatista tai asiakirjoista. Se antaa sinulle nopeamman lähtökohdan ennen lajittelua, versioiden vertailua tai tietojen tuontia toiseen järjestelmään.

Mikä laskee kaksoisviivana?

Tämä työkalu vertaa kokonaisia rivejä täsmälleen kuin ne näyttävät jälkeen jakaminen linja taukoja. Jos kaksi riviä eroavat kapitalisointi, väli, välimerkki, tai piilotettu välilehtiä, ne voivat silti laskea eri arvoja. Sillä on väliä, kun liimatut tiedot näyttävät samanlaiselta kuin silmä, mutta ne eivät ole todella identtisiä.

Miten rivijärjestys on säilytetty

Dedupe-työkalun tavanomaisena odotuksena on säilyttää jokaisen ainutlaatuisen viivan ensimmäinen esiintyminen ja hylätä myöhemmät toistot. Tämä tarkoittaa, että tuloste voi pysyä luettavissa ja tuttu sijaan automaattisesti turvautuu. Jos haluat myös aakkosjärjestyksessä tilauksen, on yleensä parempi ensin dedupe ja lajitella jälkeenpäin erillisenä askeleena.

Ennen ja jälkeen esimerkkejä todellisista syötteistä

Realistinen esimerkki on pasted luettelo isäntänimiä, tunnisteita tai sähköpostiosoitteita, joissa sama arvo näkyy monta kertaa luettelon eri osissa. Toinen on kopioitu laskentataulukko sarake toistuvia tuotteita tai IDs. Näiden rivien poistaminen tekee tarkastelun, haun ja tuonnin tarkastukset paljon helpommaksi.

Valmistellaan tekstiä ennen deduplikaatiota

Jos lähde sisältää epäjohdonmukaisia kotelo- tai jälkitiloja, kannattaa ehkä normalisoida se ensin. Ekstravalkotilan poistaminen tai muuntaminen ennen dedupingiä voi vähentää vahingossa lähes kaksoiskappaleita, jotka säilyvät vain siksi, että ne on kirjoitettu hieman eri tavalla.

Rajat ja reuna-asiat

Tämä sivu ei lupaa sumea matching, typo korjaus, tai semanttinen sulautuminen. Henkilöä vastaavat arvot voivat jäädä erillisiksi, jos niissä on eri väli, välimerkit tai kirjainkotelo. Se on yleensä oikea käyttäytyminen, kun tarvitaan ennakoitavaa, linjapohjaista siivousta.

Yksityisyys ja paikallinen käsittely

Ennen kuin vedät kadonnutta tekstiä

Ennen kuin käytät tulostetta toisessa työkalussa tai lataat sen muualle, päätä, onko whishspace, kapitalisointi ja alkuperäinen järjestys kantavat merkitystä tiedoissasi. Jos he tekevät niin, nopea dedupe pass on hyödyllistä tarkistaa, mutta ei pitäisi korvata lopullinen manuaalinen tarkistus.

Mitä kadonnut tuotos ei takaa

Toistuvien rivien poistaminen ei vahvista kirjoitusasua, yhdistä läheltä piti -otteluita tai päätä, mikä muunnos on oikea. Se on siivousvaihe, ei semanttinen tarkistus. Jos samanlaiset viivat eroavat toisistaan yhden merkin tai lisävalkotilan perusteella, tulos saattaa silti edellyttää manuaalista tarkastusta.

Miten tulkita mitä lasketaan kahtena kappaleena

Deduplikaatio riippuu syöttötekstin täsmällisistä vertailusäännöistä. Erot kotelossa, johtavassa tai perässä tilat, piilotetut välilehdet, tai linja-pääte tyyli voi muuttaa, onko kaksi riviä käsitellään samoin. Tarkista alkuperäinen teksti huolellisesti, jos tuloste ei vastaa odotuksiasi.

Deduplikaatio tapahtuu selaimessasi, joten liimatut listat pysyvät laitteessasi rutiinipuhdistuksen aikana. Tämä on hyödyllistä, kun teksti sisältää asiakkaiden viennin, sisäiset tunnisteet, tai luonnos työtiedot et halua lähettää kolmannen osapuolen palveluun.

Tähän liittyvät työkalut