Udaljite duplirane redove podataka u Excelu

01 od 02

Udaljite duplikate podataka u Excelu

Uklanjanje duplikata - traženje identičnih zapisa po imenu polja. © Ted francuski

Programi tabele , kao što je Excel, često se koriste kao baze podataka za stvari kao što su inventari delova, evidencije prodaje i mailing liste.

Baze podataka u Excel-u sastoje se od tablica podataka koji se obično organizuju u redove podataka zvanih zapise.

U zapisu su podaci u svakoj ćeliji ili polju u redu povezani - kao što su ime kompanije, adresa i telefonski broj.

Zajednički problem koji se pojavljuje kao baza podataka raste u veličini je duplikat zapisa ili redova podataka.

Ovo dupliranje može doći ako:

U svakom slučaju, duplirani zapisi mogu prouzrokovati čitav niz problema - kao što je slanje više kopija dokumenata istoj osobi kada se podaci o bazi podataka koriste u spajanju pošte - tako da je dobra ideja da skenirate i uklonite duplikate zapisa na redovnom osnova.

Iako je lako odabrati duplikate zapisa u malom uzorku poput onog na slici iznad, tablice podataka mogu lako sadržavati stotine ako ne i hiljade zapisa što otežava odabir duplih zapisa - posebno delimično usklađivanje zapisa.

Da bi olakšao postizanje ovog zadatka, Excel ima ugrađenu alatku za podatke nazvana, ne iznenađuje, ukloni duplikate , koje se mogu koristiti za pronalaženje i uklanjanje identičnih i delimično usklađenih zapisa.

Međutim, način na koji je alatka Remove Duplicates dizajnirana, identična i delimično podudaranje zapisa mora se razmatrati zasebno.

To je zato što je u dijaloškom okviru Remove Duplicates prikazana imena polja za izabranu tablicu podataka i izaberite koja polja će se uključiti u pretragu za odgovarajuće zapise:

Imena polja u odnosu na kolumne

Kao što je već rečeno, alat Remove Duplicates sastoji se od dijaloga gde izaberete koja polja za traženje će potražiti tako što ćete potvrditi željena imena polja ili kolona.

Informacije koje dijalog box prikazuje - imena polja ili slova kolona - zavisi od toga da li vaši podaci sadrže red naslova - ili zaglavlja - na vrhu tabele podataka kao što vidite na gornjoj slici.

Ako je to slučaj - uverite se da je opcija na desnoj strani dijaloga - Moji podaci imaju zaglavlja - isključena, a Excel će prikazati imena u ovom redu kao imena polja u dijaloškom okviru.

Ukoliko vaši podaci nemaju redosled zaglavlja, u dijaloškom okviru će se prikazati odgovarajuća slova kolona u dijalogu za izabrani opseg podataka.

Neodgovarajući raspon podataka

Da bi alat Remove Duplicates ispravno funkcionisao, tabela podataka mora biti složeni opseg podataka - to znači da ne sme imati prazne redove, stupce i, ukoliko je uopšte moguće, nema praznih ćelija koje se nalaze unutar tabele.

Nemanje praznina unutar tablice podataka je dobra praksa kada je u pitanju upravljanje podacima uopšte, a ne samo kada tražite duplikate podataka. Drugi alati za podatke Excel-a kao što su sortiranje i filtriranje najbolje funkcionišu kada je tablica podataka susedna opseg podataka.

Uklonite Duplicate Data Records Primer

Na slici iznad, tabela podataka sadrži dvije identične zapise za A. Thompson i dva delimično podudaranja zapisa za R. Holt - gdje sva polja odgovaraju broju učenika.

Sledeći koraci opisuju kako da koriste alatku za uklanjanje podmazivanja na:

  1. Uklonite drugu od dva identična zapisa za A. Tompson.
  2. Uklonite drugi delimično odgovarajući zapis za R. Holta.

Otvaranje dijaloga Remove Duplicates

  1. Kliknite na bilo koju ćeliju koja sadrži podatke u bazi podataka uzoraka.
  2. Kliknite karticu Data na traci.
  3. Kliknite na ikonu Remove Duplicates da biste označili sve podatke u tablici podataka i otvorili dijaloški okvir Remove Duplicates .
  4. Dijalog Remove Remove Duplicates prikazuje sve naslove kolona ili imena polja iz našeg uzorka podataka
  5. Oznake čekanja pored imena polja ukazuju na koje kolone Excel će pokušati da se podudaraju u potrazi za duplikatnim zapisima
  6. Podrazumevano, kada se dijaloški okvir otvori, sva imena polja se isključuju

Pronalaženje identičnih zapisa

  1. Pošto pretražujemo potpuno identične zapise u ovom primjeru, ostavićemo sve naslove stupaca proverene
  2. Kliknite OK

U ovom trenutku treba videti sledeće rezultate:

02 od 02

Nađite i uklonite delimično podudaranje zapisa sa ukloniti kopije

Uklanjanje duplikata - pretraživanje delimično usklađenih zapisa po imenu polja. © Ted francuski

Provera jednog polja po vremenu

Budući da Excel uklanja samo evidencije podataka koji se upravo podudaraju sa odabranim poljima podataka, najbolji način da se pronađu sve delimično podudarne podatke su uklanjanje oznake za samo jedno polje istovremeno, kao što je to učinjeno u narednim koracima.

Naknadne pretrage zapisa koji se podudaraju u svim poljima, osim imena, starosti ili programa, uklanjaju sve moguće kombinacije za delimično podudaranje zapisa.

Pronalaženje delimično odgovarajućih zapisa

  1. Ako je potrebno, kliknite na bilo koju ćeliju koja sadrži podatke u tablici podataka
  2. Kliknite karticu Data na traci .
  3. Kliknite na ikonu Remove Duplicates da biste označili sve podatke u tablici podataka i otvorili dijaloški okvir Remove Duplicates .
  4. Odabrana su sva imena polja ili zaglavlja kolona za tablicu podataka.
  5. Da biste pronašli i uklonili zapise koji nemaju podudaranje u svakom polju, uklonite oznaku pored navedenih imena polja koje će Excel ignorisati.
  6. Za ovaj primjer kliknite na polje za potvrdu pored naslova kolone Student ID-a da biste uklonili znak za potvrdu.
  7. Excel će sada pretraživati ​​i ukloniti zapise koji imaju odgovarajuće podatke u polju Last Name , Initial i Program .
  8. Kliknite OK
  9. Dijalog box bi trebalo da se zatvori i zameni porukom koja kaže: 1 duplikate pronađene i uklonjene; 6 jedinstvenih vrijednosti ostaju.
  10. Red koji sadrži drugi zapis za R. Holta sa studentskim ID-om ST348-252 biće uklonjen iz baze podataka.
  11. Kliknite na dugme U redu da biste zatvorili okvir za poruke

U ovom trenutku, tabela sa primerima podataka treba da bude besplatna od svih duplih podataka.