Uklanjanje dvostrukih redaka podataka u programu Excel

01 od 02

Uklanjanje duplikata podataka zapisa u programu Excel

Uklanjanje duplikata - traženje istovrsnih zapisa po nazivu polja. © Ted French

Programi proračunske tablice kao što je Excel često se koriste kao baze podataka za stvari kao što su zalihe dijelova, prodajni zapisi i popisi za slanje e-pošte.

Baze podataka u programu Excel sastoje se od tablica podataka koji se obično organiziraju u redove podataka zvanih zapisa.

U zapisniku se odnose podaci u svakoj ćeliji ili polju u retku - kao što su naziv tvrtke, adresa i telefonski broj.

Čest problem koji se pojavljuje kao baza podataka raste u veličini je duplikat zapisa ili redaka podataka.

Ova dupliciranja mogu se pojaviti ako:

U oba slučaja, duplikat zapisa može uzrokovati cijeli niz problema - kao što je slanje višestrukih kopija dokumenata istoj osobi kada se informacije o bazi podataka koriste u spajanju pošte - stoga je dobra ideja skenirati i ukloniti dvostruke zapise na redovnoj osnova.

I dok se lako može odabrati duplikat zapisa u malom uzorku poput onog na gornjoj slici, podatkovne tablice mogu lako sadržavati stotine, ako ne i tisuće zapisa, čineći ga vrlo teško odabrati duple zapise - posebno djelomično usklađene zapise.

Da bi se taj zadatak olakšao, Excel ima izgrađen alat za podatke koji se naziva, a ne iznenađujuće, Uklanjanje duplikata , koja se može koristiti za pronalaženje i uklanjanje istovjetnih, kao i djelomično podudarnih zapisa.

Međutim, način na koji je alat Remove Duplicates dizajniran, identični i djelomično podudarni zapisi moraju se rješavati zasebno.

To je zato što dijaloški okvir Uklanjanje duplikata prikazuje nazive polja za odabranu tablicu podataka i odabirete koja polja želite uključiti u traženje odgovarajućih zapisa:

Nazivi polja naspram stupaca slova

Kao što je spomenuto, alat za uklanjanje duplikata sastoji se od dijaloškog okvira u kojem odabirete koja podudarna polja za pretraživanje provjeravajući željene nazive polja ili stupaca.

Podaci koje prikazuje dijaloški okvir - nazivi polja ili slova stupaca - ovise o tome sadrži li vaše podatke redak naslova - ili zaglavlja - na vrhu tablice podataka kao što je prikazano na gornjoj slici.

Ako jest - provjerite je li opcija s desne strane dijaloškog okvira - Moji podaci zaglavlja - provjerena i Excel će prikazati imena u ovom retku kao imena polja u dijaloškom okviru.

Ako vaši podaci nemaju redak zaglavlja, dijaloški okvir prikazuje odgovarajuće slova u dijaloškom okviru za odabrani raspon podataka.

Neprekidni raspon podataka

Da bi alat za uklanjanje duplikata ispravno funkcionirao, podatkovna tablica mora biti kontinuirani raspon podataka - to ne smije imati praznih redaka, stupaca i, ako je to moguće, praznih ćelija unutar tablice.

Nema praznina unutar tablice podataka je dobra praksa kada je u pitanju upravljanje podacima općenito, a ne samo kada traže duple podatke. Excelovi alati za podatke, poput razvrstavanja i filtriranja, najbolje funkcioniraju kada je podatkovna tablica kontinuirani raspon podataka.

Uklonite primjer duplikata podataka

Na gornjoj slici, podatkovna tablica sadrži dva identična zapisa za A. Thompsona i dva djelomično podudarna zapisa za R. Holt - gdje se sva polja podudaraju, osim broja studenta.

Dolje navedeni koraci detaljno upotrebljavaju alat za uklanjanje duplikata podataka u:

  1. Uklonite drugi od dva identična zapisa za A. Thompsona.
  2. Uklonite drugi parcijalno podudarni zapis za R. Holt.

Otvaranje dijaloškog okvira Uklanjanje duplikata

  1. Kliknite bilo koju ćeliju koja sadrži podatke u bazi podataka uzorka.
  2. Kliknite karticu Podaci na vrpci.
  3. Kliknite ikonu Uklanjanje duplikata da biste označili sve podatke u podatkovnoj tablici i otvorili dijaloški okvir Uklanjanje duplikata .
  4. U dijaloškom okviru Uklanjanje duplikata prikazuje se sva zaglavlja stupaca ili nazivi polja iz našeg uzorka podataka
  5. Kvačice pored naziva polja označavaju koji će se stupci Excel pokušati podudarati u traženju dvostrukih zapisa
  6. Prema zadanim postavkama, kada se otvori dijaloški okvir, sva imena polja provjeravaju se

Pronalaženje istovjetnih zapisa

  1. Budući da tražimo potpuno identične zapise u ovom primjeru, ostavit ćemo sve naslove stupaca provjerenih
  2. Kliknite U redu

U ovom trenutku treba vidjeti sljedeće rezultate:

02 od 02

Pronađite i uklonite djelomično usklađivanje zapisa s uklanjanjem duplikata

Uklanjanje duplikata - traženje dijela usklađivanja zapisa prema nazivu polja. © Ted French

Provjera jednog polja u isto vrijeme

Budući da Excel samo uklanja podatkovne zapise koji se točno podudaraju za odabrana polja podataka, najbolji način za pronalaženje svih djelomično podudarnih podataka je da uklonite kvačicu za samo jedno polje u isto vrijeme, kao što je to učinjeno u koracima u nastavku.

Naknadna pretraživanja za zapise koji se podudaraju u svim poljima osim imena, dobi ili programa uklonit će sve moguće kombinacije za djelomično podudaranje zapisa.

Pronalaženje parcijalno usklađenih zapisa

  1. Ako je potrebno, kliknite bilo koju ćeliju koja sadrži podatke u podatkovnoj tablici
  2. Kliknite karticu Podaci na vrpci .
  3. Kliknite ikonu Uklanjanje duplikata da biste označili sve podatke u podatkovnoj tablici i otvorili dijaloški okvir Uklanjanje duplikata .
  4. Odabrani su svi nazivi polja ili zaglavlja stupaca za podatkovnu tablicu.
  5. Da biste pronašli i uklonili zapise koji nemaju podudaranje u svakom polju, uklonite kvačicu osim onih naziva polja koje Excel treba zanemariti.
  6. Za ovaj primjer kliknite potvrdni okvir pored naslova stupca Student ID kako biste uklonili kvačicu.
  7. Excel će sada samo tražiti i ukloniti zapise koji imaju podudarne podatke u polju Prezime , Početno i Program .
  8. Kliknite U redu
  9. Dijaloški okvir bi trebao zatvoriti i biti zamijenjen porukom koja kaže: 1 pronađene i uklonjene duple vrijednosti; Ostaju 6 jedinstvenih vrijednosti.
  10. Redak koji sadrži drugi zapis za R. Holt s studentskim ID-om ST348-252 bit će uklonjen iz baze podataka.
  11. Kliknite U redu da biste zatvorili okvir s porukama

U ovom trenutku primjer tablice podataka trebao bi biti slobodan od svih dvostrukih podataka.