01 od 02
Uklanjanje duplikata podataka zapisa u programu Excel
Programi proračunske tablice kao što je Excel često se koriste kao baze podataka za stvari kao što su zalihe dijelova, prodajni zapisi i popisi za slanje e-pošte.
Baze podataka u programu Excel sastoje se od tablica podataka koji se obično organiziraju u redove podataka zvanih zapisa.
U zapisniku se odnose podaci u svakoj ćeliji ili polju u retku - kao što su naziv tvrtke, adresa i telefonski broj.
Čest problem koji se pojavljuje kao baza podataka raste u veličini je duplikat zapisa ili redaka podataka.
Ova dupliciranja mogu se pojaviti ako:
- Cijeli zapisi se upisuju u bazu podataka više puta, što rezultira s dva ili više identičnih zapisa
- Višestruka evidencija ima jedno ili više polja - kao što su ime i adresa - koji sadrže iste podatke.
U oba slučaja, duplikat zapisa može uzrokovati cijeli niz problema - kao što je slanje višestrukih kopija dokumenata istoj osobi kada se informacije o bazi podataka koriste u spajanju pošte - stoga je dobra ideja skenirati i ukloniti dvostruke zapise na redovnoj osnova.
I dok se lako može odabrati duplikat zapisa u malom uzorku poput onog na gornjoj slici, podatkovne tablice mogu lako sadržavati stotine, ako ne i tisuće zapisa, čineći ga vrlo teško odabrati duple zapise - posebno djelomično usklađene zapise.
Da bi se taj zadatak olakšao, Excel ima izgrađen alat za podatke koji se naziva, a ne iznenađujuće, Uklanjanje duplikata , koja se može koristiti za pronalaženje i uklanjanje istovjetnih, kao i djelomično podudarnih zapisa.
Međutim, način na koji je alat Remove Duplicates dizajniran, identični i djelomično podudarni zapisi moraju se rješavati zasebno.
To je zato što dijaloški okvir Uklanjanje duplikata prikazuje nazive polja za odabranu tablicu podataka i odabirete koja polja želite uključiti u traženje odgovarajućih zapisa:
- Za identične zapise, potražite sva polja - označite oznake pored svih naziva stupaca ili polja;
- Za djelomično podudaranje zapisa - ostavite oznake za označavanje pokraj samo onih polja koja se podudaraju.
Nazivi polja naspram stupaca slova
Kao što je spomenuto, alat za uklanjanje duplikata sastoji se od dijaloškog okvira u kojem odabirete koja podudarna polja za pretraživanje provjeravajući željene nazive polja ili stupaca.
Podaci koje prikazuje dijaloški okvir - nazivi polja ili slova stupaca - ovise o tome sadrži li vaše podatke redak naslova - ili zaglavlja - na vrhu tablice podataka kao što je prikazano na gornjoj slici.
Ako jest - provjerite je li opcija s desne strane dijaloškog okvira - Moji podaci zaglavlja - provjerena i Excel će prikazati imena u ovom retku kao imena polja u dijaloškom okviru.
Ako vaši podaci nemaju redak zaglavlja, dijaloški okvir prikazuje odgovarajuće slova u dijaloškom okviru za odabrani raspon podataka.
Neprekidni raspon podataka
Da bi alat za uklanjanje duplikata ispravno funkcionirao, podatkovna tablica mora biti kontinuirani raspon podataka - to ne smije imati praznih redaka, stupaca i, ako je to moguće, praznih ćelija unutar tablice.
Nema praznina unutar tablice podataka je dobra praksa kada je u pitanju upravljanje podacima općenito, a ne samo kada traže duple podatke. Excelovi alati za podatke, poput razvrstavanja i filtriranja, najbolje funkcioniraju kada je podatkovna tablica kontinuirani raspon podataka.
Uklonite primjer duplikata podataka
Na gornjoj slici, podatkovna tablica sadrži dva identična zapisa za A. Thompsona i dva djelomično podudarna zapisa za R. Holt - gdje se sva polja podudaraju, osim broja studenta.
Dolje navedeni koraci detaljno upotrebljavaju alat za uklanjanje duplikata podataka u:
- Uklonite drugi od dva identična zapisa za A. Thompsona.
- Uklonite drugi parcijalno podudarni zapis za R. Holt.
Otvaranje dijaloškog okvira Uklanjanje duplikata
- Kliknite bilo koju ćeliju koja sadrži podatke u bazi podataka uzorka.
- Kliknite karticu Podaci na vrpci.
- Kliknite ikonu Uklanjanje duplikata da biste označili sve podatke u podatkovnoj tablici i otvorili dijaloški okvir Uklanjanje duplikata .
- U dijaloškom okviru Uklanjanje duplikata prikazuje se sva zaglavlja stupaca ili nazivi polja iz našeg uzorka podataka
- Kvačice pored naziva polja označavaju koji će se stupci Excel pokušati podudarati u traženju dvostrukih zapisa
- Prema zadanim postavkama, kada se otvori dijaloški okvir, sva imena polja provjeravaju se
Pronalaženje istovjetnih zapisa
- Budući da tražimo potpuno identične zapise u ovom primjeru, ostavit ćemo sve naslove stupaca provjerenih
- Kliknite U redu
U ovom trenutku treba vidjeti sljedeće rezultate:
- Dijaloški okvir bi trebao zatvoriti i biti zamijenjen porukom koja kaže: 1 pronađene i uklonjene duple vrijednosti; Ostaje 7 jedinstvenih vrijednosti.
- Redak koji sadrži dvostruki A. Thompsonov zapis bit će uklonjen iz baze podataka
- Iako postoje dva djelomično podudarna zapisa za R. Holt, jer nisu usklađeni svi polja - razlikuju se broj studenata za dva zapisa - Excel smatra jedinstvenim zapisom podataka
02 od 02
Pronađite i uklonite djelomično usklađivanje zapisa s uklanjanjem duplikata
Provjera jednog polja u isto vrijeme
Budući da Excel samo uklanja podatkovne zapise koji se točno podudaraju za odabrana polja podataka, najbolji način za pronalaženje svih djelomično podudarnih podataka je da uklonite kvačicu za samo jedno polje u isto vrijeme, kao što je to učinjeno u koracima u nastavku.
Naknadna pretraživanja za zapise koji se podudaraju u svim poljima osim imena, dobi ili programa uklonit će sve moguće kombinacije za djelomično podudaranje zapisa.
Pronalaženje parcijalno usklađenih zapisa
- Ako je potrebno, kliknite bilo koju ćeliju koja sadrži podatke u podatkovnoj tablici
- Kliknite karticu Podaci na vrpci .
- Kliknite ikonu Uklanjanje duplikata da biste označili sve podatke u podatkovnoj tablici i otvorili dijaloški okvir Uklanjanje duplikata .
- Odabrani su svi nazivi polja ili zaglavlja stupaca za podatkovnu tablicu.
- Da biste pronašli i uklonili zapise koji nemaju podudaranje u svakom polju, uklonite kvačicu osim onih naziva polja koje Excel treba zanemariti.
- Za ovaj primjer kliknite potvrdni okvir pored naslova stupca Student ID kako biste uklonili kvačicu.
- Excel će sada samo tražiti i ukloniti zapise koji imaju podudarne podatke u polju Prezime , Početno i Program .
- Kliknite U redu
- Dijaloški okvir bi trebao zatvoriti i biti zamijenjen porukom koja kaže: 1 pronađene i uklonjene duple vrijednosti; Ostaju 6 jedinstvenih vrijednosti.
- Redak koji sadrži drugi zapis za R. Holt s studentskim ID-om ST348-252 bit će uklonjen iz baze podataka.
- Kliknite U redu da biste zatvorili okvir s porukama
U ovom trenutku primjer tablice podataka trebao bi biti slobodan od svih dvostrukih podataka.