Deep Learning: Učenje stroja u najboljem redu

Ono što trebate znati o evoluciji umjetne inteligencije

Duboko učenje je moćan oblik strojnog učenja (ML) koji gradi složene matematičke strukture nazvane neuronske mreže koristeći ogromne količine podataka (informacija).

Definicija dubokog učenja

Duboko učenje je način implementacije ML pomoću višestrukih slojeva neuronskih mreža za obradu složenijih vrsta podataka. Ponekad se zove hijerarhijsko učenje, duboko učenje koristi različite vrste neuronskih mreža kako bi naučili značajke (koje se nazivaju i reprezentacije) i pronaći ih u velikim skupovima sirovih, neobilježenih podataka (nestrukturiranih podataka). Jedan od prvih demonstracija dubokog učenja bio je program koji je uspješno odabrao slike mačaka iz skupova YouTube videozapisa.

Primjeri dubokog učenja u svakodnevnom životu

Duboko učenje ne koristi se samo za prepoznavanje slika, već i za jezični prijevod, otkrivanje prijevara i analizu podataka koje tvrtke prikupljaju o svojim klijentima. Na primjer, Netflix koristi duboko učenje za analizu vaših navika gledanja i predviđa koje emisije i filmove želite gledati. Na taj način Netflix zna staviti akcijske filmove i dokumentarne priče u svoj prijedlog reda. Amazon koristi duboko učenje za analizu vaših nedavnih kupnji i stavki koje ste nedavno tražili za izradu prijedloga za nove glazbene albume iz zemlje za koje ste vjerojatno zainteresirani te da ste na tržištu par sivog i žutog tenisa cipele. Kako dublje učenje pruža sve veći uvid u nestrukturirane i neobrađene podatke, korporacije mogu bolje predvidjeti potrebe svojih klijenata dok vi, pojedinačni kupci dobivaju više personalizirane usluge kupcima.

Umjetne neuronske mreže i duboko učenje

Da bismo olakšali razumijevanje dubljeg učenja, ponovno posjetimo našu usporedbu umjetne neuronske mreže (ANN). Za dublje učenje, zamislite našu poslovnu zgradu na 15 katova koji zauzima gradski blok s pet drugih poslovnih zgrada. Na svakoj strani ulice nalaze se tri zgrade. Naša zgrada je zgrada A i dijeli istu stranu ulice kao zgrada B i C. Preko ulice iz zgrade A zgrada 1, a preko zgrade B gradi 2, i tako dalje. Svaka zgrada ima različit broj etaža, izrađena je od različitih materijala i ima drugačiji stil arhitekture od ostalih. Međutim, svaka je zgrada još uvijek uređena u odvojenim etažama (slojevima) ureda (čvorova), tako da je svaka zgrada jedinstvena ANN.

Zamislite da digitalni paket stiže u zgradu A koji sadrži mnoge različite vrste informacija iz više izvora, kao što su tekstualni podaci, video streamovi, audio streamovi, telefonski pozivi, radio-valovi i fotografije. Međutim, dolazi u jedan veliki jumble i nije označen ili razvrstan na bilo koji logički način (nestrukturirani podaci). Informacije se šalju kroz svaki kat, od 1 do 15 za obradu. Nakon što se informacije oduze na 15. kat (izlaz), šalju se na 1. kat (ulaz) zgrade 3 zajedno s konačnim rezultatom obrade iz zgrade A. Građevina 3 uči i uključuje rezultate poslane zgradom A i a zatim obrađuje informacije na svakom katu na isti način. Kada se podaci dosegnu na najgornji kat zgrade 3, ona se šalje od tamo s rezultatima zgrade u zgradu 1. Građevina 1 saznaje i ugrađuje rezultate iz zgrade 3 prije nego što ga obradi po podu. Zgrada 1 prenosi informacije i rezultate na isti način na izgradnju C, koji obrađuje i šalje u zgradu 2, koji obrađuje i šalje u zgradu B.

Svaka ANN (zgrade) u našem primjeru traži drugačiju značajku u nestrukturiranim podacima (mješavina informacija) i prenosi rezultate u sljedeću zgradu. Sljedeća zgrada uključuje (uči) izlaz (rezultate) iz prethodnog. Budući da se podaci obrađuju po svakoj ANN (građevini), on se organizira i označava (klasificira) određenom značajkom, tako da kada se podaci dosegnu konačni output (najgornji kat) zadnjeg ANN-a (građevina), ona se razvrstava i označava (više strukturirano).

Umjetna inteligencija, učenje stroja i duboko učenje

Kako duboko učenje uklapa u ukupnu sliku umjetne inteligencije (AI) i ML? Deep learning povećava moć ML i povećava raspon zadataka koje AI može obavljati. Budući da se duboko učenje oslanja na korištenje neuronskih mreža i prepoznaje značajke unutar skupova podataka umjesto jednostavnijih algoritama specifičnih za zadatke, može pronaći i koristiti podatke iz nestrukturiranih (sirovih) podataka bez potrebe da programer ručno označi prvi put - konzumirajući zadatak koji može uvesti pogreške. Dublje učenje pomaže računalima da bolje i bolje koriste podatke za pomoć korporacijama i pojedincima.