Deep learning este un subset al machine learning (ML), în care rețelele neuronale artificiale - algoritmi modelați pentru a funcționa asemenea creierului uman - învață pornind de la cantități mari de date.
Deep learning este susținută de straturi de rețele neuronale, care sunt algoritmi inspirați în mare măsură de modul în care funcționează creierul uman. Instruirea cu cantități mari de date este cea care configurează neuronii din rețeaua neuronală. Rezultatul este un model deep learning care, odată antrenat, procesează date noi. Modelele deep learning preiau informații din mai multe surse de date și le analizează în timp real, fără a fi nevoie de intervenție umană. În cadrul deep learning, unitățile de procesare grafică (GPU) sunt optimizate pentru modelele de instruire, deoarece pot procesa mai multe calcule simultan.
Deep learning reprezintă motorul multor tehnologii de inteligență artificială (AI) care pot îmbunătăți automatizarea și sarcinile analitice. Majoritatea oamenilor se întâlnesc cu procesul de tip deep learning în fiecare zi, atunci când navighează pe internet sau își folosesc telefoanele mobile. Printre nenumărate alte aplicații, deep learning este utilizată pentru a genera subtitrări pentru videoclipurile de pe YouTube, pentru a realiza recunoașterea vocală pe telefoane și difuzoare inteligente, pentru a oferi recunoaștere facială pentru fotografii și pentru a activa mașinile cu conducere autonomă. Și pe măsură ce analiștii și cercetătorii de date abordează proiecte de tip deep learning din ce în ce mai complexe - valorificând cadrele deep learning - acest tip de inteligență artificială va deveni o parte din ce în ce mai importantă a vieții noastre de zi cu zi.
Pe scurt, deep learning este denumirea dată rețelelor neuronale cu mai multe straturi.
Pentru a da sens datelor de observație, cum ar fi fotografiile sau înregistrările audio, rețelele neuronale introduc datele prin straturi interconectate de noduri. Atunci când informațiile trec printr-un strat, fiecare nod din acel strat efectuează operații simple asupra datelor și transmite selectiv rezultatele către alte noduri. Fiecare strat ulterior se concentrează pe o caracteristică de nivel superior celui anterior, până când rețeaua generează rezultatul.
Între stratul de intrare și stratul de ieșire se află straturi ascunse. Aici intervine distincția dintre rețelele neuronale și deep learning: o rețea neuronală de bază poate avea unul sau două straturi ascunse, în timp ce o rețea deep learning poate avea zeci – sau chiar sute – de straturi. Creșterea numărului de straturi și noduri diferite poate spori acuratețea unei rețele. În orice caz, un număr mai mare de straturi poate însemna, de asemenea, că un model va necesita mai mulți parametri și mai multe resurse de calcul.
Deep learning clasifică informațiile prin intermediul unor straturi de rețele neuronală, care au un set de intrări ce primesc date brute. De exemplu, dacă o rețea neuronală este instruită cu ajutorul unor imagini de păsări, aceasta poate fi utilizată pentru a recunoaște imagini de păsări. Un număr mai mare de straturi permite obținerea unor rezultate mai precise, cum ar fi diferența dintre o cioară și un corb, în comparație cu diferența dintre o cioară și o găină. Rețelele neuronale profunde, care stau la baza algoritmilor deep learning, au mai multe straturi ascunse între nodurile de intrare și cele de ieșire - ceea ce înseamnă că sunt capabile să realizeze clasificări mai complexe ale datelor. Un algoritm deep learning trebuie să fie antrenat cu seturi mari de date și, cu cât primește mai multe date, cu atât va fi mai precis; va trebui să i se furnizeze mii de imagini de păsări înainte de a fi capabil să clasifice cu acuratețe noi imagini de păsări.
În ceea ce privește rețelele neuronale, antrenarea modelului deep learning necesită foarte multe resurse. În acest caz, rețeaua neuronală asimilează intrările, care sunt procesate în straturile ascunse cu ajutorul unor valori ponderate (parametri care reprezintă puterea conexiunii dintre intrări) reglate în timpul instruirii, iar modelul emite apoi o predicție. Valorile ponderate sunt reglate pe baza datelor de instruire pentru a face predicții mai eficiente. Modelele deep learning necesită mult timp pentru instruirea unor cantități mari de date, motiv pentru care este atât de important un sistem de calcul de performanță superioară.
Unitățile de procesare grafică GPU sunt optimizate pentru calculele de date și sunt concepute pentru performanțe accelerate în calculele matriciale pe scară largă. Unitățile de procesare grafică GPU sunt cele mai potrivite pentru execuția în paralel a problemelor de tip machine learning (ML) și deep learning la scară largă. Prin urmare, aplicațiile ML care efectuează un număr mare de calcule pe cantități mari de date structurate sau nestructurate - cum ar fi imagini, text și video - se bucură de performanțe excelente.
Un avantaj major al deep learning este faptul că rețelele neuronale sunt folosite pentru a dezvălui informații și relații ascunse în cadrul datelor care nu erau vizibile anterior. Cu modele mai puternice de tip machine learning, care pot analiza date complexe și de mari dimensiuni, companiile pot optimiza detectarea fraudelor, managementul lanțului de aprovizionare și securitatea cibernetică, valorificând aspectele următoare:
Algoritmii deep learning pot fi antrenați să analizeze date de tip text prin analizarea postărilor din social media, a știrilor și a sondajelor, pentru a oferi informații valoroase despre afaceri și clienți.
Deep learning necesită date etichetate pentru instruire. Odată instruit, procesul acesta poate să eticheteze date noi și să identifice diferite tipuri de date pe cont propriu.
Un algoritm deep learning poate economisi timp, deoarece nu este nevoie ca oamenii să extragă manual caracteristici din datele brute.
Atunci când un algoritm de tip deep learning este antrenat corespunzător, acesta poate îndeplini mii de sarcini în mod repetat, mai repede decât o face un om.
Rețelele neuronale utilizate în deep learning au capacitatea de a fi aplicate la multe tipuri de date și la aplicații diferite. În plus, un model de tip deep learning se poate adapta prin reinstruirea sa cu date noi.
AI, machine learning și deep learning sunt interconectate, dar prezintă caracteristici distincte:
Inteligența artificială permite calculatoarelor, mașinilor sau roboților să imite competențele umane, cum ar fi luarea de decizii, recunoașterea obiectelor, soluționarea problemelor și înțelegerea limbajului.
Machine learning este un subset al inteligenței artificiale axat pe crearea de aplicații care pot învăța pe baza datelor pentru a-și optimiza acuratețea în timp, fără intervenție umană. Algoritmii de tip machine learning pot fi antrenați pentru a găsi tipare care să permită luarea unor decizii și realizarea unor predicții mai bune, dar acest lucru necesită, de obicei, intervenție umană.
Deep learning este un subset al machine learning care le permite calculatoarelor să rezolve probleme mai complexe. Modelele deep learning sunt, de asemenea, capabile să creeze noi caracteristici pe cont propriu.
Procesul de tip deep learning poate fi folosit pentru a analiza un număr mare de imagini, ceea ce le permite rețelelor sociale să afle mai multe despre utilizatorii lor. Acest aspect îmbunătățește anunțurile direcționate și sugestiile de urmărire.
Rețelele neuronale din cadrul deep learning pot fi utilizate pentru previzionarea valorilor bursiere și dezvoltarea strategiilor de tranzacționare, precum și pentru identificarea amenințărilor la adresa securității și protecția împotriva fraudei.
Deep learning poate avea un rol esențial în domeniul sănătății analizând tendințele și comportamentele pentru a prezice bolile pacienților. Personalul medical poate, de asemenea, să utilizeze algoritmi deep learning pentru a stabili testele și tratamentele optime pentru pacienți.
Deep learning poate detecta amenințări avansate mai bine decât soluțiile tradiționale de combatere de malware, recunoscând activități noi, suspecte, mai degrabă decât răspunzând la o bază de date de amenințări cunoscute.
Asistenții digitali reprezintă unele dintre cele mai comune exemple de tip deep learning. Cu ajutorul prelucrării limbajului natural (NLP), Siri, Cortana, Google și Alexa pot răspunde la întrebări și se pot adapta obiceiurilor utilizatorilor.
Deși se descoperă noi utilizări pentru deep learning, acesta este încă un domeniu în evoluție, cu anumite limitări:
Pentru a obține răspunsuri mai pătrunzătoare și mai abstracte, deep learning are nevoie de cantități mari de date pe care să se antreneze. La fel ca un creier uman, un algoritm de tip deep learning are nevoie de exemple pentru a învăța din greșeli și pentru a-și îmbunătăți rezultatele.
Mașinile învață încă în moduri foarte limitate, ceea ce poate genera greșeli. Rețelele de tip deep learning au nevoie de date pentru a rezolva o problemă specifică. Dacă li se cere să îndeplinească o sarcină în afara acestui domeniu de aplicare, cel mai probabil vor eșua.
Deși analizează milioane de unități de date pentru a găsi modele, poate fi dificil de înțeles cum ajunge o rețea neuronală la soluția propusă. Această lipsă de transparență în ceea ce privește modul în care procesează datele face dificilă identificarea influențelor nedorite și argumentarea predicțiilor.
În ciuda acestor obstacole, oamenii de știință din domeniul cercetării de date se apropie din ce în ce mai mult de construirea unor modele de tip deep learning extrem de precise, care pot învăța fără supraveghere - ceea ce va face ca procesul de tip deep learning să fie mai rapid și să necesite mai puțină muncă.
Odată cu explozia datelor comerciale, cercetătorii de date trebuie să fie capabili să exploreze și să construiască modele deep learning rapid și cu mai multă flexibilitate decât poate oferi sistemul hardware IT tradițional existent la locație.
Oracle Cloud Infrastructure (OCI) oferă cel mai bun raport preț-performanță în materie de calcul pentru sarcini de lucru cu utilizare intensivă a datelor, stocare rapidă în cloud și rețele cu latență redusă și debit mare, cu 100 Gbps RDMA. OCI oferă, de asemenea, instanțe de calcul GPU pentru deep learning, imagini ușor de implementat și flexibilitatea de a rula o stație de lucru cu o singură GPU sau un cluster de forme cu mai multe GPU.
Pentru a construi, instrui și implementa modele de tip machine learning pe o infrastructură cloud de înaltă performanță, testați Oracle Cloud Infrastructure Data Science. Cercetătorii de date pot construi și antrena modele de tip deep learning într-un timp mult mai scurt folosind GPU-urile NVIDIA în sesiuni de lucru pe notebook. De asemenea, aceștia pot selecta cantitatea de resurse de calcul și de stocare de care au nevoie pentru a aborda proiecte de orice dimensiune, fără a se preocupa de asigurarea accesului sau de întreținerea infrastructurii. În plus, OCI Data Science accelerează crearea de modele prin simplificarea activităților de știință a datelor, cum ar fi accesul la date, selectarea algoritmilor și explicarea modelelor.