Niciun rezultat găsit

Căutarea dvs. nu a identificat niciun rezultat.

Pentru a găsi ceea ce căutați, vă sugerăm să încercați următoarele:

  • Verificați ortografia cuvintelor cheie ale căutării.
  • Utilizați sinonime pentru cuvântul cheie pe care l-ați introdus; de exemplu, încercați “aplicație” în loc de “software”.
  • Începeți o căutare nouă.
Contactați-ne Conectați-vă la Oracle Cloud

Ce este știința datelor?

Definiția științei datelor

Știința datelor utilizează mai multe elemente, inclusiv statistici, metode științifice, inteligență artificială (AI) și analiza datelor, pentru a extrage valoare din date. Cei care lucrează în domeniul științei datelor se numesc experți în date. Aceștia își folosesc abilitățile pentru a analiza datele colectate de pe web, de pe smartphone-uri, de la clienți, de la senzori și din alte surse, în vederea obținerii unor informații pe baza cărora se poate acționa.

Știința datelor include pregătirea datelor pentru analiză, inclusiv curățarea, agregarea și manipularea acestora în vederea analizării lor în detaliu. Aplicațiile de analiză și experții în date pot, apoi, să examineze rezultatele, pentru a descoperi tipare și a le permite liderilor de companii să extragă informații importante.

Știința datelor: o resursă neexploatată pentru machine learning

Știința datelor este unul dintre cele mai interesante domenii din prezent. De ce este atât de important?

Deoarece companiile dețin o adevărată comoară reprezentată de date. Pe măsură ce tehnologiile moderne au permis crearea și stocarea unui volum din ce în ce mai mare de date, acestea au explodat. Se estimează că 90% din datele din lume au fost create în ultimii doi ani. De exemplu, utilizatorii Facebook încarcă 10 milioane de fotografii în fiecare oră.

Dar, adesea, aceste date sunt stocate în baze și în lacuri de date, fără a fi procesate.

Valoarea datelor colectate și stocate de aceste tehnologii le poate oferi organizațiilor și societăților din lumea întreagă avantajele transformării – dar numai dacă le pot interpreta. Aici intervine știința datelor.

Știința datelor dezvăluie tendințele și produce informații pe care afacerile le pot utiliza, pentru a lua decizii mai bune și pentru a crea produse și servicii mai inovatoare. Poate cel mai important aspect, aceasta permite modelelor de machine learning (ML) să învețe din cantitățile mari de date care le sunt furnizate, în loc să se bazeze în special pe analiștii de afaceri pentru a extrage informații din date.

Datele reprezintă baza inovației, dar valoarea acestora provine din informațiile pe care experții în date le pot obține din acestea și pe baza cărora pot acționa.

Care este diferența dintre știința datelor, inteligența artificială și machine learning?

Pentru a înțelege mai bine știința datelor și cum puteți beneficia de avantajele acesteia, este la fel de important să cunoașteți și termenii din acest domeniu, precum inteligență artificială (AI) și machine learning. Adesea, veți vedea că acești termeni sunt folosiți în mod interschimbabil, dar există anumite diferențe.

Iată un rezumat simplu:

  • AI înseamnă a determina un computer să imite într-o anumită manieră comportamentul uman.
  • Știința datelor este un subset al AI și se referă, în special, la corelarea zonelor de statistică, metodelor științifice și analizelor de date – toate acestea fiind utilizate pentru extragerea semnificațiilor și informațiilor din date.
  • Machine learning este un alt subset al AI, care include tehnicile necesare instruirii unui computer în vederea extragerii informațiilor din date și furnizării de aplicații AI.
    Și ca măsură de siguranță, vă prezentăm o altă definiție.
  • Instruire aprofundată , care este un subset al machine learning cu ajutorul căruia computerele pot rezolva probleme mai complexe.

Modul în care știința datelor transformă afacerile

Organizațiile utilizează știința datelor pentru a transforma datele în avantaje competitive, prin îmbunătățirea produselor și serviciilor. Cazurile de utilizare a științei datelor și a tehnologiei machine learning includ:

  • Identificarea utilizatorilor care este posibil să renunțe la produsele sau serviciile dvs., prin analizarea datelor colectate de la centrele de apel, astfel încât departamentul de marketing să ia măsuri pentru a-i reține
  • Îmbunătățirea eficienței, prin analizarea modelelor de trafic, a condițiilor meteo și a altor factori, astfel încât companiile de logistică să-și îmbunătățească vitezele de livrare și să-și micșoreze costurile.
  • Îmbunătățirea diagnosticelor pacienților, prin analiza datelor testelor clinice și a simptomelor prezentate, astfel încât medicii să poată diagnostica din timp afecțiunile și să le trateze mai eficient.
  • Optimizarea lanțului de aprovizionare prin anticiparea momentelor în care echipamentele se vor defecta
  • Detectarea fraudelor din serviciile financiare prin recunoașterea comportamentelor suspecte și a acțiunilor neobișnuite
  • Îmbunătățirea vânzărilor prin crearea unor recomandări făcute clienților, în funcție de achizițiile anterioare.

Multe companii au făcut din știința datelor o prioritate și investesc masiv în aceasta. În sondajul recent Gartner, peste 3.000 de directori IT au clasat analizele și business intelligence drept tehnologii de top pentru organizațiile lor. Directorii IT intervievați consideră aceste tehnologii ca fiind extrem de strategice pentru companiile lor și investesc în consecință.

Cum se efectuează știința datelor

Procesul de analiză și de acțiune pe baza acestor date este mai mult iterativ decât liniar, dar acesta este modul obișnuit în care se desfășoară ciclul de viață din știința datelor, pentru un proiect de modelare a datelor.

Planificare: definește un proiect și posibilele sale rezultate.

Crearea unui model de date:  experții în date utilizează frecvent diverse biblioteci open source sau instrumente din cadrul bazelor de date pentru a crea modele de machine learning. Adesea, utilizatorii vor dori interfețe API care să-i ajute la colectarea datelor, crearea profilurilor de date și vizualizarea acestora sau la proiectarea caracteristicilor. De asemenea, vor dori și instrumentele adecvate și accesul la datele corecte sau la alte resurse, cum ar fi puterea de calcul.

Evaluarea unui model:  experții în date trebuie să obțină modele cu un procent ridicat al preciziei, înainte de a fi siguri că le pot implementa. Evaluarea modelelor va genera, de regulă, un set cuprinzător de indicatori și vizualizări de evaluare pentru măsurarea performanțelor modelelor în contextul noilor date și le va clasifica, de asemenea, în timp pentru a oferi performanțe optime în producție. Evaluarea modelelor trece dincolo de evaluarea brută a performanțelor care trebuie luată în considerare pentru comportamentul de bază așteptat.

Explicarea modelelor:  explicarea mecanismelor interne ale rezultatelor oferite de modelele de machine learning pe înțelesul tuturor nu este posibilă întotdeauna – dar devine tot mai importantă. Experții în date doresc explicații automate privind ponderea și importanța factorilor luați în considerare la generarea unei estimări și detalii explicative specifice modelului, referitoare la estimările modelului.

Implementarea unui model:  introducerea unui model instruit de machine learning în sistemele potrivite este adesea un proces dificil și laborios. Acest proces poate fi simplificat prin crearea unor modele funcționale sub forma unor interfețe API scalabile și securizate sau prin utilizarea unor modele de machine learning din cadrul bazei de date.

Monitorizarea modelelor:  din păcate, implementarea unui model nu reprezintă sfârșitul procesului. După implementare, modelele trebuie monitorizate permanent, pentru a vă asigura că acestea funcționează corespunzător. Este posibil ca, după o anumită perioadă de timp, datele care au instruit modelul să nu mai fie relevante pentru estimările viitoare. De exemplu, în cazul detectării fraudelor, atacatorii găsesc mereu noi metode de a sparge conturile.

Instrumente pentru știința datelor

Crearea, evaluarea, implementarea și monitorizarea modelelor de machine learning pot fi procese complexe. Din acest motiv, s-a înregistrat o creștere a numărului de instrumente pentru știința datelor. Experții în date utilizează mai multe tipuri de instrumente, dar unele dintre cele mai frecvent utilizate sunt aplicațiile open source de tip „notebook”, care sunt aplicații web pentru scrierea și rularea codului, vizualizarea datelor și vizualizarea rezultatelor – toate în același mediu.

Jupyter, RStudio și Zeppelin sunt unele dintre cele mai cunoscute notebookuri. Notebookurile sunt foarte utile pentru efectuarea analizelor, dar au propriile limitări atunci când experții în date doresc să lucreze ca o echipă. Pentru rezolvarea acestei probleme, au fost create platformele pentru știința datelor.

Pentru a stabili ce instrument din știința datelor vi se potrivește, este important să puneți următoarea întrebare: ce fel de limbaj utilizează experții dvs. în date? Ce metode de lucru preferă aceștia? Ce tipuri de surse de date utilizează?

De exemplu, unii utilizatori preferă un serviciu independent pentru surse de date care utilizează baze de date open source. Alții preferă viteza algoritmilor de machine learning ai bazelor de date.


Cine supraveghează procesele de știința datelor?

Pentru majoritatea organizațiilor, procesele de știința datelor sunt supervizate de trei tipuri de manageri:

Managerii de afaceri:  acești manageri lucrează cu echipa de experți în date pentru a identifica problemele și a crea o strategie de analiză. Aceștia pot fi conducătorii unui domeniu de afaceri, precum marketing, finanțe sau vânzări și au o echipă de știința datelor care le raportează. Ei colaborează strâns cu experții în date și cu managerii IT, pentru a asigura livrarea proiectelor.

Managerii IT:  managerii IT seniori răspund de infrastructura și de arhitectura care sprijină operațiunile de știință a datelor. Aceștia monitorizează permanent operațiunile și gradul de utilizare a resurselor, pentru a se asigura că echipele de știința datelor își desfășoară activitatea eficient și securizat. De asemenea, ei răspund de crearea și actualizarea mediilor IT ale echipelor de știința datelor.

Managerii pentru știința datelor: acești manageri supraveghează echipa de experți în date și activitatea lor zilnică. Ei sunt creatorii echipei și pot echilibra dezvoltarea acesteia prin planificarea și monitorizarea proiectelor.

Dar cel mai important rol în acest proces îl are expertul în date.

Ce este un expert în date?

Ca specialitate, știința datelor este tânără. A apărut din domeniile analizei statistice și al colectării de date. Data Science Journal, fondat în 2002, publicat de Consiliul internațional pentru știință: Comisia pentru datele pentru știință și tehnologie. Denumirea de expert în date a apărut în 2008 și domeniul a început să se dezvolte rapid. De atunci, a existat o lipsă de experți în date, chiar dacă tot mai multe colegii și universități au început să ofere diplome pentru știința datelor.

Obligațiile unui expert în date pot include dezvoltarea strategiilor pentru analizele datelor, pregătirea datelor pentru analize, explorare și vizualizare, crearea modelelor de date utilizând limbaje de programare cum ar fi Python și R și implementarea modelelor în aplicații.

Expertul în date nu lucrează singur. De fapt, cea mai eficientă știință a datelor se face în echipă. Pe lângă un expert în date, această echipă ar putea include un analist de afaceri care definește problemele, un inginer de date care pregătește datele și modul în care sunt accesate, un arhitect IT care supraveghează procesele și infrastructura de bază și un dezvoltator de aplicații care implementează modelele sau rezultatele analizelor în aplicații și în produse.

Provocările care apar la implementarea proiectelor de știința datelor

În ciuda promisiunii științei datelor și a investițiilor uriașe în echipele de știința datelor, multe companii nu își dau seama de valoarea completă a datelor. În cursa lor de a angaja talente și de a crea programe de știința datelor, unele companii au experimentat fluxuri ineficiente de lucru în echipă, cu persoane care utilizează instrumente și procese diferite care nu funcționează bine împreună. Fără un management mai disciplinat și centralizat, este posibil ca rolurile de decizie să nu realizeze o rentabilitate a investițiilor.

Acest mediu haotic prezintă multe provocări.

Experții în date nu pot lucra eficient. Deoarece accesul la date trebuie să fie acordat de un administrator IT, experții în date așteaptă adeseori mult timp pentru datele și resursele de care au nevoie pentru analiză. După obținerea accesului, experții în date pot analiza datele utilizând instrumente diferite - și, posibil, incompatibile. De exemplu, un om de știință ar putea dezvolta un model folosind limbajul R, dar aplicația în care va fi utilizat este scrisă într-un alt limbaj. Din acest motiv, implementarea modelelor în aplicații utile poate dura săptămâni sau chiar luni.

Dezvoltatorii de aplicații nu pot accesa un machine learning utilizabil. Uneori, modelele de machine learning pe care le primesc dezvoltatorii nu sunt pregătite pentru implementarea în aplicații. Și deoarece punctele de acces pot fi inflexibile, modelele nu pot fi implementate în toate scenariile, iar scalabilitatea este transferată dezvoltatorului aplicației.

Administratorii IT cheltuiesc prea mult timp cu asigurarea suportului. Din cauza creșterii numărului de instrumente open source, departamentul IT trebuie să ofere suport pentru tot mai multe instrumente. De exemplu, un expert în date din marketing ar trebui să utilizeze instrumente diferite față de cele utilizate de un expert în date din finanțe. De asemenea, este posibil ca echipele să aibă fluxuri de lucru diferite, ceea ce înseamnă că departamentul IT trebuie să creeze din nou medii și să le actualizeze în permanență.

Managerii de afaceri sunt prea departe de știința datelor. Fluxurile de lucru ale științei datelor nu sunt întotdeauna integrate în sistemele și procesele decizionale de afaceri, ceea ce face dificilă colaborarea informată a managerilor de afaceri cu experții în date. Fără o integrare mai bună, managerii de afaceri nu pot înțelege de ce durează atât de mult trecerea de la prototip la producție – și este mai puțin probabil să sprijine investițiile în proiecte pe care le consideră prea lente.

Platforma pentru știința datelor oferă funcționalități noi

Multe companii au realizat că, fără o platformă integrată, activitatea de știința datelor a fost ineficientă, nesecurizată și greu de scalat. Această constatare a dus la dezvoltarea platformelor pentru știința datelor. Aceste platforme sunt hub-uri software pe care se desfășoară toate activitățile de știința datelor. O platformă bună reduce multe dintre problemele care apar la implementarea științei datelor și ajută afacerile să-și transforme datele în informații mai rapid și mai eficient.

Cu o platformă centralizată pentru machine learning, experții în date pot lucra într-un mediu care le oferă posibilități de colaborare, utilizând instrumentele open source preferate și având toate activitățile sincronizate de un sistem de control al versiunilor.

Avantajele unei platforme pentru știința datelor

O platformă pentru știința datelor reduce redundanța și stimulează inovația, permițând echipelor să partajeze codul, rezultatele și rapoartele. Aceasta elimină blocajele fluxurilor de activitate, prin simplificarea procesului de gestionare și prin încorporarea celor mai bune practici.

În general, cele mai bune platforme de știința datelor au ca scop:

  • Creșterea productivității experților în date, ajutându-i să furnizeze mai rapid modele, cu erori mai puține.
  • Simplificarea lucrului cu volume mari și cu multe tipuri de date, pentru experții în date.
  • Oferirea unei inteligențe artificiale de încredere, la nivelul întregii companii care să nu fie subiectivă, să poată fi auditată și să poată fi reprodusă.

Platformele de știința datelor sunt create pentru colaborarea între o gamă largă de utilizatori, inclusiv experți în date, personal intern instruit în știința datelor, ingineri de date și ingineri sau specialiști în machine learning. De exemplu, o platformă pentru știința datelor ar putea permite experților în date să implementeze modele precum interfețele API, facilitând integrarea acestora în diferite aplicații. Experții în date pot accesa instrumentele, datele și infrastructura fără a trebui să aștepte după personalul IT.

Cererea de platforme pentru știința datelor a explodat pe piață. De fapt, piața platformelor este de așteptat să crească cu o rată anuală cumulată de peste 39% în următorii ani și se estimează că va atinge 385 miliarde USD până în 2025.

Care sunt cerințele unui expert în date de la o platformă

Dacă sunteți pregătit să explorați funcționalitățile platformelor pentru știința datelor, există câteva funcționalități esențiale care trebuie luate în considerare:

Alegeți un proiect bazat pe UI care stimulează colaborarea. Platforma ar trebui să permită persoanelor să colaboreze pe un model, de la concepție până la dezvoltarea finală. Aceasta ar trebui să ofere fiecărui membru al echipei accesul automat la date și resurse.

Acordați prioritate integrării și flexibilității. Asigurați-vă că platforma include suport pentru cele mai recente instrumente open source, pentru furnizorii celor mai cunoscute sisteme de control al versiunilor, cum ar fi GitHub, GitLab și Bitbucket, precum și integrări strânse cu alte resurse.

Includeți funcționalități la nivel de companie. Asigurați-vă că platforma se poate scala odată cu afacerea dvs., pe măsură ce echipa crește. Platforma trebuie să aibă disponibilitate ridicată, un control robust al accesului și să accepte un număr mare de utilizatori simultani.

Faceți ca știința datelor să devină mai autonomă. Căutați o platformă care să vă degreveze de procesele IT și de cele pentru proiectare și care să ajute experții în date să comute instantaneu între medii, să-și urmărească întreaga activitate și să implementeze cu ușurință modelele în producție.

Asigurați o implementare mai ușoară a modelului. Implementarea și punerea în funcțiune a modelului reprezintă cei mai importanți pași din ciclul de viață al procesului machine learning, dar sunt adesea ignorați. Asigurați-vă că serviciul pe care l-ați ales facilitează punerea în funcțiune a modelelor, indiferent dacă oferă interfețe API sau dacă permite utilizatorilor să creeze modele într-un mod care să permită o integrare ușoară.

Atunci când o platformă pentru știința datelor reprezintă soluția corectă

Organizația dvs. poate fi pregătită pentru o platformă de știința datelor, dacă ați observat că:

  • Productivitatea și colaborarea par să se reducă
  • Modelele de machine learning nu pot fi auditate sau reproduse
  • Modelele nu reușesc să intre în producție

O platformă de știința datelor poate oferi valoare reală afacerii dvs. Platforma pentru știința datelor de la Oracle include o gamă largă de servicii, care oferă o experiență cuprinzătoare și completă destinată accelerării procesului de implementare a modelelor și îmbunătățirii rezultatelor furnizate de știința datelor.