Veri Bilimi nedir?

Veri bilimi sürecini kim denetliyor?

Çoğu kurumda veri bilimi projeleri, genellikle üç tür yönetici tarafından denetlenir:

İşletme yöneticileri:  Bu yöneticiler, sorunu tanımlamak ve analiz stratejisi geliştirmek üzere veri bilimi ekibi ile birlikte çalışır. Pazarlama, finans veya satış gibi bir iş kolunun yöneticisi olabilirler ve bu yöneticilere bağlı çalışan bir veri bilimi ekibi bulunur. Projelerin teslim edilmesini sağlamak üzere veri bilimi ve BT yöneticileriyle yakın çalışma yürütürler.

BT yöneticileri:  Kıdemli BT yöneticileri, veri bilimi operasyonlarını destekleyecek altyapı ve mimariden sorumludur. Veri bilimi ekiplerinin verimli ve güven içinde çalışmasını sağlamak üzere operasyonları ve kaynak kullanımını sürekli izlerler. Aynı zamanda veri bilimi ekipleri için BT ortamlarının oluşturulması ve güncellenmesi sorumluluğunu üstlenmiş olabilirler.

Veri bilimi yöneticileri:  Bu yöneticiler, veri bilimi ekibini ve günlük faaliyetlerini gözetir. Ekip gelişimini proje planlama ve izleme ile dengeleyebilecek ekip kuruculardır.

Ancak bu süreçteki en önemli oyuncu veri bilimcidir.

Veri bilimci kimdir?

Veri bilimi bir uzmanlık olarak henüz gençlik döneminde. İstatistiksel analiz ve veri madenciliği alanlarından ortaya çıktı. Data Science Journal 2002 yılında International Council for Science: Committee on Data for Science and Technology tarafından yayımlanarak yayın hayatına başladı. 2008 yılına gelindiğinde veri uzmanı unvanı ortaya çıktı ve kısa süre içinde bu alanda büyük ilerlemeler kaydedildi. Giderek daha fazla sayıda kolej ve üniversitede veri bilimi bölümleri açılmaya başlansa da o zamandan bu yana yeterince veri uzmanı bulunamıyor.

Veri bilimcilerin görevleri arasında verileri analiz etmek için strateji geliştirme, verileri analiz için hazırlama, verileri keşfetme, analiz etme ve görselleştirme, Python ve R gibi programlama dillerini kullanarak verilerle birlikte modeller oluşturma ve modelleri uygulama yazılımlarına konuşlandırma sayılabilir.

Veri uzmanları tek başına çalışmaz. Hatta en etkili veri bilimi, ekipler hâlinde yapılır. Bu ekip veri bilimciye ek olarak, sorunu tanımlayan bir iş analistinden, verileri hazırlayan ve verilere nasıl erişileceğini belirleyen bir veri mühendisinden, altta yatan süreçlere ve altyapıya ilişkin gözetim faaliyetlerini yürüten bir BT mimarından ve modelleri veya analiz sonuçlarını uygulama yazılımlarına ve ürünlere konuşlandıran bir uygulama yazılımı geliştiricisinden oluşur.

Veri bilimi projelerini uygulamanın zorlukları

Veri biliminin vaatlerine ve veri bilimi ekiplerine yapılan büyük yatırımlara rağmen pek çok şirket verilerinin sağladığı değerin tamamımdan yararlanamıyor. Bazı şirketler yetenekleri işe alma ve veri bilimi programları oluşturma konusunda yarışırken farklı çalışanların birlikte iyi çalışmayan araç ve süreçleri kullandığı verimsiz ekip iş akışlarıyla karşılaştı. Yöneticiler, daha disiplinli ve merkezi bir yönetim olmadan yatırımlarının karşılığını tam olarak alamayabilir.

Bu kaos ortamı beraberinde pek çok zorluğu getirir.

Veri uzmanları verimli çalışamıyor. Veri uzmanları, verilere erişim iznini BT yöneticisinin vermesi gerektiğinden genellikle verileri ve bu verileri analiz etmek için gereken kaynakları uzun süre beklemek zorunda kalıyor. Veri bilimi ekibi eriştikleri verileri farklı ve muhtemelen uyumsuz araçları kullanarak analiz ediyor olabilir. Örneğin, bir uzman R dilini kullanarak model geliştirebilir ancak kullanılacağı uygulama yazılımı farklı dilde yazılmış olabilir. Bu nedenle modelleri kullanışlı uygulama yazılımlarına dağıtmak haftalar, hatta aylar sürebilir.

Uygulama yazılımı geliştiricileri kullanılabilir makine öğrenimine erişemiyor. Bazı durumlarda geliştiricilerin aldığı makine öğrenimi modelleri uygulama yazılımlarında konuşlandırmaya hazır olmayabiliyor. Erişim noktaları sabit olabileceği için modeller tüm senaryolarda konuşlandırılamıyor ve ölçeklenebilirlik uygulama yazılımı geliştiricisine bırakılıyor.

BT yöneticileri desteğe çok fazla zaman harcıyor. Açık kaynak araçların çoğalması nedeniyle BT'nin desteklemesi gereken araçlar listesi gittikçe büyüyebilir. Örneğin, pazarlama bölümündeki bir veri uzmanı, finans bölümündeki bir veri uzmanından farklı araçlar kullanabilir. Ekipler de farklı iş akışlarıyla çalışabilir. Bu da BT ekibinin ortamları sürekli yeniden oluşturmasını ve güncellemesini gerektirir.

İş yöneticileri, veri biliminden fazla kopuk. Veri bilimi iş akışları her zaman iş kararlarını alma süreçlerine ve sistemlerine entegre edilmez ve bu durum, iş yöneticilerinin veri uzmanlarıyla bilgiye dayalı bir iş birliği kurmasını zorlaştırır. Daha iyi entegrasyon olmadan, iş yöneticileri neden prototipten üretime kadarki sürecin uzun sürdüğünü anlamakta güçlük çekiyor ve çok yavaş olarak gördükleri projelere yatırım yapılmasını destekleme olasılıkları daha düşük oluyor.

Veri bilimi platformu yeni olanaklar sunar

Pek çok şirket entegre bir platform olmadan veri bilimi çalışmalarının yetersiz, güvenilmez ve ölçeklendirilmesinin zor olduğunu fark etti. Bu farkındalık, veri bilimi platformlarının geliştirilmesine yol açtı. Bu platformlar, tüm veri bilimi çalışmalarının merkezinde yer alan yazılım merkezleridir. İyi bir platform, veri bilimini uygulamadaki zorlukların büyük bir kısmını hafifletir, işletmelerin verilerini daha hızlı ve daha verimli bir şekilde içgörülere dönüştürmelerine yardımcı olur.

Veri bilimcileri, makine öğreniminden yararlanan merkezi bir platform sayesinde en sevdikleri açık kaynaklı araçları kullanarak iş birliğine dayalı bir ortamda çalışabilirler. Ve tüm çalışmaları sürüm kontrol sistemiyle senkronize edilir.

Veri bilimi platformunun avantajları

Veri bilimi platformu, ekiplerin kodu, sonuçları ve raporları paylaşmasına olanak tanıyarak bazı işlemlerin tekrar edilmesini azaltır ve inovasyonu destekler. Yönetimi kolaylaştırarak ve en iyi uygulamaları dâhil ederek iş akışındaki darboğazları ortadan kaldırır.

Genel olarak, en iyi veri bilimi platformları şunları hedefler:

  • Modelleri daha hızlı ve daha az hatayla hızlandırıp ve teslim etmelerine yardımcı olarak veri bilimcilerini daha üretken hâle getirme
  • Veri bilimcilerin büyük hacimli ve çeşitli verilerle çalışmasını kolaylaştırma
  • Önyargısız, denetlenebilir ve yeniden üretilebilir, güvenilir, kurumsal düzeyde yapay zeka sağlama

Veri bilimi platformları uzman veri bilimcileri, vatandaş veri bilimcileri, veri mühendisleri ve makine öğrenimi mühendisleri ya da uzmanları da dâhil olmak üzere çeşitli kullanıcıların iş birliği ile geliştiriliyor. Örneğin, bir veri bilimi platformu veri bilimcilerin modelleri API'ler olarak konuşlandırmasına olanak tanıyarak farklı uygulama yazılımlarına kolayca entegre etmelerini sağlayabilir. Veri uzmanları BT'yi beklemek zorunda kalmadan araçlara, verilere ve altyapıya erişebilir.

Pazarda veri bilimi platformlarına büyük bir rağbet gösteriliyor. Hatta, gelecek yıllarda yüzde 39'dan yüksek bir bileşik yıllık oranla platform pazarının büyümesi ve 2025 yılına dek 385 milyar ABD Doları düzeyine ulaşması bekleniyor.

Veri bilimcilerin platformda ihtiyaç duyduğu özellikler

Veri bilimi platformlarının özelliklerini keşfetmeye hazırsanız göz önünde bulundurmanız gereken bazı temel özellikler şunlardır:

İş birliğini teşvik eden proje tabanlı kullanıcı arayüzü seçin. Platform, çalışanları tasarımdan son geliştirmeye kadar bir model üzerinde birlikte çalışmak üzere donatmalıdır. Her ekip üyesinin veri ve kaynaklara self servis erişim sağlamasına olanak tanımalıdır.

Entegrasyon ve esnekliği önceliklendirin. Platformun en yeni açık kaynaklı araçlara yönelik destek sunmasını; GitHub, GitLab ve Bitbucket gibi yaygın sürüm kontrol sağlayıcılarını içermesini ve diğer kaynaklar ile sıkı entegrasyon sunmasını sağlayın.

Kurumsal sınıf özellikleri dâhil edin. Ekibiniz büyüdükçe platformun işletmenizle ölçeklenebilmesini sağlayın. Platform yüksek düzeyde erişilebilir olmalı, sağlam erişim kontrolleri içermeli ve çok sayıda eşzamanlı kullanıcıyı desteklemelidir.

Veri bilimini daha self servis hâle getirin. BT ve mühendislik ekiplerinin yükünü azaltan, veri bilimcilerin ortamları anında yaratmasını ve tüm çalışmalarını takip etmesini kolaylaştıran, modelleri üretime kolayca konuşlandırmasını sağlayan bir platform arayın.

Daha kolay model konuşlandırması sağlayın. Model konuşlandırma ve çalıştırma, makine öğrenimi yaşam döngüsünün en önemli adımlarından biridir ama genellikle göz ardı edilir. Gerek API sağlar gerekse kullanıcıların modelleri kolay entegrasyona olanak tanıyan bir şekilde geliştirmesini mümkün kılarken seçtiğiniz servisin modelleri çalıştırmayı daha kolay hâle getirdiğinden emin olun.

Bir veri bilimi platformu ne zaman doğru hamledir

Şunları fark ettiyseniz kurumunuz bir veri bilimi platformuna hazır olabilir:

  • Üretkenlik ve iş birliğinde zorlanma belirtileri görülüyor
  • Makine öğrenimi modelleri denetlenemiyor veya yeniden üretilemiyor
  • Modeller üretim aşamasına asla ulaşamıyor

Bir veri bilimi platformu, işletmenize gerçek değer getirebilir. Oracle'ın veri bilimi platformu, model konuşlandırmayı hızlandırmak ve veri bilimi sonuçlarını daha iyi hâle getirmek için tasarlanmış kapsamlı, uçtan uca bir deneyim sağlayan çok çeşitli hizmetler içerir.