Python ve R
Son yıllarda veri analizinde Python ve R öne çıktılar. Genel amaçlı bir dil olan Python çok popüler oldu. Büyük şirketler de olmak üzere Python kullanılıyor. Bununla birlikte İstatistik çalışmalarında kullanılan, özellikle akademik çalışmalarda ve azımsanmayacak şekilde yazılım sektöründe, diğer bir yazılım dili de R. Peki, veri bilimi alanında yeni bir yazılım dili öğrenmeye karar verdiğinizde Python mu yoksa R mı olmalı? Bu sorunun esas cevabını “ihtiyaçlarınız” verecek. Bunu belirleyebilmeniz için her iki dilin güçlü ve geliştirmeye açık yönlerini kısaca listeleyelim.
Öncelikle kodlama dilinden başlayalım; Python daha kullanıcı dostu ve öğrenmesi kolay, ama R’da kod yazmanın zor olduğu anlaşılmasın. Eğer kod öbeğiniz büyürse, bakımı Python’da R’a göre daha kolay.
Her kod öbeğini yazamayız, yazmayalım da; kütüphaneler bunun için. Her iki dil için de veri toplama, sınıflama, analizi, manipülasyonu, çizimi kütüphaneleri mevcut. Veri analizinde ve istatistik uygulamalarında R önde görünüyor. R’ın bu işler için kullanışlı geniş kütüphaneleri var. Veri görselleştirmesini de iyi yapıyor. Python’da bu kütüphaneler geliştirilmeye devam ediyor.
Her iki dil de açık kaynak. Python, R’dan daha hızlı çalışıyor; R’da bir çok paketi yüklemeniz gerekiyor. Web uygulamalarda Python’un R’a göre daha becerikli olduğu görülüyor.
Son söz olarak, eğer çalışmalarınız istatistik alanında ise R, zengin kütüphaneleri ile işleri kolaylaştırıcı ve daha güvenilir. Eğer makine öğrenmesi üzerine çalışacaksanız kodların bakımı ve saydığımız birçok özelliği ile Python tercih edilebilir. İlk etapta her ikisini denemek faydalı olur, daha sonra istediğiniz kodlama dilinde derinleşebilirsiniz.
Dr. Öğr.Üyesi Orhan Özaydın, CMA