Bilim İnsanlarının ve Veri Analistcilerinin Kullandığı Programlama Dilleri

0

Dijital dünyada bir gün değil, bir dakika içinde bile o kadar fazla veri üretilmektedir ki bunların anlamlı hale getirilmesi için bile bir bilim dalı ortaya çıkmıştır. Günümüzde nesnelerin interneti teknolojisi kapsamında bile üretilen büyük miktardaki verinin işlenmesi için analistler oldukça fazla çaba sarfetmektedirler.

Geleceğin önemli iş kollarından birisi haline gelecek olan veri madenciliği konusunda çalışma yapmak isteyip, nereden başlayacağını bilmeyenler için bu yazımda; veri biliminde kullanılan programlama dillerinden bahsedeceğim.

Büyük veri konusunda çalışan bilim insanları ve veri analistleri arasında popüler olan programlama dillerini sıralayarak makalemize devam edelim.

R

dataanalistsprograms_012

R programlama dili; veriyi anlamlandırmak için kullanılan analitik yöntemler kapsamında geliştirilmiş, istatistiksel paket ve programlama dilleri içinde son yıllarda  popülaritesini giderek artıran, iki milyondan fazla kişi tarafından kullanılan bir dildir. Büyük veri işlemede etkin bir rolü olan R dilinin kullanımı günümüzde oldukça artmıştır. R dili üzerine büyük veri ambarları ve Hadoop kapsamında kurumsal çözümler üreten Revolution Analytics firmasının, Nisan 2015 başında Microsoft tarafından satın alınması, bu dilin önemini ortaya koymaktadır.

İstatistiksel çıkarım yapmak için kullanılan teknik ve algoritmaların hazır olarak kullanımı amacıyla geliştirilen kütüphaneleri barındıran, buna makine öğrenmesi algoritmalarının da eklendiği R dilinin, fonksiyon tabanlı ve nesne bazlı bir dil olması, rakipleri ile fark yaratmasına sebep olmaktadır.

Ayrıca, açık kaynak kodlu ve ücretsiz ulaşılabilmesi, çok geniş kitleler tarafından kullanılan ve birçok veri işleme ve veri madenciliği yazılımının çözümüne dahil ettiği ortak çözüm dili olma yolunda emin adımlarla ilerlemesini sağlamaktadır.

Python

dataanalistsprograms_011

Python; C, C++, Perl, Ruby ve benzerleri gibi bir programlama dili olup, tıpkı diğer programlama dillerinde olduğu gibi, bilgisayara hükmetmenizi sağlayan özelliklere sahiptir.Üstelik pek çok dile kıyasla, öğrenmesi kolay bir programlama dilidir.

Her gün saatler boyunca uğraştığınız işlerinizi, yalnızca birkaç satır Python kodu yardımıyla birkaç saniye içinde tamamlayabilirsiniz.

Python programlama dilini öğrenirseniz, İnternet’te saatlerce ücretsiz PDF birleştirme programı aramak veya profesyonel yazılımlara onlarca dolar para vermek yerine, belgelerinizi birleştirip işinizi görecek programı kendiniz yazabilirsiniz. Python programlama dilinin basit ve temiz söz dizimi, onu pek çok programcı tarafından tercih edilen bir dil haline gelmesine sebep olmuştur.

Python’ın baş geliştiricisi Guido Van Rossum’un 2005 ile 2012 yılları arasında Google’da çalıştığını, 2012 yılının sonlarına doğru Dropbox şirketine geçtiğini söylediğimizde, bu programlama dilinin önemini ve geçerliliğini daha iyi ifade etmiş olurum.

Scala

dataanalistsprograms_013

Scala, Java’ya çok yakın olan bir programlama dilidir. Özelliği; programcının fonksiyonel stilde program yazmasına olanak sağlamasıdır.Dili geliştiren Martin Odersky, zamanında Java compiler versiyonlarından birini yazmış, Haskell ekibinde yer almiş, alanında çok etkili bir akademik uzman olarak değerlendirilmektedir.

Scala, Ruby benzeri bir sözdizimi ile yazılıyor ama Ruby’e göre daha performanslı ve bytecode derlenip çalıştırılabiliyor.

Apple’ın yazılım geliştirme dili olan swift,  scala’dan esinlenip geliştirilmiş ve onun gibi çoklu paradigma ile çalışabilen bir platform olmuştur.

Twitter’ın geçmişte Ruby ile çözemediği sorunları, Scala ile çözdüğü bile söylenmektedir.

SQL

dataanalistsprograms_014

SQL, (İngilizce “Structured Query Language”, Türkçe: Yapılandırılmış Sorgu Dili) verileri yönetmek ve tasarlamak için kullanılan bir veritabanı yönetim aracıdır. SQL herhangi bir veri tabanı ortamında kullanılan bir alt dildir. SQL ile yalnızca veri tabanı üzerinde işlem yapılabilir. SQL’e özgü cümleler kullanılarak veri tabanına kayıt eklenebilir, olan kayıtlar değiştirilebilir, silinebilir ve bu kayıtlardan listeler oluşturulabilir.

Excel

dataanalistsprograms_015

Excel çok güçlü özellikleri barındıran bir programdır. Özellikle Excel’in değişik veritabanlarını kullanabilmesi ona büyük avantajlar sağlar. MSSQL Server, Ms Access, Oracle, MySQL gibi veritabanlarından SQL kodları kullanılarak veriler çekebilir, bu veriler ihtiyaca göre işlenerek Excel’de görsel ara yüzlü, kullanışlı programlar yapılabilir. Excel çoğu kişi tarafından bir program olarak görülse de, geliştirilen makrolar sayesinde programlama dili olarak da kullanılabilir.

Tüm bilgisayar programları genellikle bir arayüz ve bir veritabanı ile çalışır. Kullanıcılara, arayüzler vasıtası ile veritabanına veri girmeyi ve bu verileri ihtiyaca göre işleyerek göstermeyi amaçlar. Excel de diğer tüm programlar gibi, değişik veritabanlarına SQL kodları ile hızlı bir şekilde bağlanma ve bunları işleyerek arayüzde gösterme özelliğine sahiptir.

SAS

dataanalistsprograms_016

Analitikte dünya lideri olan SAS, bu konuda karşılaşılabilecek her türlü zorluğun üstesinden gelebilecek modern ve açık bir mimariye sahiptir. SAS, çevik bir BT için gerekli olan güvenilir, ölçeklenebilir, analitik yönetimi ve idaresi ile veri bilimcilerden iş analistlerine, uygulama geliştiricilerine ve yöneticilere kadar herkese hizmet sunabilecek, buluta hazır bir geliştirme ortamıdır.

Java

dataanalistsprograms_017

Java, Sun Microsystems mühendislerinden James Gosling tarafından geliştirilmeye başlamış açık kodlu, nesneye yönelik, ortamdan bağımsız, yüksek verimli, çok işlevli, yüksek seviye, adım adım işletilen bir programlama dildir.

Yazılımcı Java kodunu yazar. Bu kod bir Java derleyicisi ile derlenir. Sonuçta “bytecode” adı verilen bir tür sanal makine kodu ortaya çıkar. Ortam bağımsızlığını sağlayan bytecode’dur. Çünkü bir kere bytecode oluştuktan sonra yazılım sanal makine içeren tüm işletim sistemlerinde çalışabilmektedir. Bu bytecode Java Sanal Makinesi tarafından işletilir. Bu aşama, her bir bytecode komutunun teker teker yorumlanması ile icra edilebileceği gibi, anında derleme kullanılarak da gerçekleştirilebilir.

MatLab

dataanalistsprograms_018

MATLAB (matrix laboratory), bir sayısal hesaplama yazılımı ve dördüncü nesil programlama dilidir. MATLAB kullanıcıya, matris işleme, fonksiyon ve veri çizme, algoritma uygulama, kullanıcı arayüzü oluşturma, C, C++, Java, ve Fortran gibi diğer dillerde yazılmış programlarla bağlantı imkanı sunar.

MATLAB kullanıcıları; mühendislik, bilim ve ekonomi gibi çeşitli alanlardan oluşmaktadır. MATLAB, yaygın olarak akademik ve araştırma kurumlarında olduğu kadar endüstriyel işletmelerde de  oldukça yoğun kullanılmaktadır.

SPSS

dataanalistsprograms_019

SPSS; istatistiksel analizine yönelik bir bilgisayar programıdır. SPSS özellikle “Sosyal Bilimler” dalında istatistiksel analizde geniş kullanım alanı bulmaktadır. Pazar araştırmacıları, sağlık araştırmacıları, anket şirketleri, devlet kurumları, eğitim araştırmacıları, pazarlama kurumları, “veri madencileri” vb. tarafından da pratik olarak kullanılan bir istatistik yazılımıdır.

Kaynaklar: Devveri.com  istihza.com mehmetsoylu.com wikipedia excelcozumleri.com  sas.com MATLAB  SPSS

 

Cevap bırakın