DATA Analitikası
DATA Elmi
Salam Dostlar.
Bu məqaləmizdə DATA haqqında danışacağıq.
DATA anlayışı hər zaman olmuşdur.Əvvəllər DATA deftərlərdə,xüsusi jurnallarda və s saxlanılırdı.Texnologiya bir qədər irəli gedərək,məlumatları elektron yaddaşlarda saxlamağa imkan yaratdı.Artıq DATA-lar dəftərlərdə deyildə xüsusi yaddaşlarda saxlanılırdı.Misal olaraq excellərdə,RDMS-də yəni əlaqəli məlumat bazalarında.
Bir qədərdə irəli gederək,saxlanılan DATA-ların analız edilməsinə DATA-lar üzərində analitik işlərin aparılmasına başlanıldı.
DATA-larin analiz edilməsi misal üçün satiş ilə məşgul olan bir şirkətin müştəri istəyi və tələblərini ortaya çıxarır.Bununlada şirkət götür qoyunu edər və iləriləyən zaman üçün yol planı hazırlayar.
Hər sektorun özünə uyğun DATA-ları vardır.Satış sahəsi məhsulların,müştərilərin və s analitikasını apara bilər.Bir blogger paylaşdığı blogun nə qədər insanın oxuduğu və oxuyucuların neçəsi qadın neçəsi kişi və yaş aralıqlarının analitikasını apara bilər.Sosial paylaşımlara edilən rəylərində analitikasını aparmaq mümkündür.
Web-dən məlumat çəkmək web scraping adlanır.Bunun üçün xüsusi tools-lar və programlaşdırma kitabxanaları var.Web scraping üçün ayrıca məqalə paylaşacağam.
Web sayıtlarından məlumat çəkib analitik işlər aparılmasına nümunə olaraq Amazon.com-da satılan komputer avadanlıqlarının analiz edilməsini nümunə gətirə bilərik. Misal olaraq HDD-lərin analitikasını aparmaq istəyirik.Cədvəl üzrə HDD-lərin həcmi,firması,qiyməti,güzəşt məbləği və çatdırılma müddətinin siyahısını çıxarmaq istəyirik.Bununlada web-dən məlumatları çəkərək statistika formalaşdırırq.
Məlumatlar mənbələrdən toplanılaraq analitik işləri aparılır.
Data analizi üçün bir sıra tools-lar vardır.Data günü gündən böyüyüb iri həcmli olduğu üçün artıq xüsusi program dilləri ilə analitikası aparılır.
Texnologiyanın günü gündən inkişafı DATA-nın
BIG DATA adlanmasına getirib çıxarır.Düşünsəkki bir Facebook istifadəçisiyik və gün ərzində yüzlərlə datanın yaranmasına səbəb oluruq.Bizim kimi minlərlə,milyonlarla istifaçi var.İstifadəçilərin yaratdığı dataları nəzərə alsaq həqiqətəndə datanın BIG DATA adlandırılmasının tam olaraq düzgün olduğunu görərik.Facebook-u misal gətirdik.İri həcmli və sturuktursuz dataları özündə saxlayan bir çox iri həcmli şirkətlər vardir.
Amazon.com-dan bir nümunə daha çəkək.Sözü gedən sayıta daxil olaraq maraqlı gələn hər hansı məhsullara baxırıq,klik etdiyimiz hər bir məhsul öz özlüyündə data yaradır və amazon bu datalardan istifadə edərək bizə məhsul təklifləri edir.Bu metod Amazonun istifadə etdiyi xüsusi alqoritmdir.Bu alqoritm müştəri maraqlarını cəm edərək ona hansı məhsulu təklif edəcəyini təyin edir.
Dataları analiz etmək üçün Facebook,Amazon.com olmağımıza ehtiyac yoxdur.
Hər bir təşkilat özünə məxsus olan datalar üzərində analitik işləri apara bilər.
N sayda və Unstructured yəni sturuktursuz formada olan dataların analitikasını necə apara bilər və nəcə ayırd edə bilərik?
Sturuktursuz (Unstructured) anlayışına açıqlama gətirək.Bildiyimiz kimi SQL (Structured Query Language) yəni sturukturlaşdırılmış sorğu dili adlanır.Relational-dır yeni əlaqəli database-dir.Məlumatlar cədvəllərdə əlaqəli formada normallaşdırılmış şəkildə saxlanılır.
Böyük DATA-lar NOSQL əsaslı Unstructured yeni sturuktursuz database-lərdə saxlanılır.
DATA anlayışlarında məlumatların analitikası üçün əsas bir çox program dili vardır.
1) Python
2) R
3) Java
4) Scala
5) GO
Ən papular istifadə olunan Python dilidir.Bizdə onun üzərində dayanmaqda məqsədliyik.
DATA analitikası üçün Pythondan başqa ən çox istifadə olunan dil R dilidir.
Data analitikası üçün Python-un bu iş üçün xüsusi library-ləri (kitabxanaları var)
Misal olaraq Pandas,Numpy,Scipy,Matplotlib,Seaborn,Scrapy və s
Python çox mükəmməl və öyrənməsi asan bir dildir.
Zaman zaman library-lərdən məqalələr yazmağa çalışacağıq.
DATA elmi zamanın peşəsidir.Bu peşədə irəliləmək üçün üç istiqamət var..
1) Data analytics (Data analitikası)
2) Data Engineering (Data Mühəndisliyi)
3) Data Science (Data Elmi)
1) Data analist datanın analizi və vizualizasiyası ilə məşğul olan şəxsdir.
Bacarıqları: SQL,Python,SAS,Excel və s.
2) Data Engineer.Yəni data mühəndisi.
Data mühəndisləri data istehlakı ilə məşğul olurlar.Data analitiklərinin analiz etmələri üçün qaynaqlardan data toplayırlar.
Bacarıqları: Python ,Pig ,Hive ,Hadoop ,MapReduce
3) Data Scientist-Bir sözünən data alimi
Bacarıqları : Python ,R ,SQL ,Pig ,SAS ,Apache Spark ,Hadoop ,Java ,Perl
Tövsiyyə olaraq ilk öncə data analitikasını öyrənilməyə başlanılmalı olduğunu diyə bilərəm.
Növbəti məqalələrdə görüşənədək.
Hörmətlə: Qərib Əsgəri Həsənov