media-videoedited
media-data-analytics-1024x683
media-teacher-appreciation-dayteachers-day-made-with-postermywall
media-103985052_101640728265039_3805622317863013743_n

Yusif YUSİFOV,
Dövlət Statistika Komitəsi sədrinin müavini, iqtisad üzrə fəlsəfə doktoru

Son illər cəmiyyətdə “statistik məlumatlara görə”, “rəsmi statistikaya əsasən”, “məlumatlar təsdiq edir ki” ifadələrindən istifadə hallarında azalma, “data analitiklər hesablayıb ki”, “big data təhlilinə görə” və s. bu kimi ifadələrdən istifadə hallarında isə əksinə, artım tendensiyası müşahidə olunur. İlk illərdə data, data analitika, big data kimi ifadələrdən xüsusi hallarda, durğu işarəsinin köməyi ilə istifadə olunurdusa, artıq bu gün həmin ifadələr hətta müqayisəli paralellik baxımından daha üstün şəkildə təqdim olunur. Bu proses müəyyən zaman kəsiyinə xas müvəqqəti “dalğa”dırmı, yoxsa dayanıqlı və geriyədönməz xarakter daşımaqla dövlət idarəetməsində, elm və təhsildə və s. sahələrdə qərar qəbul edənlərə məlumatların artan təsiri fonunda əhəmiyyətli şəkildə təsir göstərməkdə davam edəcəkdir?

Qeyd olunan məsələ ilə bağlı alimlər, tədqiqatçılar, uğur qazanmasında məlumatların gücündən məharətlə istifadə etmiş məşhur şirkətlərin menecerləri, peşəkar statistiklər, ümumiyyətlə məlumat istehsalçıları və istifadəçiləri arasında müxtəlif yanaşmalar mövcuddur. Araşdırmalar göstərir ki, bir qrup elmi aparıcı qüvvə statistikanı xam material və ölçü vahidi olmayan, sosial-iqtisadi dəyəri formalaşmamış ilkin rəqəm kimi xarakterizə edərək, məlumatların emalını və təhlilini də yalnız riyaziyyatla əlaqələndirməklə riyazi statistika, başqa bir qrup iqtisadi hadisə və proseslərin ölçülməsi vasitəsi kimi qiymətləndirməklə ekonometrika, müasir dövrdə yeni formalaşan üçüncü qrup isə informasiya texnologiyalarının verdiyi əlahiddə üstünlük çərçivəsində məlumatlar elmi çətirinə salmaq üstündə rəqabət aparırlar. Maraqlı fakt ondan ibarətdir ki, son illər fikrimizə görə üçüncü sadalanan qrupun üstünlüyü daha çox müşahidə olunur və haqlı olaraq sual yaranır. Statistika elmi konseptual baxış bucağından necə görünür? Statistika “big data” üzərində formalaşan məlumat elmi, eləcə də riyazi statistika, ekonometrika ilə nə qədər kəsişir? Yoxsa ictimai elm kimi sosial, iqtisadi, demoqrafik, ekoloji sferaların statistik uçotu prinsiplərinə əsaslanır və məhz bununla məhdudlaşır? Və yaxud əksinə, qeyd olunanlar statistikanın sahələridir? Statistika yalnız rəqəmlərdən ibarətdir? Onun formalaşması, idarə olunması, o cümlədən rəsmi statistikanın əhatə dairəsi, təşkili, istifadəçi tələbatının qarşılanması, keyfiyyətin idarə olunması, məlumatların yayılması, milli və beynəlxalq statistika sistemi və s. kimi konseptual məsələlər də data və “big data” konsepsiyasına daxildir? Bütün bunlara aydınlıq gətirmək və maraqlı tərəfləri düzgün istiqamətləndirmək üçün ilk növbədə yuxarıda sadalanan sahələrin nəzəri-praktiki fəlsəfəsinə baxmaq, müqayisəli təhlillər aparmaq, statistika – “big data” – məlumat elmi üçlüyünün qarşılıqlı əlaqələrini, üstünlüklərini və çatışmazlıqlarını tədqiq etmək lazımdır. Əks halda indi üstün hesab etdiyimiz azsaylı – obrazlı desək dəbdə olan müvəqqəti dəyərlər və onların səhv təbliği fonunda ümumbəşəri beynəlxalq standartlar, müqayisəlilik, keyfiyyətlilik və s. bu kimi fundamental dəyərlərin azalması və ya statistika elminin intensiv inkişafının müvəqqəti ləngiməsi təhlükəsi ilə üzləşməli olacağıq.

Təhlilə keçməmişdən əvvəl qeyd etmək lazımdır ki, sözügedən məsələ ilə bağlı ilk “kiçik dalğa” ötən əsrin 90-cı illərində, ənənəvi məlumatlarla yanaşı, yeni mənbələr hesabına sürətlə yaranan və emalı çətin olan irihəcmli məlumatların – “Big data”nın və bu kontekstdə əsas etibarilə intellektual təhlil metodlarını özündə ehtiva edən məlumatlar elmi anlayışının meydana gəlməsi dövründə yaranmışdır. Təsadüfi deyil ki, ötən qısa müddət ərzində “Big data”nın kompüterlər vasitəsilə təhlilində riyazi hesablama sisteminin nəzəriyyəçiləri, məlumat elminin aparıcı mütəxəssisləri və statistiklər dəfələrlə bir araya gəlmiş və bu istiqamətdə 100-dən çox elmi işlər və müzakirələr aparılmışdır [1]. Bu kontekstdə Statistika Cəmiyyətləri Prezidentləri Komitəsinin Prezident mükafatçıları olmuş ABŞ-nin Corciya Texnologiya İnstitutunun professoru Jeff Vu (C. F. Jeff Wu), “R” statistik proqramlaşdırma sahəsində məşhurlaşmış Yeni Zelandiyalı, Auklənd və Stenford universitetlərinin professoru Hadley Vikhem (Hadley Wickham) və ABŞ-nin Dyuk Universitetinin professoru David Dunsonun (David B.Dunson) baxışlarına nəzərə yetirək. Jeff Vu açıq mühazirə ilə çıxış edərək məlumatlara əlçatanlıq və təhlil baxımından daha geniş alqoritm və modelləşdirmə imkanlarına malik olduğunu əsas gətirməklə statistika elminin məlumatlar elmi adlandırılması təklifini irəli sürmüşdür. Hadley Vikhemin gəldiyi qənaətə görə “statistika məlumat elminin ən əsas hissəsidir”, David Dunsona görə isə “məlumat elminin əhəmiyyətli hissəsi statistika deyil”. Məlumat elmi ilə bağlı fundamental nəşrlərin – “Məlumat elminə giriş” və “R”-la biznes üçün məlumat elmi” nəşrlərinin müəllifləri Jeffri Saltz (Jeffrey Saltz) və Jefri Stanton (Jeffrey M. Stanton) hesab edirlər ki, məlumat elmi riyaziyyat, statistika və kompüter elmləri ilə sıx bağlı bir sahədir [1]. Beləliklə, peşəkar statistiklər üçün bu həyəcan siqnalı yeni deyil, statistika cəmiyyəti üçün tanış mövzudur, riyaziyyatçılar, kompüter elmləri peşəkarları və məlumat elmi sahəsində çalışan mütəxəssislər və bu sahəyə maraq göstərənlər arasında populyardır, qərar qəbul edənlər üçün sualdır.

Gəlin ilk növbədə məsələyə bəşəri dəyərlər fonunda, klassik yanaşma ilə baxaq və təriflərə nəzər yetirək. Statistika elmi və məlumatı nədir? İlk dövlətlərin yaranması ilə paralel tətbiq olunmasına baxmayaraq, statistika terminini elmi anlayış kimi cəmiyyətə 1746-cı ildə təqdim etmiş alman alimi Qotfrid Axenvalın (Gottfried Achenwall) fikrinə görə statistika dövlətə aid tarixi və mövcud faktların toplanmasıdır [2]. O, məsələyə fəlsəfi yanaşaraq statistikanı uçot növü kimi xarakterizə etmişdir. XX əsrin əvvəllərində ən qabaqcıl məşhur ingilis nəzəri və praktiki statistiki və statistikaya tərif verməyə çalışan Artur Bouli (Arthur Lyon Bowley) statistikanı faktları xarakterizə edən kəmiyyətlər arasında qanunauyğunluq əlaqələri kimi təsvir etmişdir [3]. Fəaliyyəti XX əsrin ortalarına təsadüf edən professor Anson Boddinqtona (Anson Lester Boddington) görə statistika qiymətləndirmə və ehtimallar elmidir [3]. “Ümumi tətbiqi statistika” kitabının müəllifləri F.Krokston və D.Kouden (F.E.Croxton, D.J.Cowden) statistikanı kəmiyyətləri toplayan, təqdim, təhlil və şərh edən elm kimi qiymətləndirmişdir [3]. Hazırki praktikada statistikanın ümumi konsepsiyasına daha yaxın olan, riyaziyyatın tətbiqi ilə statistikanın güclü inkişafına nail olmuş, Karl Marksın “statistikanın yaradıcısı” hesab etdiyi Vilyam Pettiyə (William Petty) görə isə statistika hadisə və faktları öyrənir, onların təhlilini aparır [4]. Bu tərif və anlayışların siyahısını digər məşhur alimlərin qənaətlərinə görə çox genişləndirmək olar. Təriflərin zamana görə ümumiləşdirilmiş xronikası göstərir ki, ötən üç əsrə yaxın müddətdə, digər elmlərin də inkişafı fonunda statistikanın adı dəyişməmiş, əksinə yeni sub-predmetlər hesabına statistika elmi inkişaf etdirilmiş, məzmunu təkmilləşdirilmişdir.

Bəs müasir dövrdə necə olmalıdır? Statistika elminin tətbiqi ilə toplanan, emal olunan və istehsal edilən məlumat necə adlandırılmalıdır? Statistik məlumat, yaxud data, rəqəm? Sualı başqa formada qoysaq, müasir məlumat elminin tətbiqi nəticəsində istehsal olunan məlumat necə adlandırılmalıdır? Data, yaxud statistika? Bu qaydada sualları və onların cavab versiyalarını artırmamaq üçün məsələyə praktiki tərəfdən, yəni nəzəri baxışlardan asılı olmayaraq istehsal olunan məhsulun – məlumatın istifadə məqsədlərinə və onun adekvatlılığına baxaq. Bu, yaşadığımız bazar iqtisadiyyatı prinsipləri baxımından daha düzgündür.

Məlum olduğu kimi, istər statistik məlumat, istərsə də digər məlumat (data və s.) dövlət, biznes və vətəndaş cəmiyyətində qərarların qəbulu üçün əvəzedilməz mənbədir. Həmin məlumatlara olan tələbin həcmini və məzmununu da istifadəçi formalaşdırır və onlar üçün məlumatlar aktual, dəqiq, vaxtlı-vaxtında, hamı üçün əlçatan, müqayisə oluna bilən olmalıdır. İki mötəbər mənbəyə əsaslanaraq istifadəçi baxışını ümumi fikirlərlə şərh edək. Birinci mənbə: BMT-nin Baş Assembleyası tərəfindən 1994-cü ildə təsdiq edilmiş Rəsmi Statistikanın Fundamental Prinsiplərində [5] qeyd olunur ki, rəsmi statistika özündə iqtisadi, demoqrafik, sosial və ekoloji vəziyyət haqqında məlumatlarla idarəetmə orqanlarına, iqtisadi subyektlərə və ictimaiyyətə təqdim olunan məlumatların, demokratik cəmiyyətin informasiya sisteminin əvəz olunmaz elementini əks etdirir. Bu məqsədlə, praktiki dəyərə malik olan rəsmi statistika məlumatları, vətəndaşların ictimai məlumatları almaq hüquqlarına hörməti təmin etmək üçün ədalətlilik əsasında dövlət statistika orqanları tərəfindən yığılmalı və yayılmalıdır. Rəsmi statistikaya olan inamı saxlamaq məqsədilə, elmi prinsipləri və peşəkarlıq etikası da nəzərə alınmaqla, ciddi şəkildə peşəkarlıq mülahizələrini əldə rəhbər tutmaqla, statistika orqanları statistik məlumatların toplanması, işlənməsi, saxlanması və təqdim edilməsinin metod və qaydaları barədə qərarlar qəbul etməli, məlumatların düzgün şərhinə yardım göstərmək üçün statistik məlumat mənbələri, statistik metod və qaydalara dair informasiyanı elmi standartlara uyğun təqdim etməli, məlumat istehsalında beynəlxalq konsepsiyalardan, təsnifatlardan və metodlardan istifadə olunmalıdır. Beləliklə, statistika məlumatlarının istehsalına dair fundamental prinsiplərə görə statistika ümumbəşəri xüsusiyyətə malikdir. İkinci mənbə: Avropa Statistikasının Normalar Məcəlləsinə [6] görə bütün fəaliyyətlər onunla nəticələnməlidir ki, məlumatlar keyfiyyətli olsun. Həmin məcəllənin 16 tələbindən bir neçəsinin şərhini verək. 14-cü prinsipin tələbinə görə statistik məlumatlar uyğunluğa malik və müqayisə oluna bilən olmalıdır. Yəni statistika daxili və zaman baxımından uyğun olmalı, həmçinin müxtəlif region və ölkələr arasında müqayisəliliyi təmin etməli, müxtəlif məlumat mənbələrindən olan əlaqəli məlumatları birləşdirmək və birgə istifadə etmək mümkün olmalıdır. 15-ci prinsipə görə statistika aydın və başa düşülən formada təqdim edilməli, uyğun və rahat üsullarla yayımlanmalı, ictimaiyyət üçün açıq olmalı, müvafiq metaməlumat və təlimatlarla müşayiət olunmalıdır. Yalnız bu iki prinsipə görə qeyd etmək olar ki, statistikanın özəlliyi və üstünlüyü ondan ibarətdir ki, ölçülə bilən kütləvi hadisə və proseslər bütün dünyada eyni tələblər (institusional tələblər də daxil olmaqla) əsasında ölçülməlidir ki, müqayisə oluna bilsinlər. Beləliklə, statistika məlumatlarının istehsalı hamı tərəfindən qəbul olunan beynəlxalq metodologiyalara, standartlara, bir sözlə vahid prinsiplərə söykənir və statistika və ya məlumat elminin tətbiqi qeyd olunan şərtlər daxilində tələbləri ödəməlidir.

İndi isə məlumatlar elmi anlayışına baxaq. Yuxarıda qeyd olunduğu kimi, məlumat elmi anlayışı statistik müşahidələr hesabına formalaşan mənbə ilə bağlı olmayan, alternativ mənbə hesab olunan, emalı çətin olan “Big data”nın yaranması fonunda ortaya çıxmış və ilbəil populyarlaşmışdır. Bundan sonra Jeff Vu (C.F.Jeff Wu) statistikanın adını dəyişərək məlumatlar elmi adlandırmağı təklif etmiş [1], 2001-ci ildə U.Klivlend məlumatlar elminə yönəlik universitet fakültələrinin yaradılması üzrə fəaliyyət planını təqdim etmişdir. Lakin U.Klivlend fəaliyyət planında məlumatlar elminin riyaziyyatla informatika elmi arasında yer aldığını qeyd edir və onu elmlərarası (fənlərası) sfera kimi qəbul etməyi təklif edir [7]. 2001-ci ildə Leo Breyman “Statistik modelləş¬dirmə: iki mədəniyyət” adlı məqaləsində statistikanın ənənəvi yanaşmasını məlumatların modelləşdirilməsi mədəniyyəti kimi xarakterizə edir və təhlilin əsas məqsədinin məlumatların necə əldə edilməsini izah edən, gizli sto¬xastik modelləri (məsələn, xətti reqressiya) aşkar etməkdən ibarət olduğunu qeyd edir [8]. O, məlumatların necə əldə edilməsini izah etməyən, daha dəqiq proqnozlaşdırma modellərinin yaradılması üçün kompüter alqoritmlərindən istifadəyə yönəlik alqoritmik modelləşdirmə mədəniyyətini buna qarşı qoyur. Başqa sözlə, əsasında “Big data” dayandığına görə məlumat elmində alqoritmlər və texnologiyalar üstünlük təşkil edir. “Big data” isə ilkin mərhələdə həcm, sürət və müxtəliflik olmaqla 3 V (volume, velocity, variety) konsepsiyasına, sonra isə daha ikisi – dəyər və həqiqilik amilləri əlavə olunmaqla 5 V (velocity, volume, value, variety and veracity) konsepsiyasına əsaslanır. Buradan da aydın olur ki, məlumat elmi “Big data”nın “dəyər və həqiqilik” amilləri hələ ümumi konsepsiyaya daxil olunmamışdan əvvəl meydana gəlmişdir. 3 V konsepsiyası ilk dəfə 2001-ci ildə Meta Group İnc şirkətinin analitiki Douq Laney (Doug Laney) tərəfindən irəli sürülmüş [9], daha sonra 2012-ci ildə isə tamamlilə məntiqi olaraq dəyər və həqiqilik amilləri də əlavə olunmuşdur. Araşdırmalar göstərir ki, son tədqiqatlarda “Big data” 7V (Volume, Velocity, Variety, Veracity, Variability, Visualization, Value.) konsepsiyasına (dəyişkənlik və vizualizasiya parametrləri hesabına) genişlənir [10]. Başqa sözlə, həm 5V, həm də 7V konsepsiyası üzrə baza parametrlərinə əlavə olunan yeni parametrlər məhz rəsmi statistikanın və statistika elminin alətləri hesab olunur.

Daha aydın təsvir etmək üçün Aaxen Universitetinin professoru Vil van der Aalst-ın (Wil van der Aalst) məlumat elminin elementlərini ehtiva edən sxeminə görə məlumat elmi üçün statistika mənbədir [11]. Məlumat elminin tətbiqi ilə data analitik – mütəxəssis deskriptiv (baş vermiş hadisələrin cari tədqiqi), diaqnostik (baş vermiş hadisələrin səbəbinin tədqiqi), prediktiv (gələcəkdə baş verə biləcək hadisənin nəticəsinin müəyyənləşdirilməsi), preskriptiv (baş verə biləcək hadisələrin idarə olunması) analizləri həyata keçirir. Bu məqsədlə o, kompüter, verilənlərin emalı, maşın öyrənmə, riyaziyyat, statistika, tədqiqat, habelə proqram və məlumat mühəndisliyi üzrə bilik və bacarıqlara yiyələnməlidir. Faktiki olaraq bu gün “məlumatlar üzrə mütəxəsis” anlayışı o qədər geniş anlaşılır ki, bu da tələb edilən təcrübə və bacarıqlarda onun rolunu müəyyən etməyi xeyli çətinləşdirir. Məlumat elmində alqoritmlər, proqramlaşdırma dilləri (xüsusilə “R”, “Python” və s.), əlaqəli məlumat bazalarının idarə olunması sistemi (MySQL, NoSQL və s.), “Big data” vasitələri (Apache Hadoop, Apache Spark və s.), statistik proqram paketləri (SAS, SPSS və s.), data vizuallaşdırma vasitələri (Tableau, Matplotlib, Seaborn və s.) və bu kimi digər fundamental kontentlər yer tutur.
Məlumat elmində həyata keçirilən proseslərdə əsas rolu məlumat analitikləri həyata keçirirlər. Onlar statistiklərdən fərqli olaraq dataların təhlili yolu ilə spesifik və ünvanlı problemlərin həllinə fokuslanırlar. Məsələn, bütün müəssisələr potensial olaraq satışdan məlumat toplayır, bazar araşdırması logistikası və ya nəqliyyat xərclərini hesablayır. Məlumat analitikləri bu məlumatları götürür və şirkətlərə daha yaxşı iş qərarları qəbul etməkdə köməklik etmək üçün istifadə edirlər. Bu, pul vəsaitlərinin hərəkəti ilə bağlı tendensiyaların müəyyən edilməsi, işçilərin iş qrafiki, optimal qiymətlər və s. ola bilər.

Beləliklə, hesab edirəm ki, “data” və “big data” statistika üçün istifadə olunan xammal resursudur, onlar konkret faktları xarakterizə edirlər və statistikanın tətbiqi yolu ilə strukturlaşdırıldıqda, təhlil olunmaqla ictimai məna daşıdıqda statistikaya çevrilir. Məlumat elmində isə data analitiklər xammalı, yəni “data” və “big data”nı dərin təhlillər əsasında fərdi qərarların qəbulu üçün hazırlayıb təqdim edirlər, lakin onun təhlilində statistika elminin bir sıra metod və üsullarını tətbiq edirlər. Bu baxımdan peşəkarlar tərəfindən statistika və məlumat elmləri fundamental dəyərlərin “əvəzlənmə” prinsipi ilə deyil, “əlaqələndirmə” prinisipləri əsasında inkişaf etdirilməlidir.

Başqa sözlə, statistika elmi ənənəvi prinsiplərə əsaslanan, ictimai və institusional qərarların qəbulunda vacib rol oynayan sahədir. Məlumat elmi isə daha çox fərdi və biznes yönümlü problemlərin həlli üçün müxtəlif sahələrdən – statistika, riyaziyyat, kompüter elmləri və alqoritmlərdən istifadəyə əsaslanan yanaşmadır.

Ədəbiyyat
1. Hassani, H, Beneki, C, Silva, ES, Vandeput, N & Madsen, DØ 2021, ‘The science of statistics versus data science: what is the future?’, Technological Forecasting and Social Change, vol. 173, 121111. https://doi.org/10.1016/j.techfore.2021.121111
2. https://en.wikipedia.org/wiki/History_of_statistics
3. https://commercestudyguide.com/major-definition-of…/
4. Petty William (1623-1687). Ekonomicheskie i statisticheskie raboti, perevod pod red. M.Smit, Moskva, 1940.
5. https://unstats.un.org/fpos/
6. https://ec.europa.eu/…/european-statistics-code-of…)
7. Cleveland, W. (2001). Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics. International Statistics Review, 69, 21-26.
8. Breiman, L. (2001). Statistical modeling: The two cultures. Statistical Science, 16(3), 199–231.
9. Laney, D. (2001) 3D Data Management: Controlling Data Volume, Velocity and Variety. META Group Research Note, 6.
10. M. Ali-ud-din Khan; Muhammad Fahim Uddin; Navarun Gupta, Seven V’s of Big Data understanding Big Data to extract value
11. Wil van der Aalst, Process Mining: Data Science in Action 2nd ed. 2016 Edition


media-teacher-appreciation-dayteachers-day-made-with-postermywall

Bənzər xəbərlər