বিগ ডাটা কি এবং কেন ?

bigData


বিগ ডাটা কি এবং কেন ?

একটা সময় ছিলো যখন আমরা আমাদের সবকিছুই কাগজে লিখে রাখতাম। কখন খেতে
যাবো, কবে মিটিং, কখন শপিং এ যাবো এসব টু ডু লিস্টগুলো কাগজে কিংবা ডায়েরীতে
লিখে রাখতাম। এমনকি স্যারের কাছে পড়ার লেকচার থেকে শুরু করে দুধওয়ালা কিংবা
পত্রিকার হকারের পেপার দেয়ার হিসেব ও!
প্রযুক্তির অভাবনীয় উন্নয়ন আমাদের জীবন করেছে সহজ এবং স্বাচ্ছন্দ্যময়। তথ্য-
আদান প্রদানের পরিধি দিনের পর দিন বৃদ্ধি পাচ্ছে। সারাক্ষণ একে অন্যের কাছে
বিভিন্ন তথ্য দিচ্ছি বা অন্যের কাছ থেকে তথ্য নিচ্ছি। যেদিন থেকেই ইন্টারনেট
নামক ধারনাটি আমাদের মধ্যে বিকশিত হলো, সেদিন থেকেই এই তথ্য আদান-
প্রদানের মাত্রা অবিশ্বাস্য হারে বৃদ্ধি পাচ্ছে। আচ্ছা আমরা যদি জানার চেষ্টা করি
মানবজাতির সকল সংগ্রহীত ডাটার পরিমাণ কেমন! হুবহু বলতে না পারলেও আন্দাজ
করা যায় ২০০৩ সাল পর্যন্ত আমাদের জমাকৃত ডাটার পরিমাণ প্রায় ৫ বিলিয়ন
গিগাবাইট। বর্তমানে ইন্টারনেট এবং বিভিন্ন সোশ্যাল মিডিয়ার বদৌলতে প্রতিদিন
ডাটার পরিমাণ কয়েকগুণ করে বৃদ্ধি পাচ্ছে।
চলুন একটু পেছনে ফিরে যাই এবং দেখে নেই, টেকনোলজি ওয়ার্ল্ড কিভাবে গত শতক
থেকে রাতারাতি চেঞ্জ হয়ে হয়ে গেছে :
. বর্তমান বিশ্বের শতকরা ৮০ ভাগ ইনফরমেশন এখন আনস্ট্রাকচার্ড(Unstructured).
. আনস্ট্রাকচার্ড ডাটা স্ট্রাকচার্ড(Structured) ডাটা থেকে প্রায় ১৫ গুণ
হারে বাড়ছে।
. ইনফরমেশনগুলো এক্সেস পাওয়া যেন সবারগণতান্ত্রিক অধিকার হয়ে দাঁড়িয়েছে , মা
নে সবার জন্য ইনফরমেশন গুলো এভেইল্যাবল।
. ২০২০ সালের মধ্যে ডাটা ক্রিয়েটিং রেট হবে ৪৪ট্রিলিয়ন গিগাবাইটস। [ফোর্বস ]
আর এই বিভিন্ন ওয়েবে, সেন্সরের মাধ্যমে, পরিবেশগত এবং আমাদের দ্বারা সৃষ্ট সব
ডাটার সমষ্টিকে বলা হয় বিগ ডাটা। এই ডাটার পরিমাণ এত বেশি যে সেগুলোকে
গুটিকয়েক সাধারণ কম্পিউটার দ্বারা বিশ্লেষণ করা অসম্ভব (আংশিকভাবে সম্ভব
হলেও তা বেশ কষ্টসাধ্য)। এসব বিষয় নিয়ে কাজ করে থাকেন ডাটা সায়েন্টিষ্টরা,
নানান রিসার্চার, যারা এসব ডাটাকে অ্যানালাইসিস করেন।


এখন প্রশ্ন হচ্ছে তাহলে বিগডাটা ব্যাপারটা আসলে ঠিক কি ?

নাম থেকেই বোঝা যাচ্ছে যে, এখানে বিশাল পরিমাণ তথ্য নিয়ে কাজ-কারবার। সেই
বিশালতা কেমন? এটা এমনই বিশাল যে, গতানুগতিক ডাটাবেজের পক্ষে একে ধারণ করা
সম্ভব হয় না, তাছাড়া এসব ডাটা এত দ্রুত ও বেশি পরিমানে তৈরি হচ্ছে যে আগেরকার
ডাটা এনালাইসিসের উপায়গুলো দিয়ে এসব ডাটা এনালাইসিস করা সম্ভব হয় না। দরকার
হচ্ছে নতুন প্রযুক্তি, নতুন চিন্তা। সব মিলিয়ে, যদি এমন কোন ডাটা আমরা দেখি যেটা
সাধারণ পদ্ধতিতে আমাদের পক্ষে কোথাও স্টোর বা ধারণ করে রাখা, ওই ডাটা প্রসেস
করা এবং ওই ডাটা থেকে প্রয়োজনিয় তথ্য বের করা সম্ভব না হয় তাহলেই সেই ডাটা
বিগ ডাটা।

Oracle এর মতে,
“Big data describes a holistic information management strategy that
includes and integrates many new types of data and data managementalongside traditional data”.

মুর্দা কথা হচ্ছে বর্তমান টেক ওয়ার্ল্ডে বিগ ডাটা এক ধরণের বাজওয়ার্ড। বিগডাটা
শব্দটা বেশীরভাগ সময় আনস্ট্রাকচার্ড ডেটার ক্ষেত্রে ব্যবহার হয়। তবে
স্ট্রাকচার্ড ডাটার ক্ষেত্রেও বিগডাটার ব্যবহার পরিলক্ষিত হয়। ( যেমন Data
generate by FB and twitter)
অর্থ্যাৎ, ডেটা এমনভাবে আছে যে সরাসরি ব্যবহার করার উপায় নাই। তখন বিভিন্ন
এলগরিদম ব্যবহার করে সেই ডেটা থেকে নানা তথ্য উপাত্ত বের করা হয়।
অ্যালগরিদমগুলো বেশির ভাগ সময় মেশিন লার্নিং আর ন্যাচারাল ল্যাঙ্গুয়েজ
প্রসেসিং এ ব্যবহার করা হয়। কিন্তু এগুলো ছাড়াও শুধু পরিসংখ্যান, লিনিয়ার
এলজেবরা, কিংবা স্ট্রিং প্রসেসিং করেও অনেক তথ্য উপাত্ত বের করে ফেলা যায়।
উল্লেখ্য মেশিন লার্নিং প্রায় সব ডেটা সায়েন্সের ক্ষেত্রেই ব্যবহার করা হয়।

প্রত্যেক টার্মিনোলজির কতগুলো বৈশিষ্ট্য থাকে। বিগ ডাটারও বেশ কয়েকটি
বৈশিষ্ট্য রয়েছে। মোটামুটি ভাবে বিগডাটার বেসিক তিনটি বৈশিষ্ট্য সম্পর্কে
আলোকপাত করা হয়। যাকে 3Vs বলে আখ্যায়িত করা হয়।

  1. Volume
  2. Variety
  3. Velocity

১) ভলিউম : বিগডাটার ক্ষেত্রে, আমরা ভলিউম বলতে বুঝি হিউজ পরিমাণ ডাটা। যা
সাধারণত পরিমাপ করা হয়ে থাকে Zettabytes(ZB) , Yottabytes
(YB) , Exabyte ইত্যাদি এককে। অর্থাৎ ভলিউম মানে উৎপন্ন এবং সংরক্ষিত
ডেটার পরিমাণ । তবে কোন ডেটা বিগ ডেটা হিসেবে বিবেচনা করা যাবে কি যাবে না তা
নির্ধারণ করে ডাটা সাইজ এবং ডাটা ধারণ ক্ষমতার উপর। বুঝার সুবিধার্থে এককের
চার্টটা নিচে দেয়া হলো,

২) Velocity (rapid procreation) : যে গতিতে তথ্য তৈরি , তথ্য প্রক্রিয়াকরণ ,
তথ্য উন্নয়নের অগ্রগতি, চাহিদা ও চ্যালেঞ্জগুলি সম্পন্ন করা হয় তাকে Velocity
বলা হয়। বিগ ডাটা সাধারণত গতিময় বা টানা সৃষ্টি হতে থাকে। সাধারণত কোম্পানিগুলো
ডাটা অ্যানালাইসিস করে থাকে batch প্রসেসসিং প্রক্রিয়ায়। যা কিনা খুব ধীর
গতিময়। কিন্তু বিগ ডাটা ফ্লো টা হচ্ছে কন্টিনিয়াস। ফলে কোম্পানিগুলোকে রিয়েল
টাইম ডাটা এনালাইসিস এখন করে তাদের বিসনেস ডিসিশন নিতে হচ্ছে।
৩) Variety: বিগ ডাটা প্রসেসিংয়ে যে চ্যালেঞ্জগুলোর সম্মুখীন হতে হয় তার মধ্যে
তথ্য টাইপ এবং তথ্যের প্রকৃতি অন্যতম। কারণ ডাটা গুলো বিভিন্ন ধরণের হয়ে
থাকে। সেমি-স্ট্রাকচার ,আন-স্ট্রাকচার ,অডিও, ভিডিও , টেক্সট, লগ, ওয়েব ডাটা ,

XML, JSON ইত্যাদি ধরণের ডাটা নিয়েই বিগ ডাটা। ডেটা সব ধরনের ফরম্যাটে সৃষ্টি
হতে পারে। তবে প্রথাগত ডেটাবেসগুলিতে সুরক্ষিত, সংখ্যাসূচক ডেটা থেকে অনুমোদিত
পাঠ্য নথি, ইমেল, ভিডিও, অডিও, স্টক টিকার ডেটা এবং আর্থিক লেনদেনগুলিতে
আসে। আর এই ডাটাগুলো অর্গানাইজ করা কিছুটা জটিল একটা প্রসেস। কারণ
ডাটাগুলো রেপিডলি পরিবর্তন হয়।

এছাড়া ও বিগডাটা নিয়ে গবেষণা করলে বিগডাটার নিম্নোক্ত বৈশিষ্ট্য লক্ষ্য করা যায়

৪) Variability: এটি ডাটা সেটের অসঙ্গতি এবং ডাটা সেট পরিচালনা করার
প্রক্রিয়াকে ব্যাহত করতে পারে। Variability কিন্তু Variety কনসেপ্ট থেকে
সম্পূর্ণই আলাদা। এক্ষেত্রে একটা উদাহরণ দেয়া যেতে পারে, ধরুণ একটি রেস্টুরেন্ট
অনেক ধরণের খাবার তৈরি করে। তো আপনি ডেইলি একই ধরণের খাবার খেলেও এক
এক দিন এক এক রকমের টেস্ট পাচ্ছেন, এটাই Variability। যে সব ডাটা প্রতিনিয়ত
বদলায় তাদের কে সংজ্ঞায়িত করতে Variability টার্মটি ব্যবহার করা হয়।
৫) Veracity: প্রাপ্ত তথ্য ডেটার গুণগতমান ব্যাপকভাবে পরিবর্তিত হতে পারে যা
সঠিক বিশ্লেষণকে প্রভাবিত করে। এক্ষেত্রে Veracity আমাদেরকে বিগ ডাটা থেকে
প্রাপ্ত ডাটাগুলো কতটুকু নিখুঁত তা নিশ্চিত করে।
৬) Viscocity : Viscosity বা সান্দ্রতা কোন ঘটনা কিংবা ঘটনা সম্পর্কিত উপাত্ত
বর্ণনা করতে ডাটা ভলিউমের মধ্যে প্রবাহ প্রতিরোধের পরিমাণ নির্দেশ করে।
উদাহরণস্বরূপ ডেটা উৎস বিভিন্ন কারণে, তথ্য প্রবাহ বেগ এবং
প্রক্রিয়াজাতকরণের সময় বিভিন্ন জটিলতার সম্মুখীন হয়ে থাকে। মূলত এটি
Velocity কে আর ও সহজভাবে ব্যাখ্যা করার জন্য ব্যবহার করা হয়।
৭) Value : ভ্যালুকে আমরা গেমের শেষ অংশ হিসাবে ধরতে পারি। বিগ ডাটার সব চেয়ে
ইম্পরট্যান্ট পার্ট হচ্ছে ভ্যালু। উপরের সবগুলোই আছে কিন্তু ভ্যালু নাই , তাহলে
সবাই অনর্থক। কারণ বিজনেস লিডাররা ভ্যালু থেকেই ডিসিশন নিয়ে থাকে।

মোটামুটিভাবে উপরোক্ত আটটি বৈশিষ্ট্যের মাধ্যমে বিগডাটা আচরণ ব্যাখ্যা করা
যায়।
তাই সংক্ষেপে বলতে গেলে বিগ ডাটা হচ্ছে High Volume, High Velocity এবং
High Veriety ইনফরমেশনের এমন এক ভান্ডার।
বিগ ডেটা কেন গুরুত্বপূর্ণ?
সহজ করে বলতে গেলে বিগডাটা:
 আপনার খরচ হ্রাস করবে
 সময়ের সঠিক ব্যবহারে সহায়তা করবে তথা সময় ব্যয় হ্রাস করবে
 নতুন ও উত্তম পণ্য উন্নয়ন বা নির্বানে সহায়তা করবে
 স্মার্ট সিদ্ধান্ত গ্রহণ করতে সাহায্য করবে
 এছাড়াও শিক্ষা, স্বাস্থ্য, সরকার পরিচালনা, নগর পরিচালনা সব ক্ষেত্রেই
গুরুত্বপূর্ণ ভূমিকা রাখতে পারবে।

উপরোক্ত বিষয়গুলো কয়েকটা দৃশ্যপটের মাধ্যমে বুঝিয়ে দেয়া যেতে পারে:
দৃশ্যপট – ১: ধরুন আপনার বান্ধবীর জন্মদিনে আপনি তাকে একটা ড্রেস গিফট করতে
চান। কিন্তু হ্যায়, আপনিতো তার গায়ের মাপ জানেন না! কোন সমস্যা নেই। আপনার
এই সমস্যা বিগ ডাটা সলভ করতে পারবে। শুধুমাত্র আপনার বান্ধবীর ছবি দিবেন।
তারপর কম্পিউটার তার জামার সাইজ ঠিকঠাক বুজে নিতে পারবে এবং গিফটের দেয়ার
পর আপনি বান্ধবীর ঝাড়ি থেকে বেঁচে যাবেন। ��
দৃশ্যপট – ২: আচ্ছা আমরা আবার উপরোক্ত কেস স্টাডিতে চলে যাই। আপনি একটু
রসিক টাইপের। ভাবলেন বান্ধবীর জন্মদিন ম্যাচিং জামা পড়ে ক্যান্ডেল লাইট ডিনারে

যাবেন। কিন্তু ভাবলেন,ইশ, আমাকে মানাবে তো! কোন সমস্যা নেই। কম্পিউটার
আপনার পছন্দের এবং মানানসই জামা রিকোমেন্ড করতে পারে এবং কম্পিটারে
আপনার পছন্দের ড্রেসটাতে ক্লিক করবেন আর সামনে মনিটরে এ একদিন থ্রিডি
ইমেজ দেখতে পাবেন। তখন আর ভাবতে হবে না ড্রেস টা আপনাকে মানাবে কিনা! কি
বিশ্বাস হচ্ছে না তো!
দৃশ্যপট – ৩: আপনি একটা ড্রেস কিনতে মার্কেটে গেলেন। সেখানে গিয়ে একট ড্রেস
পছন্দ হলো, কিন্তু দাম যে আপনার নাগালের বাইরে! কি আর করা ক্ষত বিক্ষত হৃদয়ে
বাসায় ফিরে আসলেন। কিন্তু মার্কেটের ভিতরের খবর আপনি জানতেই পারলেন না। ��
ওকে আমি বলছি কি হয়েছে, আপনি হয়তোবা জানেন না যে জানালাতে লাগানো ওয়াইফাই
সেন্সর আপনার স্মার্টফোনটিকে স্ক্যান করে নিয়েছে এর মধ্যে অথবা আপনার
মোশন কে ডিটেক্ট করেছে। কতজন দাঁড়িয়েছিলেন সেই ডিসপ্লের সামনে, কতজন এরপর
দোকানে ঢুকেছেন আর কতজন ঢোকেননি – তার কাউন্ট ডাউন চলে যাচ্ছে দোকানির
ডাটাবেসে । কতক্ষণ দাড়িয়েছিলেন ক্রেতা তার উপর নির্ভর করছে দামটা যুতসই
হয়েছে কিনা। আর এভাবেই তারা গ্রাহকের ক্রয় করার অভ্যাসগুলির উপর ভিত্তি করে
পণ্যের দাম নির্ধারণ করে থাকে।
দৃশ্যপট – ৪: ওকে আপনি একজন পুরোদস্তর গবেষক। তো গবেষণা করতে করতে
মেয়েদের দিকে তাকানোর সময় পাননি। কিন্তু বেলা যে পড়ে এলো, জলকে চলো! তাই
বহুকষ্টে একটা পাত্রী যোগাড় করলেন। যেভাবেই হোক বালিকার মন জয় করতেই হবে।
ইয়েস, এ ক্ষেত্রে আপনাকে বিগ ডাটা সাহায্য করতে পারেন। আই রিপিট, বিগ ডাটা!
যেহেতু মেয়েদের সাথে আপনি অভ্যস্ত না, তাই আপনি সহজে বুঝতে পারবেন না মেয়েটা
কি পছন্দ করে, তার সাথে কেমন ব্যবহার করতে হবে, আপনার আচরণে সে বোরড হয়ে
যাচ্ছে কিনা, আলোচনার টপিক চেঞ্জ করতে হবে কিনা এমনকি এই সময়ে তার হাত
ধরতে হবে কিনা তাও বিগ ডাটা মেয়েটির ফেইস এবং আচরণ মুভমেন্ট দেখে আপনাকে
জানিয়ে দেবে।
দৃশ্যপট – ৫: আমরা অনেকেই অনলাইনে শপিং করে থাকি , কারণ অনেক সময় বেঁচে
যায়। তো ধরেন, আপনি daraz থেকে শপিং করেন, daraz কিন্তু ঠিকই মনে রাখছে
আপনি গত মাসে কি শপিং করেছেন,কোন প্রোডাক্ট গুলোতে আপনি ভিজিট করেছেন ,
কোন প্রোডাক্ট পেজে কতক্ষন ছিলেন ? আপনি হয়তো একটা আপেল কিনবেন , তারা
আপনাকে সাজেস্ট করবে ওই আপেল রাখতে হলে একটা ফ্রিজ কিনতে, অথবা তারা
আপনাকে অন্যান্য ফল সাজেস্ট করবে, এমনকি পুষ্টিমান সহ! তারা কিন্তু আপনার
পছন্দের জিনিস গুলোই কিনতে সাজেস্ট করবে কারণ তারা আপনার আগের নানান
ব্যবহার থেকে জানে আপনি কি লাইক করেন !
তাহলে বুঝতেই পারছেন কিভাবে বিগডাটা আমাদের প্রতিদিন পরম বন্ধুর মতো সাহায্য
করতে পারে! দৃশ্যপট গুলোতে বাস্তব জীবনে বিগ ডাটার এনালাইটিকেল পাওয়ার

বুঝানোর জন্য জাস্ট ভিজুয়াল কিছু উদাহরণ দিয়েছি। আমাদের জীবনে প্রায় প্রতিটা
ক্ষেত্রে বিগডাটা ব্যবহার করা যেতে পারে এবং এই প্রযুক্তি ব্যবহার করে রাতারাতি
পৃথিবীর পুরো চেহারাই বদলে দিতে পারে। তাহলে নিশ্চইয় এতক্ষণে বুঝে গিয়েছেন কেন
আমরা বিগ ডাটা সম্পর্কে জানবো এবং কেন বিগ ডাটা এত গুরুত্বপূর্ন!

বিগ ডাটার ব্যবহারঃ
উপরে আমরা বিগ ডাটার প্রয়োজনীয়তা বুঝানোর জন্য কয়েকটি দৃশ্যপট নিয়ে
আলোচনা করেছিলাম। এবার বিভিন্ন ক্ষেত্রে বিগ ডাটার ব্যবহার নিয়ে আলোকপাত
করবো।
সরকারি কাজেঃ
পণ্য উৎপাদনেঃ
ব্যাংকিং খাতেঃ
শিক্ষা খাতেঃ
স্বাস্থ্য খাতেঃ

Internet of Things (IoT):
একটু পুরোনো গল্পে ফিরে যাই,
২০০৭ সালে Minnesota তে একটা ব্রীজ ভেঙ্গে যাবার কারণে অনেক মানুষ মারা যায়।
ব্রীজে ব্যবহৃত স্টিলের প্লেটগুলো সঠিকভাবে লোড নিতে না পারার কারণে ব্রীজটি
ভেঙ্গে পড়েছিলো। কথা হচ্ছে এই অবস্থা থেকে কিন্তু চাইলেই আমরা নিস্তার পেতে
পারতাম। কিভাবে?
ব্রীজটি পুনরায় নির্মাণ করার সময় আমরা এমন এক ধরণের স্মার্ট টেকনোলজি (
হতে পারে স্মার্ট সিমেন্ট) ব্যবহার করতে পারি যা ব্রীজের উপর প্রযুক্ত চাপ,
ব্রীজের ফাটল এবং সংকোচন-প্রসারণ মনিটরিং করতে পারবে। এই সিস্টেমটি আগাম
বিপর্যয়ের সংকেত দিবে এবং সে অনুযায়ী ব্যবস্থা ও নেয়া যাবে। বাংলাদেশ সরকারের
সড়ক বিভাগের কর্মকর্তাদের মাথায় এই বিষয়টি ঢুকিয়ে দিতে পারলেই কেল্লা ফতে।
আরমসে লং ড্রাইভে যাওয়া যাবে ��

আমরা আবার Minnesota তে ফিরে যাই। মেনে নিলাম যে উপরোক্ত সিস্টেম প্রয়োগ
করে আমরা ব্রীজকে দূর্ঘটনার হাত থেকে বাঁচাতে পারবো। কিন্তু যদি আমেরিকার
মতো একটি শীতপ্রধান দেশে প্রচুর তুষারপাতের কারণে ব্রীজে বরফ জমে! এই সমস্যা
কিভাবে দূর করা যাবে?
তখন ঐ একই সেন্সর জমাটবদ্ধ বরফকে ডিটেক্টকরে ইন্টারনেট এর মাধ্যমে
যানবাহনের সাথে কমিউনিকেট করবে। যখন যানবাহন জানতে পারবে সামনে বিপত্তি
আছে তখন যানবাহন ড্রাইভারকে আস্তে চালাতে নির্দেশ দিবে । এটা একটা রিয়েল
টাইম সিস্টেম যা কিনা sensor to machine ও machine to sensor এর মধ্যে
যোগাযোগ করবে ঐ একই প্লেসে, একই সময়ে।
এখনতো ট্র্যাফিক আর স্ট্রিট কন্ডিশন ড্রাইভারের সাথে কমিউনিকেট করে যা
আশেপাশের ঘনবসতিপূর্ণ এলাকা, বরফ জমা রাস্তা কিংবা রাস্তার সংস্কারের জন্য
বন্ধ থাকা রাস্তাসহ সবকিছু সেন্সর রি-রাউটিং করে ড্রাইভারকে ইনফরম করবে।
কাজেই, আমাদেরকে ডাটা শর্ট করে মনিটরিং ও ট্র্যাকিং করতে সাহায্য করছে সেন্সর
। আর Cloud based apps আর্টিফিশিয়াল ইন্টেলিজেন্স এর মাধ্যমে ডাটাকে মেশিন
কিংবা মোবাইল এ রেয়াল টাইম রেসপন্স করবে । আমরা আশা করতেই পারি, ঢাকা
সিটিকে খুব শীঘ্রই স্মার্ট সিটি হিসাবে দেখবো। এতক্ষণ, IoT নিয়ে বকবক করলাম
দেখে আসি এটার সাথে বিগ ডাটার কি সম্পর্ক !
বিভিন্ন রকম ডিভাইস, মেশিন,সেন্সর, ওয়েব লগ ইত্যাদির ডাটা গুলো জেনারেট হয়
আমরা সবাই জানি। এই ডাটাগুলো অবশ্যই ম্যাসিভ ডাটা , আন-স্ট্রাকচার্ড, সেমি-
স্ট্রাকচার্ড কিংবা স্ট্রাকচার্ড এবং ডাটাগুলো বিভিন্ন ধরণের। কাজেই আমরা বলতে
পারি IoT থেকে প্রাপ্ত ডাটাগুলো বিগ ডাটা। আর এই বিগ ডাটা এনালাইসিস করেই
এমন রিয়েল টাইম ডিসিশন নিতে পারি আমরা।
সাধারণ ক্রয়-বিক্রয়ে বিগ ডাটা অসামান্য অবদান রাখছে।
বিশ্ববিখ্যাত ওয়ালমার্টের কথা কে না জানে! সেই ওয়ালমার্ট প্রতি ঘণ্টায় ১
মিলিয়নের বেশি ক্রেতার সাথে লেনদেন করে যা ২.৫ পেটাবাইটসের (২৫৬০ টেরাবাইটস)
চেয়েও বেশি ডেটা ইমপোর্ট করে। এই ডাটা US Library of Congress এর সমস্ত
বইয়ের সব ইনফরমেশনের ১৬৭ গুণের সমান। ভাবা যায়! ওয়ালমার্ট নিয়ে একটি মজার
ঘটনা আছে। ওরা ডাটা এনালাইসিস করে দেখতে পায় যে, প্রতি উইক এন্ডের আগের
দিন বিয়ার এবং প্যাম্পার বিক্রি বেড়ে যায়। এখন প্রশ্ন হলো, এই দুইটার মাঝে
সম্পর্ক কি এবং কিভাবে এটাকে ব্যবহার করা যায়। ওরা যা করলো তা হলো, কাছাকাছি
র‍্যাকে বিয়ার এবং প্যাম্পার রেখে দিলো। ফলে প্যাম্পারের বিক্রি আরো কয়েকগুণ

বেড়ে গেল। কারণটা হচ্ছে, এই দিন সাধারণত পুরুষরা যায় বিয়ার কিনতে ছুটির মজা
নেয়ার জন্য। বাসা থেকে মায়েরা বলে দেয় প্যাম্পার নিয়ে আসতে। তাই যদি দুইটা
কাছাকাছি থাকে তাহলে সহজেই মনে থাকে এবং নিয়েও আসতে তেমন কষ্ট হয়না। দূরে
থাকলে যেহেতু অন্য দিকে গিয়ে নেয়া কষ্ট তাই নেয়া কম হতো। দুইটা কাছাকাছি রাখার
পর এইজন্য বিক্রি হুট করে বেড়ে যায়।
এছাড়া বিজ্ঞানের বিভিন্ন গবেষণার ক্ষেত্রে বর্তমানে প্রচুর পরিমাণে বিগ ডাটার
ব্যবহার হচ্ছে। বিশেষ করে জীব প্রযুক্তি, ডিএনএ ডাটাবেজে, হিউমেন জিনোম,
ফ্লুয়িড ডায়নামিকস থেকে শুরু করে নাসার বিজ্ঞানীরাও বিগ ডাটা ব্যবহার করছে।
অন্যদিকে খেলার মাঠেও বিগ ডাটা পিছিয়ে নেই। প্রতিপক্ষের খেলোয়ারদের সম্পর্কে
বিস্তারিত তথ্য নেয়া থেকে শুরু করে বিভিন্ন রেসে এনার্জি লেভেল চেক করার কাজেও
বিগ ডাটা ব্যবহার করা হয়।
টেকনোলজির সাথে বিগ ডাটাকে নতুন করে পরিচয় করিয়ে দেবার মতো কিছু নেই।
ফেসবুক, গুগল ও আমাজনের মতো জায়ান্ট টেক প্রতিষ্ঠানগুলো ইতিমধ্যে বিগ ডাটাকে
কাজে লাগিয়ে নতুন নতুন প্রযুক্তি উদ্ভাবন করেছে। এদের সার্ভারে প্রতিদিন বিলিয়ন
বিলিয়ন ডেটা জমা হচ্ছে এবং এতসব তথ্যের মধ্যেও কাঙ্খিত তথ্য খুঁজে পেতে মাত্র
কয়েক সেকেন্ড সময় লাগে যা কেবল মাত্র বিগ ডাটার কারণেই সম্ভব হয়েছে। ফেইস
রিকগনিশন, ভয়েস রিকগনিশন, ভয়েস সার্চ, ফিঙ্গারপ্রিন্ট আর ও কত কি!
অনেক তো হলো। এতক্ষণে নিশ্চইয় আমরা বুঝে গিয়েছি বিগ ডাটা কিভাবে আমাদের
জীবনকে রাতারাতি চেঞ্জ করে দিতে পারে এবং দিচ্ছে। আপনি যদি ডাটা ভালোবাসেন,
তবে বিগ ডাটা আপনার জন্য। আগামী বিশ্ব হবে ডাটা সায়েন্টিস্টদের। আর এক্ষেত্রে
সায়েন্টিসরা প্রধান অস্ত্র হিসেবে ব্যবহার করবে বিগ ডাটাকেই।

A Content By

Newsletter Updates

Enter your email address below and subscribe to our newsletter

Leave a Reply

Your email address will not be published. Required fields are marked *