معرفی و نقد کتاب کلان‌داده‌ها؛ انقلابی که زندگی، کار و تفکر ما را تغییر می‌دهد

کتاب «کلان‌داده‌ها؛ انقلابی که زندگی ما، کار و تفکر را تغییر می‌دهد» (۲۰۱۳) نوشته ویکتور میرشنبرگر و کینت کیکر، با ۴۲۰۰ ارجاع، یکی از پراستناد‌ترین کتاب‌هایی است که تاکنون در حوزه شبکه‌های اجتماعی و فناوری‌های جدید نگاشته شده است. این کتاب، تحقیقی خاص از آخرین روندهای فنّاوری و تأثیرات چشمگیر آن بر اقتصاد، علم و جامعه می‌شود و توضیح می‌دهد که چگونه ما در احاطه داده‌های کلان قرارگرفته‌ایم و چه مزایا و خطراتی در برابر ما وجود دارد. داده‌هایی که به‌سرعت می‌تواند نتیجه‌گیری‌های شگفت‌انگیزی به ما دهد و در کسب‌وکار، سلامت، سیاست، آموزش، و نوآوری‌ها تغییرات زیادی ایجاد کند. نوشتار حاضر، درس‌هایی از مطالعه این کتاب است:

۱- داده‌ها را نمی‌توان به‌صورت ایستا یا پایدار در نظر گرفت، بلکه داده‌ها تبدیل به‌صورت ماده خام کسب‌وکار شده و منبع اقتصادی حیاتی برای ایجاد یک فرم جدید ارزش اقتصادی است. در توضیح این واقعیت، نویسندگان توضیح می‌دهند که چگونه گوگل می‌تواند گسترش آنفولانزای زمستان را در ایالات‌متحده، نه‌فقط در سطح ملی، بلکه در مناطق خاص پیش‌بینی کند. گوگل این کار را با در نظر گرفتن ۵۰ میلیون واژه جستجوی رایج در مورد گسترش آنفولانزا انجام داد و داده‌ها را از سال‌های ۲۰۰۳ تا ۲۰۰۸ مقایسه کرد. نرم‌افزار آن‌ها ترکیبی از ۴۵ جستجو را پیدا کرد و نشان داد که بین پیش‌بینی و آمار رسمی در سراسر کشور همبستگی زیادی وجود دارد. گوگل دقیقاً نشان داد که چگونه آنفولانزا گسترش یافته است و این یافته‌ها نه بر اساس تماس‌های افراد و یا تماس‌ها در مطب‌های پزشکی و درمانگاه‌ها، بلکه از طریق کلان‌داده‌ها به دست آمد. بنابراین شواهد نشان می‌دهد که کلان‌داده‌ها می‌تواند قدرت پیش‌بینی ایجاد کند.

۲- شرکت‌های خصوصی با جمع‌آوری و مرتب کردن اطلاعات قدرت یافته‌اند، درحالی‌که در گذشته، این وظیفه بیشتر بر عهده نهادهای قدرتمندی مانند کلیسا و دولت بود. این حجم از دسترسی به اطلاعات، مفهوم پیمایش و نظرسنجی را نیز تغییر می‌دهد. به‌عنوان‌مثال، گوگل برای تحلیل آنفلوانزا، نمونه‌گیری نکرده و بر نمونه‌ها کوچک تصادفی تکیه نمی‌کند، بلکه از میلیاردها جستجوی اینترنتی بهره می‌برد. این مسئله باعث افزایش کیفیت پیش‌بینی می‌شود و درواقع، داده‌های بزرگ‌تر، نتایج بهتری خواهد داشت.

۳- استفاده از داده‌های موجود در زمینه‌های مختلف امکان‌پذیر است، اما درعین‌حال، احتمال ایجاد خطا نیز افزایش می‌یابد. این خطاها به قالب‌بندی مجدد داده‌ها برمی‌گردد. درواقع، تلفیق انواع مختلف اطلاعات از منابع گوناگون، درعین‌حالی که می‌تواند مثمر ثمر باشد، می‌تواند موجب ناهماهنگی و افزایش خطا نیز شود. این ناهماهنگی و آشفتگی به کلان‌داده‌ها مرتبط نیست، بلکه به روش‌های استفاده ما از داده‌ها برمی‌گردد. درواقع، این عملکرد ناشی از نقص ابزارهایی است که برای سنجش، ثبت و تجزیه‌وتحلیل اطلاعات استفاده می‌شود. اما درهرصورت، بینشی که کلان‌داده‌ها در سطح کلان و همچنین سرعت دسترسی به اطلاعات ایجاد می‌کنند، مزیت‌های غیرقابل‌انکاری است.

۴- پیش‌ازاین، همبستگی‌ها در داده‌های کوچک پیمایشی مفید بودند، اما شناسایی همبستگی‌ها در کلان‌داده‌ها، به معنی واقعی نقطه درخشانی در پژوهش‌های کمی محسوب می‌شود. زیرا شناسایی همبستگی‌ها، به‌گونه‌ای پدیده‌ها را تجربه می‌کنند که می‌توان بر اساس آن در «پیش‌بینی آینده» پیش‌قدم شد. را پیش‌بینی کنیم. چنین همبستگی‌های قدرتمندی را در روندپژوهی گوگل در مورد آنفلوانزا مشاهده کرد: بین افراد مبتلا به آنفولانزا در یک مکان جغرافیایی خاص و میزان جستجو در این موضوع همبستگی وجود دارد. نهایتاً اینکه با وجود کلان‌داده‌ها، فرضیه‌ها اهمیت خود را ازدست‌داده‌اند و برای تجزیه‌وتحلیل همبستگی‌ها خیلی مهم نیستند، زیرا داده‌های زیادی وجود دارد و پژوهش‌گر نیازمند ارائه فرضیه‌های پیشین نیست. درواقع، تجزیه‌وتحلیل کلان‌داده‌ها نیازی به نظریه‌های یک حوزه خاص ندارد.

 5- باید بین «داده‌سازی»[۱] و «دیجیتالی‌سازی»[۲] تمایز قائل شد. داده‌سازی، پدیده‌ها را به صورت کمی تبدیل می‌کند تا بتوان از این منظر آن‌ها را تحلیل کرد. اما دیجیتالی‌سازی، فرایند تبدیل اطلاعات آنالوگ به اطلاعات مبتنی بر صفر و یک است تا بتوان آن‌ها را در رایانه‌ها ذخیره کرد. توانایی ذخیره اطلاعات یکی از شاخص‌های پیشرفت جوامع محسوب می‌شود، زیرا موجب اندازه‌گیری خواهد شد و این اندازه‌گیری می‌تواند قدرت پیش‌بینی و درنتیجه برنامه‌ریزی را فراهم کند. 

۶- ارزش داده‌ها در کلان‌داده‌ها، به‌طور مطلق از بین نمی‌رود. درواقع می‌توان از این اطلاعات بارها استفاده کرد و برای پاسخ به پرسش‌ها بهره برد. اطلاعات کلان‌داده‌ها در طول زمان کم‌ارزش نمی‌شود، بلکه برخی از امکان‌های خود را از دست می‌دهد. بااین‌حال، به علت به‌روزرسانی مداوم کلان‌داده‌ها، این اطلاعات بهترین منابع روندپژوهی هستند و می‌تواند بارها از آن‌ها استفاده کرد. از همین جهت، در بسیاری از کشورها، این اطلاعات به‌صورت باز در اختیار پژوهشگران وجود دارد و این پژوهشگران هستند که باید ایده‌هایی در تحلیل این داده‌ها ارائه دهند.

۷- کلان‌داده‌ها منبع سود و رقابت برای بسیاری از شرکت‌ها محسوب می‌شود و ساختار صنایع را تغییر خواهد داد. این مسئله باعث شکاف‌ها و نابرابری‌هایی می‌شود. زیرا کلان‌داده‌های ارزشمند عمدتاً در اختیار شرکت‌های بزرگ و چندملیتی است و شرکت‌های متوسط کشورهای درحال‌توسعه امکان بهره‌برداری تأثیرگذار در این زمینه را نداند. شرکت‌های بزرگ با بهره‌گیری از اطلاعات کلان خود، قدرت پیش‌بینی و راهکارهای افزایش سود را افزایش داده‌اند و رقیبان را به‌تدریج از میدان به در می‌کنند.

۸- داده‌های کلان، برخلاف سیاست‌های حفظ حریم خصوصی عمل می‌کند و تهدیدی برای آزادی محسوب می‌شود. علاوه بر این، درعین‌حال، جامعه باید مفهوم عدالت را مجدداً تعریف کند و نهادها و متخصصان جدید نیز باید به‌گونه‌ای به تفسیر الگوریتم‌های پیچیده تحلیل کلان‌داده‌ها بپردازند که عدالت را محقق سازد و نهادها و افراد آسیب‌پذیر را مورد حمایت قرار دهد.

نهایتاً آنکه کلان‌داده‌ها، باعث ایجاد صلح جهانی و ریشه‌کن کردن فقر نخواهد شد، اما ممکن است به نحو احسن در مورد آینده ما تأثیر بگذارد؛ چراکه انتظار می‌رود تقریباً هر جنبه‌ای از زندگی مورداستفاده قرار گیرد. آن‌ها به‌طور اساسی در درک اصلی ما از جهان تغییر ایجاد می‌کنند. بنابراین باید هم‌زمان هم موردتوجه حوزه‌های عمومی علم و هم سیاست‌گذاران قرار گیرد. بااین‌وجود، نویسندگان این کتاب با اشاره به نمونه‌هایی از استفاده از کلان‌داده‌ها و ارائه تجربیات کشورهای توسعه‌یافته (به‌ویژه آمریکا)، دیگر کشورها را غافلگیر کرده‌اند. آن‌ها به‌طور گسترده‌ای، به اهمیت کلان‌داده‌ها و مزایا و معایب آن پرداخته‌اند، اما هم‌زمان کمتر به شکاف‌ها و نابرابری‌ها و نقش کلان‌داده‌ها در گسترش آن توجه داشته‌اند. زیرا هم‌اکنون بسیاری از ملت‌های جهان، نمی‌توانند به این سطح از اطلاعات دسترسی پیدا کنند و یا زیرساخت‌های لازم (سطح سواد، ثروت و …) برای فهم این اطلاعات را ندارند.


[۱] datafication

[۲] digitization

سلیمانی ساسانی، مجید (۱۳۹۷) کلان‌داده‌ها، منبع جدید شکاف و نابرابری در جهان، خبرگزاری مهر، ۲۵ مهر ۱۳۹۷، به آدرس: mehrnews.com/news/4432992