کتاب «کلاندادهها؛ انقلابی که زندگی ما، کار و تفکر را تغییر میدهد» (۲۰۱۳) نوشته ویکتور میرشنبرگر و کینت کیکر، با ۴۲۰۰ ارجاع، یکی از پراستنادترین کتابهایی است که تاکنون در حوزه شبکههای اجتماعی و فناوریهای جدید نگاشته شده است. این کتاب، تحقیقی خاص از آخرین روندهای فنّاوری و تأثیرات چشمگیر آن بر اقتصاد، علم و جامعه میشود و توضیح میدهد که چگونه ما در احاطه دادههای کلان قرارگرفتهایم و چه مزایا و خطراتی در برابر ما وجود دارد. دادههایی که بهسرعت میتواند نتیجهگیریهای شگفتانگیزی به ما دهد و در کسبوکار، سلامت، سیاست، آموزش، و نوآوریها تغییرات زیادی ایجاد کند. نوشتار حاضر، درسهایی از مطالعه این کتاب است:
۱- دادهها را نمیتوان بهصورت ایستا یا پایدار در نظر گرفت، بلکه دادهها تبدیل بهصورت ماده خام کسبوکار شده و منبع اقتصادی حیاتی برای ایجاد یک فرم جدید ارزش اقتصادی است. در توضیح این واقعیت، نویسندگان توضیح میدهند که چگونه گوگل میتواند گسترش آنفولانزای زمستان را در ایالاتمتحده، نهفقط در سطح ملی، بلکه در مناطق خاص پیشبینی کند. گوگل این کار را با در نظر گرفتن ۵۰ میلیون واژه جستجوی رایج در مورد گسترش آنفولانزا انجام داد و دادهها را از سالهای ۲۰۰۳ تا ۲۰۰۸ مقایسه کرد. نرمافزار آنها ترکیبی از ۴۵ جستجو را پیدا کرد و نشان داد که بین پیشبینی و آمار رسمی در سراسر کشور همبستگی زیادی وجود دارد. گوگل دقیقاً نشان داد که چگونه آنفولانزا گسترش یافته است و این یافتهها نه بر اساس تماسهای افراد و یا تماسها در مطبهای پزشکی و درمانگاهها، بلکه از طریق کلاندادهها به دست آمد. بنابراین شواهد نشان میدهد که کلاندادهها میتواند قدرت پیشبینی ایجاد کند.
۲- شرکتهای خصوصی با جمعآوری و مرتب کردن اطلاعات قدرت یافتهاند، درحالیکه در گذشته، این وظیفه بیشتر بر عهده نهادهای قدرتمندی مانند کلیسا و دولت بود. این حجم از دسترسی به اطلاعات، مفهوم پیمایش و نظرسنجی را نیز تغییر میدهد. بهعنوانمثال، گوگل برای تحلیل آنفلوانزا، نمونهگیری نکرده و بر نمونهها کوچک تصادفی تکیه نمیکند، بلکه از میلیاردها جستجوی اینترنتی بهره میبرد. این مسئله باعث افزایش کیفیت پیشبینی میشود و درواقع، دادههای بزرگتر، نتایج بهتری خواهد داشت.
۳- استفاده از دادههای موجود در زمینههای مختلف امکانپذیر است، اما درعینحال، احتمال ایجاد خطا نیز افزایش مییابد. این خطاها به قالببندی مجدد دادهها برمیگردد. درواقع، تلفیق انواع مختلف اطلاعات از منابع گوناگون، درعینحالی که میتواند مثمر ثمر باشد، میتواند موجب ناهماهنگی و افزایش خطا نیز شود. این ناهماهنگی و آشفتگی به کلاندادهها مرتبط نیست، بلکه به روشهای استفاده ما از دادهها برمیگردد. درواقع، این عملکرد ناشی از نقص ابزارهایی است که برای سنجش، ثبت و تجزیهوتحلیل اطلاعات استفاده میشود. اما درهرصورت، بینشی که کلاندادهها در سطح کلان و همچنین سرعت دسترسی به اطلاعات ایجاد میکنند، مزیتهای غیرقابلانکاری است.
۴- پیشازاین، همبستگیها در دادههای کوچک پیمایشی مفید بودند، اما شناسایی همبستگیها در کلاندادهها، به معنی واقعی نقطه درخشانی در پژوهشهای کمی محسوب میشود. زیرا شناسایی همبستگیها، بهگونهای پدیدهها را تجربه میکنند که میتوان بر اساس آن در «پیشبینی آینده» پیشقدم شد. را پیشبینی کنیم. چنین همبستگیهای قدرتمندی را در روندپژوهی گوگل در مورد آنفلوانزا مشاهده کرد: بین افراد مبتلا به آنفولانزا در یک مکان جغرافیایی خاص و میزان جستجو در این موضوع همبستگی وجود دارد. نهایتاً اینکه با وجود کلاندادهها، فرضیهها اهمیت خود را ازدستدادهاند و برای تجزیهوتحلیل همبستگیها خیلی مهم نیستند، زیرا دادههای زیادی وجود دارد و پژوهشگر نیازمند ارائه فرضیههای پیشین نیست. درواقع، تجزیهوتحلیل کلاندادهها نیازی به نظریههای یک حوزه خاص ندارد.
5- باید بین «دادهسازی»[۱] و «دیجیتالیسازی»[۲] تمایز قائل شد. دادهسازی، پدیدهها را به صورت کمی تبدیل میکند تا بتوان از این منظر آنها را تحلیل کرد. اما دیجیتالیسازی، فرایند تبدیل اطلاعات آنالوگ به اطلاعات مبتنی بر صفر و یک است تا بتوان آنها را در رایانهها ذخیره کرد. توانایی ذخیره اطلاعات یکی از شاخصهای پیشرفت جوامع محسوب میشود، زیرا موجب اندازهگیری خواهد شد و این اندازهگیری میتواند قدرت پیشبینی و درنتیجه برنامهریزی را فراهم کند.
۶- ارزش دادهها در کلاندادهها، بهطور مطلق از بین نمیرود. درواقع میتوان از این اطلاعات بارها استفاده کرد و برای پاسخ به پرسشها بهره برد. اطلاعات کلاندادهها در طول زمان کمارزش نمیشود، بلکه برخی از امکانهای خود را از دست میدهد. بااینحال، به علت بهروزرسانی مداوم کلاندادهها، این اطلاعات بهترین منابع روندپژوهی هستند و میتواند بارها از آنها استفاده کرد. از همین جهت، در بسیاری از کشورها، این اطلاعات بهصورت باز در اختیار پژوهشگران وجود دارد و این پژوهشگران هستند که باید ایدههایی در تحلیل این دادهها ارائه دهند.
۷- کلاندادهها منبع سود و رقابت برای بسیاری از شرکتها محسوب میشود و ساختار صنایع را تغییر خواهد داد. این مسئله باعث شکافها و نابرابریهایی میشود. زیرا کلاندادههای ارزشمند عمدتاً در اختیار شرکتهای بزرگ و چندملیتی است و شرکتهای متوسط کشورهای درحالتوسعه امکان بهرهبرداری تأثیرگذار در این زمینه را نداند. شرکتهای بزرگ با بهرهگیری از اطلاعات کلان خود، قدرت پیشبینی و راهکارهای افزایش سود را افزایش دادهاند و رقیبان را بهتدریج از میدان به در میکنند.
۸- دادههای کلان، برخلاف سیاستهای حفظ حریم خصوصی عمل میکند و تهدیدی برای آزادی محسوب میشود. علاوه بر این، درعینحال، جامعه باید مفهوم عدالت را مجدداً تعریف کند و نهادها و متخصصان جدید نیز باید بهگونهای به تفسیر الگوریتمهای پیچیده تحلیل کلاندادهها بپردازند که عدالت را محقق سازد و نهادها و افراد آسیبپذیر را مورد حمایت قرار دهد.
نهایتاً آنکه کلاندادهها، باعث
ایجاد صلح جهانی و ریشهکن کردن فقر نخواهد شد، اما ممکن است به نحو احسن در مورد
آینده ما تأثیر بگذارد؛ چراکه انتظار میرود تقریباً هر جنبهای از زندگی مورداستفاده
قرار گیرد. آنها بهطور اساسی در درک اصلی ما از جهان تغییر ایجاد میکنند.
بنابراین باید همزمان هم موردتوجه حوزههای عمومی علم و هم سیاستگذاران قرار
گیرد. بااینوجود،
نویسندگان این کتاب با اشاره به نمونههایی از استفاده از
کلاندادهها و ارائه تجربیات کشورهای توسعهیافته (بهویژه آمریکا)، دیگر
کشورها را غافلگیر کردهاند. آنها بهطور گستردهای، به اهمیت کلاندادهها و
مزایا و معایب آن پرداختهاند، اما همزمان کمتر به شکافها و نابرابریها و نقش
کلاندادهها در گسترش آن توجه داشتهاند. زیرا هماکنون بسیاری از ملتهای جهان، نمیتوانند
به این سطح از اطلاعات دسترسی پیدا کنند و یا زیرساختهای لازم (سطح سواد، ثروت و
…) برای فهم این اطلاعات را ندارند.
[۱] datafication
[۲] digitization