بدون شک، رشد سریع داده های دیجیتال و افزایش دسترسی به آنها، فصل جدیدی را برای علوم اجتماعی و فرهنگی باز کرده است. در تاریخ علوم فرهنگی و اجتماعی، هرگز با این مقدار از دادهها مواجه نبودهایم. دادههایی که انواع پدیدههای فرهنگی و اجتماعی و کنشگران آنها را به خوبی نشان می دهد. یک بار به حجم عظیمی از اطلاعاتی که مردم در یک بازه زمانی کوتاه در اختیار شرکتهای بزرگ آی.تی قرار میدهند فکر کنید. آن هنگام درک خواهید کرد که کلاندادهها چه منبع ارزشمندی برای تحلیل فرهنگی و اجتماعی هستند. آمارهای زندهای که سایت «اینترنت لایو استیت»[۱] از اتفاقاتی که در ثانیه در شبکه جهانی اینترنت رخ میدهد را بنگرید. حداقل، هر دقیقه ۲ میلیون جستجو در گوگل انجام می شود، ۷۲ ساعت ویدیو در یوتیوب آپلود می گردد، ۵۲ هزار عکس به اینستاگرام اضافه میشود، ۱٫۸ میلیون کاربر فیس بوک با هم ارتباط میگیرند، ۲۰۴ میلیون ایمیل فرستاده میشود و ۲۷۸ هزار توییت در توئیتر ارسال میگردد. این حجم از اطلاعات ارسالی، کلاندادهها را هر روز غنیتر میکنند و دست پژوهشگران فرهنگی و اجتماعی برای ارائه انواع تحلیلها بازتر میشود. هرچند هنوز هم تمامی انتقادات روششناختی و معرفتشناختی به علوم اجتماعی دادهمحور وجود داشته باشد. اما ویژگیهای کلاندادهها باعث میشود که این ادعا را مطرح کنیم که علوم فرهنگی و اجتماعی دادهمحور در پارادایم جدید مجددا ظهور کرده است. با این تفاوت که کلاندادهها، مسئله «فرضیه» را به کناری مینهد و این ادعا توسط کریس اندرسون (۲۰۰۸) مطرح میشود که آنقدر دادهها کافی است که نیاز به فرضیهها و نظریهها نیست و دادهها خود میتوانند سخن گویند و در «پایان نظریه» به سر میبریم. به زعم وی، وجود «همبستگی» میان دادهها کافی است و الگوریتمهای آماری میتواند الگوهایی را پیدا کند که روشهای علمی پیش از این قادر به شناخت آنها نبود. از این منظر، علم هم میتواند بدون مدلها و نظریههای یکپارچه پیشرفت کند.
با این حال، چالش اساسی این است که آیا این دادهها عظیم به هم مرتبط، توسط ما قابل تحلیل است و یا توسط رایانهها؟ و یا اساساً رایانهها میتوانند این دادهها را تحلیل کنند؟ کلاندادهها آنقدر پیچیده و مرتبط هستند که نمیتوان آنها را جدا از یکدیگر در نظر گرفت. این دادهها، به راحتی در اختیار ما قرار دارد، اما روشهای تحلیل آنها به سادگی رخ نمیدهد و اتفاقاً سویه مشکل داستان همین جاست. این دادهها چنان درهم آمیختهاند که جداسازی، استفاده و فهم آنها میتواند پیامدهای مختلفی را در برداشته باشد. بنابراین ابتدا به ساکن هیچ دادهای نباید مورد فراموشی قرار گیرد. ضمن اینکه استفاده و تولید داده ها نمی تواند به طور جداگانه در نظر گرفته شود، زیرا از یک طرف، فرایند تولید بر امکان استفاده از داده ها تاثیر می گذارد و از سوی دیگر نیاز به استفاده از داده ها بر نحوه تولید آنها تاثیر می گذارد. در عین حال، تمرکز بر روی هر دو فرایند تولید و استفاده از داده ها، به ما امکان توجه دقیقتر را میدهد.
در مورد فرایند تولید میتوان گفت که دادههایی که می تواند مورد استفاده برای علم اجتماعی و فرهنگی امروز قرار گیرد در نتیجه فرایندی طولانی و پیچیده در پایگاههای مختلف تولید شدهاند. پژوهشگران علوم اجتماعی نیز روز به روز به استفاده از این دادهها علاقه بیشتری پیدا میکنند. بنابراین روشهای آماری استفاده از این دادهها نیز رو به گسترش است تا پیچیدگی دادهها کمتر شود. از این جهت، فرایند «استفاده» و «تفسیر» دادهها، به دانش اجتماعی وابسته میشود و به تعبیری میتوان گفت که داده در فرایند تفسیر از «پایگاه» خود منقطع میشود.
[۱] http://www.internetlivestats.com/