مقالات

علوم انسانی دیجیتال در قرن بیست و یکم: مادۀ دیجیتال به‌عنوان یک نیروی محرکه

علوم انسانی در عصر دیجیتال

یکی از عوامل تحول‌آفرین اصلی در علوم انسانی در آغاز قرن بیست و یکم، تغییر از منابع آنالوگ به منابع دیجیتال است و این تغییر به روش‌های گوناگونی بر علوم انسانی تأثیر خواهد گذاشت. اما همه انواع مواد دیجیتال به یک شکل دیجیتالی نیستند؛ تمایز میان «دیجیتالی‌شده»، «متولد دیجیتال» و «دیجیتال از نو متولدشده» می‌تواند به ما کمک کند که درک کنیم چگونه هر…

نویسنده: نیلز بروگر (Niels Brügger)، مرکز مطالعات اینترنت و نت‌لب، دانشگاه آرهوس

چکیده

در این مقاله استدلال می‌شود که یکی از عوامل تحول‌آفرین اصلی در علوم انسانی در آغاز قرن بیست و یکم، تغییر از منابع آنالوگ به منابع دیجیتال است و این تغییر به روش‌های گوناگونی بر علوم انسانی تأثیر خواهد گذاشت. اما همه انواع مواد دیجیتال به یک شکل دیجیتالی نیستند؛ تمایز میان «دیجیتالی‌شده»، «متولد دیجیتال» و «دیجیتال از نو متولدشده» می‌تواند به ما کمک کند که درک کنیم چگونه هر یک از این انواع مواد دیجیتال، مراحل مختلف کار پژوهشی را به شیوه‌ای منحصر به فرد تحت تأثیر قرار می‌دهند. این موضوع با مقایسه‌ای دقیق بین ماهیت مجموعه‌های دیجیتالی‌شده و بایگانی‌های وب تشریح می‌شود.

فهرست

1. علوم انسانی – مسئله چیست؟

چالش‌ها و بحران‌هایی که علوم انسانی با آن‌ها روبه‌رو بوده، برای دهه‌ها بر مباحث مربوط به جایگاه و آینده این حوزه تأثیر گذاشته است. جفری گالت هارپام در مقاله تأثیرگذارش با عنوان «زیر و فراتر از بحران در علوم انسانی»، از اصطلاح «بحران دائمی در علوم انسانی» استفاده می‌کند که به باور او، در نیم قرن گذشته بر این حوزه سایه انداخته است [Harpham 2005, 21]. او ادامه می‌دهد:

«گاهی این بحران — که ابعاد آن را می‌توان با کاهش تعداد ثبت‌نام‌ها، تعداد دانشجویان، دروس ارائه‌شده و دستمزدها اندازه‌گیری کرد — به‌عنوان یک فاجعه جداگانه و تا حد زیادی خودتحمیل‌شده که محدود به چند رشته خاص است، توصیف می‌شود؛ گاهی نیز این بحران با آشفتگی کلی در آموزش لیبرال یا حتی با فروپاشی اخلاقی و فقر فکری کل فرهنگ مرتبط دانسته می‌شود. اما یک نکته با نظم و تأکید فراوان پدیدار می‌شود: دانشمندان علوم انسانی، که در مورد مأموریت خود پراکنده و سردرگم هستند، از عدم توانایی در انتقال ارزش خاص خود به فرهنگ عمومی رنج می‌برند؛ آن‌ها دچار چیزی هستند که منتقد و پژوهشگر، لوئیس مناند، آن را “بحران توجیه” نامیده است.» [Harpham 2005, 21–22]

بسیاری از نشانه‌های بحران که هارپام مطرح می‌کند، در مباحثات مختلف بررسی شده‌اند [Olmos-Peñuela 2014]، [Belfiore 2014]، [Parker 2007]، [Nussbaum 2010] و نشانه‌های دیگری نیز به آن افزوده شده است؛ از جمله کاهش بودجه عمومی [Pascoe 2002]، فقدان میان‌رشته‌ای بودن [Bassnett 2002] و تأثیر آنچه به‌عنوان «غیرانسانی» در علوم انسانی شناخته می‌شود [Barnett 2014].

این ویژگی‌های علوم انسانی ممکن است کاملاً درست و مرتبط باشند، اما معمولاً از یک تغییر عمده که به‌آرامی از اواخر دهه ۱۹۶۰ علوم انسانی را تحت تأثیر قرار داده و اکنون با سرعت زیادی در حال ظهور است، غافل می‌مانند: ورود «دیجیتال» به علوم انسانی.

در دهۀ گذشته، مباحث پیرامون رایانۀ دیجیتال و علوم انسانی عمدتاً تحت عنوان کلی «علوم انسانی دیجیتال» مطرح شده‌اند. علوم انسانی از طریق دیجیتالی‌سازی موضوعات مورد مطالعه، به‌کارگیری ابزارهای تحلیلی دیجیتال، و ایجاد ابزارهای ارتباطی دیجیتال برای همکاری در فرآیند پژوهش، بحث و انتشار نتایج علمی، و تعامل با جامعه به‌طور کلی، ماهیتی دیجیتال یافته است.
رویکردی خودبازاندیشانه‌تر نسبت به علوم انسانی دیجیتال نیز پدیدار شده است که طیفی از مانیفست‌هایی مانند مانیفست علوم انسانی دیجیتال [Digital Humanities Manifesto]، تا مجموعه‌های ویرایش‌شده، تک‌نگاری‌ها و مقالاتی را دربرمی‌گیرد که این حوزه را ترسیم می‌کنند [Screibman]، [Berry 2012]، [Gold 2012]، [Burdick et al. 2012]، [Warwick 2012]، [Borgman 2009]، [Svensson 2010]، [Deegan 2014]، [Svensson 2012a]، [Liu 2011]، [Jones 2014]. همچنین، ویژه‌نامه‌هایی از مجلات علمی [DHQ e-Science 2009]، [Arts and Humanities in Higher Education 2011]، [Historical Social Research 2012]، [MedieKultur 2014] و گزارش‌هایی از نهادهایی نظیر [American Council of Learned Societies 2006]، [European Commission 2011]، [Holm 2015] در این زمینه منتشر شده‌اند.
با این حال، تلاش‌های نظام‌مندی برای شناسایی (برخی از) عوامل محرک ورود فناوری دیجیتال به علوم انسانی انجام نشده است. اگر دیجیتال‌سازی واقعاً در علوم انسانی جایگاه پررنگ‌تری می‌یابد، دلیل این امر چه می‌تواند باشد؟

به‌طور مسلم، تغییری عمده و غیرقابل‌برگشت در بطن علوم انسانی رخ داده است، زیرا منابع و داده‌هایی که در بسیاری از رشته‌های انسانی مطالعه می‌شوند، از آنالوگ به دیجیتال تبدیل شده‌اند. چند عدد می‌تواند این موضوع را نشان دهد: در سال ۲۰۰۰، ۷۵٪ از کل داده‌های ذخیره‌شده به‌صورت آنالوگ (کاغذ، فیلم، عکس چاپی، صفحه وینیل، نوار کاست مغناطیسی و غیره) بودند، اما در سال ۲۰۰۷ این مقدار به ۷٪ کاهش یافت و در سال ۲۰۱۲، به ۲٪ رسید [Mayer-Schönberger 2013, 8–9]. از سال ۱۴۵۳ تا ۱۵۰۳، پس از اختراع چاپ، هشت میلیون کتاب منتشر شد و مقدار مطالب نوشتاری در جهان در عرض ۵۰ سال دو برابر شد. اما امروزه حجم داده‌های دیجیتال تقریباً هر سه سال یک‌بار دو برابر می‌شود، در حالی که حجم داده‌های آنالوگ تقریباً هیچ رشدی ندارد [Mayer-Schönberger 2013, 8–10].

اگرچه ممکن است این ارقام مورد بحث قرار گیرند، اما روند کلی بدون تردید مشخص است: در دهه اخیر، ما شاهد تغییر اساسی از مواد آنالوگ به دیجیتال بوده‌ایم و احتمالاً این تازه آغاز راه است. بنابراین می‌توان استدلال کرد که یکی از عوامل دگرگون‌کننده اصلی در علوم انسانی قرن ۲۱، حرکت از منابع آنالوگ به منابع دیجیتال است. قبل از سال ۲۰۰۰، ورود دیجیتال به علوم انسانی از طریق مجموعه‌های دیجیتالی‌شده، ابزارها و بسترهای ارتباطی شاید یک انتخاب اضافی بود، اما در آینده این‌گونه نخواهد بود.

اگر این ویژگی علوم انسانی در آغاز قرن ۲۱ درست باشد، باید از خود بپرسیم که چگونه باید این تغییر را مفهوم‌سازی کنیم، این تغییر چه تأثیری بر علوم انسانی خواهد داشت و علوم انسانی تا چه حد دیجیتالی خواهد شد.

با در نظر گرفتن آمارهای ذکرشده به‌عنوان نقطۀ آغاز، این مقاله به بررسی این پرسش‌های کلی خواهد پرداخت، با تمرکز بر پرسش اصلی، یعنی ماهیت منابع دیجیتال. استدلال اصلی این است که همۀ انواع مادۀ دیجیتال صرفاً به دلیل دیجیتال بودن، به یک شکل دیجیتال نیستند. برای پشتیبانی از این استدلال، تمایزی میان منابع دیجیتالی‌شده (digitized)، ذاتاً دیجیتال (born-digital) و بازدیجیتال‌شده (reborn-digital) معرفی می‌شود. با استفاده از این تمایز به‌عنوان نقطۀ شروع، تفاوت‌های اساسی بین دو نمونۀ مادۀ دیجیتالی‌شده و بازدیجیتال‌شده از طریق مقایسۀ دقیق ماهیت مجموعه‌های دیجیتالی‌شده و آرشیوهای وب تشریح می‌شود و بررسی می‌گردد که این تفاوت‌ها چگونه بر نحوۀ استفادۀ علمی از این منابع تأثیر می‌گذارند.

اما پیش از پرداختن به جزئیات بیشتر در این زمینه، لازم است ابتدا تأملی کوتاه بر این مسئله داشته باشیم که «دیجیتال» چه معنایی می‌تواند داشته باشد و این مفهوم چگونه در ترکیب با علوم انسانی، مفهوم «علوم انسانی دیجیتال» را شکل می‌دهد.

2. دیجیتال، علوم انسانی – علوم انسانی دیجیتال

یکی از چالش‌های اصلی در بررسی پرسش‌های مطرح‌شده این است که «علوم انسانی دیجیتال» میدان رقابت تعاریف مختلف است – آیا این حوزه یک «بستر گسترده» است؟ [Svensson 2012b, 36] یا یک «منطقۀ مبادله و محل ملاقات»؟ ([Svensson 2011, 50–56]). این مسئله نه‌تنها در مورد علوم انسانی دیجیتال بلکه درباره خود مفهوم «دیجیتال» و همچنین «علوم انسانی» نیز صادق است. تلاش‌ها برای تعریف علوم انسانی دیجیتال اغلب فراموش می‌کنند که علوم انسانی پیش از آنکه ظاهراً دیجیتال شوند، چه بودند، و این امر بر پیچیدگی و ابهام آن می‌افزاید.

با هدف معرفی درکی از علوم انسانی دیجیتال که به‌عنوان چارچوب و پشتیبان استدلال‌های مقاله درباره منابع دیجیتال به کار خواهد رفت، این بخش به‌طور مختصر به «رایانه دیجیتال» و همچنین موضوعات اصلی که تعاریف و ترسیم‌های علوم انسانی باید به آن‌ها بپردازند، اشاره خواهد کرد. سپس این دو محور فکری با یکدیگر ترکیب می‌شوند تا به درکی جامع از علوم انسانی دیجیتال دست یابیم.

2.1 دیجیتال

نکته قابل‌توجه در ادبیات مربوط به علوم انسانی دیجیتال این است که به مفهوم «دیجیتال» چندان پرداخته نشده است (برای مثال، [Laue 2004]، [Deegan 2014, 30]). اشاره‌ها به دیجیتال عمدتاً بر توسعه تاریخی رایانه‌ها به‌عنوان مصنوعات و استفاده از آن‌ها در علوم انسانی متمرکز است، بدون آنکه بازتاب‌های نظام‌مندی درباره خود مفهوم «دیجیتال» و ماهیت دیجیتالی رایانه ارائه شود؛ چیزی که ویژگی اصلی آن را تشکیل می‌دهد.

یکی از استثناها در این زمینه اوِنز (Evens) است که کد دودویی متشکل از صفرها و یک‌ها را نقطه آغازین توسعه مصنوعات و فرهنگ دیجیتال می‌داند: «عنصر مشترک در تمام فناوری‌های دیجیتال، جنبه وحدت‌بخش فرهنگ‌ها، هنرها و رسانه‌هایی که ما آن‌ها را دیجیتال می‌نامیم، کد دودویی گسسته است.» [Evens 2012, 7]. بنابراین، کد دودویی شرط امکان مصنوعات فناوری است (بری نیز بر مفهوم دیجیتال تأکید دارد و به کارهای انجام‌شده در حوزه نرم‌افزار و مطالعات انتقادی کد تکیه می‌کند)، اما بدون ارائه تعریفی از دیجیتال [Berry 2012, 4–6]. اوِنز کد دودویی صفرها و یک‌ها را به‌عنوان اعدادی که می‌توان محاسبه کرد، در نظر می‌گیرد [Evens 2012]، اما رویکرد دیگری نیز وجود دارد که آن‌ها را به‌جای اعداد، به‌عنوان حروف در نظر بگیرد. در این صورت، مفهوم دیجیتال از یک مسئله ریاضی به یک مسئله متنی تغییر می‌کند. این رویکرد را می‌توان در تعریف فینمن (Finnemann) از رایانه دیجیتال یافت.

در مفهوم‌پردازی فینمن، رایانه دیجیتال دارای سه ویژگی ثابت و تغییرناپذیر است:
۱) یک الفبای مکانیکی متشکل از تعداد محدودی از حروف که هرکدام از معنا تهی هستند،
۲) یک نحو الگوریتمی، و
۳) یک واسط که تعیین‌کننده معناشناسی آن نحو است [Finnemann 1999]، همچنین بنگرید به [Brügger and Finnemann 2013, 68–69].

ایده‌ای که بیان می‌کند صفرها و یک‌ها را می‌توان به‌عنوان حروف و نه اعداد در نظر گرفت، مبتنی بر این فرض است که اعداد از معنا تهی نیستند—عدد ۰ به معنی «صفر» و عدد ۱ به معنی «یک» است—اما برای اینکه بتوان آن‌ها را از طریق نحو الگوریتمی ترکیب کرد، باید همانند دیگر حروفی که در قالب کلمات ترکیب می‌شوند، تهی از معنا باشند. هر سه ویژگی یادشده ضروری هستند، اما ضرورتاً شکل خاصی ندارند. امروزه، الفبای مکانیکی متشکل از تعداد محدودی از حروف همان الفبای دودویی است که شامل دو حرف ۰ و ۱ می‌شود، نحو الگوریتمی در اشکال مختلفی از سطح ماشین تا سطح کاربر وجود دارد، و واسط می‌تواند هر نوع دستگاهی باشد که بتواند الفبای دیجیتال و نحوهای الگوریتمی آن را پردازش کند، از رایانه‌های شخصی و دستگاه‌های همراه گرفته تا رایانه‌های مرکزی و شبکه‌ای.

پیامد این رویکرد به مفهوم دیجیتال این است که در بنیادی‌ترین سطح، رایانه دیجیتال را می‌توان به‌عنوان یک «ماشین نوشتن» در نظر گرفت، که در آن حروف برای تشکیل «متون» در تمام سطوح رایانه با یکدیگر ترکیب می‌شوند، و این متون در هر لحظه، حتی در سطح تک‌بیتی، قابل ویرایش هستند. در راستای نکته‌ای که اوِنز مطرح کرد، مهم است که ماهیت بنیادی دیجیتالی رایانه‌ها را در درک علوم انسانی دیجیتال لحاظ کنیم، زیرا این ویژگی، شرط امکان تمام اشکال عینی علوم انسانی دیجیتال است.

2.2 علوم انسانی

شایان ذکر است که علوم انسانی همواره به‌صورت جمع به کار می‌روند. البته، این جمع بودن به تنوع رشته‌های مختلف علوم انسانی اشاره دارد، اما می‌توان آن را نشانه‌ای از این دانست که «علوم انسانی» حوزه‌ای بسیار گسترده و متنوع است و تعریف واحد و مشترکی برای آن وجود ندارد. با این حال، می‌توان چندین موضوع کلیدی را شناسایی کرد که معمولاً در تعریف علوم انسانی مورد بحث قرار می‌گیرند.

نخست، باید به مسئلۀ مرزبندی‌ها پرداخت: چه چیزی درون یا بیرون علوم انسانی قرار می‌گیرد؟ آیا انسان‌شناسی یک علم اجتماعی است یا بخشی از علوم انسانی محسوب می‌شود؟ آیا حقوق باید جزو علوم انسانی دانسته شود یا بخشی از علوم اجتماعی؟ [Howarth 2004] همچنین، آیا ارتباطات یک رشتۀ علوم انسانی است یا علوم اجتماعی؟ [Gronbeck 2005] و چگونه باید رشته‌های نوظهوری مانند ادبیات و پزشکی [Bolton 2008]، یا مطالعاتی را که در مرز میان علوم انسانی و علوم شناختی قرار دارند، درک کرد؟ [Beňuš 2010]

دوم، بحث‌های مربوط به علوم انسانی معمولاً پیرامون این موضوع شکل می‌گیرند که آیا می‌توان یک موضوع مطالعۀ واحد و به‌وضوح تعریف‌شده برای آن مشخص کرد، و اینکه آیا مجموعه‌ای از رویکردهای نظری و روش‌شناختی غالب وجود دارد که در تمامی رشته‌های این حوزه قابل استفاده باشد یا خیر.

سوم، هدف علوم انسانی اغلب به‌عنوان یک ویژگی تعیین‌کننده‌ی این حوزه مطرح می‌شود. برای مثال، این پرسش مطرح است که آیا علوم انسانی باید به پیشرفت بشریت و فرهنگ انسانی کمک کنند، یا ماهیتی توصیفی داشته باشند، یا اینکه به ارزش‌های فردی، اجتماعی یا صنعتی تبدیل شوند.

و چهارم، علوم انسانی را می‌توان بر اساس تقسیم‌بندی‌های اداری آموزش عالی و پژوهش نیز مرزبندی کرد، که در این صورت، تعریف آن بیشتر ماهیتی رسمی خواهد داشت. در چنین تعریفی، علوم انسانی به آنچه در یک نهاد دانشگاهی، مانند دانشکدۀ علوم انسانی، جای می‌گیرد، محدود می‌شود.

اگرچه تعریف دقیق و یکسانی از علوم انسانی وجود ندارد، اما این چهار موضوع همواره در تلاش‌ها برای تعریف این حوزه مطرح می‌شوند. بنابراین، هر تعریفی از علوم انسانی، مجموعه‌ای خاص از پاسخ‌ها به پرسش‌های مطرح‌شده در این چهار حوزه را دربر می‌گیرد: مرزهای این حوزه چیست؟ موضوع(های) مطالعۀ آن کدام‌اند؟ نظریه‌ها و روش‌های آن چیست؟ اهداف آن چیست؟ و وابستگی نهادی آن چگونه است؟ این مجموعۀ پاسخ‌ها در طول تاریخ دستخوش تغییر بوده و ممکن است به زمینۀ ملی نیز بستگی داشته باشد. ازاین‌رو، تعریف «علوم انسانی» به‌طور دقیق و قطعی دشوار است، و نمی‌توان از آن به‌عنوان مبنای مشخصی برای درک علوم انسانی دیجیتال استفاده کرد. درعوض، باید این واقعیت را پذیرفت که علوم انسانی حوزه‌ای پویا، پیچیده و در حال تغییر است که بسته به شرایط، اشکال متفاوتی به خود می‌گیرد. به همین دلیل، هر درک و تعریفی از علوم انسانی دیجیتال باید ابتدا مشخص کند که کدام شکل از علوم انسانی موردنظر است که به عرصۀ دیجیتال وارد می‌شود.

2.3 علوم انسانی دیجیتال

همان‌طور که پیش‌تر اشاره شد، یکی از بزرگ‌ترین چالش‌ها در هر تلاشی برای تعریف علوم انسانی دیجیتال این است که نه «دیجیتال» و نه «علوم انسانی» تعریفی مشخص و یکدست ندارند. به‌ویژه باید توجه داشت که ابهام و پیچیدگی موجود در «علوم انسانی» صرفاً با اضافه شدن واژۀ «دیجیتال» از میان نمی‌رود یا حل نمی‌شود. برعکس، این تفاوت‌ها همچنان باقی می‌مانند و حتی ممکن است افزایش یابند، و هر تلاشی برای تعریف علوم انسانی دیجیتال بدون در نظر گرفتن تعریفی برای علوم انسانی، در نهایت به بحث‌هایی درباره‌ی چیستی علوم انسانی منجر خواهد شد.

بنابراین، شاید رویکرد بهتر این باشد که ابتدا از «دیجیتال» آغاز کنیم، مثلاً بر اساس تعریفی که پیش‌تر از دیجیتال ارائه شد. چنین رویکردی پیچیدگی‌های علوم انسانی را برطرف نمی‌کند، اما یک مبنای مشترک حداقلی برای بررسی چگونگی ارتباط میان علوم انسانی و دیجیتال فراهم می‌آورد.

بر این اساس، تعریف زیر برای علوم انسانی دیجیتال پیشنهاد می‌شود تا چارچوب کلی بحث درباره‌ی ماهیت خاص منابع دیجیتال را شکل دهد: علوم انسانی (فارغ از اینکه «علوم انسانی» چگونه تعریف شود) که به‌نوعی از رایانه‌های دیجیتال استفاده می‌کند و از این طریق، ویژگی‌های بنیادی رایانه را متناسب با نیازهای پژوهشی خاص خود شکل می‌دهد؛ این شکل‌دهی نیز مبتنی بر تعریفی است که خود از علوم انسانی ارائه می‌دهد، پرسش‌های پژوهشی‌ای که مطرح می‌کند، و روش‌هایی که در عمل به کار می‌بندد. مزیت این تعریف این است که، از یک سو، یک مبنای مشترک برای هرگونه تعریف دقیق‌تر از علوم انسانی دیجیتال فراهم می‌کند – یعنی مفهومی از دیجیتالی بودن – و از سوی دیگر، به‌اندازه‌ای باز و انعطاف‌پذیر است که بتواند طیف وسیع تعاریف مختلف از علوم انسانی را که در نظریه یا در عمل پژوهشی شکل گرفته‌اند، در بر گیرد، و همچنین، اشکال متنوع استفاده از رایانه را در این حوزه لحاظ کند. نکتۀ مهم این است که رابطه‌ی میان «دیجیتال» و «علوم انسانی» به‌صورت یک مسیر یک‌سویه و جبری از «دیجیتال» به «علوم انسانی» در نظر گرفته نمی‌شود. بلکه این رابطه به‌عنوان یک تعامل دیالکتیکی میان «دیجیتال» و «علوم انسانی» تلقی می‌شود که در آن، هریک دیگری را شکل داده و بازتعریف می‌کند؛ این دو به یکدیگر وابسته‌اند.

با این درک از علوم انسانی دیجیتال، اکنون نگاهی دقیق‌تر خواهیم داشت به برخی از شیوه‌های مشخصی که در آن‌ها ویژگی‌های بنیادی رایانه – شامل الفبای دیجیتال، نحو الگوریتمی و واسط کاربری – توسط روش‌های پژوهشی در علوم انسانی شکل داده شده و تغییر یافته‌اند.

3. سه نوع مادۀ دیجیتال در علوم انسانی دیجیتال

رابطۀ میان علوم انسانی و دیجیتال از جهتی بسیار بنیادین با «مادۀ مورد مطالعه» گره خورده است، زیرا به‌کارگیری ابزارهای تحلیلی دیجیتال زمانی معنا پیدا می‌کند که موضوع پژوهش، به‌نوعی در قالب دیجیتال وجود داشته باشد. در این بخش، سه رویکرد برای درک اهمیت «دیجیتالی‌بودن‌های متفاوت» مواد دیجیتال ارائه می‌شود:

نخست، یک گونه‌شناسی کلی از سه نوع مادۀ دیجیتال پیشنهاد می‌شود، بر پایه‌ی این فرض که اگرچه همۀ انواع مادۀ دیجیتال از الفبای دیجیتال مشترکی بهره می‌برند، اما این بدان معنا نیست که تمام مواد دیجیتال از هر لحاظ یکسان‌اند — به بیان دیگر، «مادۀ دیجیتال»، صرفاً «مادۀ دیجیتال» نیست.

دوم، رویکردی نظام‌مند ارائه می‌شود تا نشان دهد «دیجیتال» دقیقاً در کجای فرایند پژوهش در علوم انسانی قرار می‌گیرد.

و سوم، خلاصه‌ای کوتاه از روند تاریخی تعامل میان علوم انسانی و فناوری دیجیتال ارائه خواهد شد.

3.1 مواد دیجیتالی‌شده، زاده‌ دیجیتال، و باززاده‌ دیجیتال

از یک سو، همۀ انواع مادۀ دیجیتال ویژگی مشترکی دارند و آن اینکه «دیجیتال» هستند. اما از سوی دیگر، این «دیجیتالی‌بودن» همواره در ساختارهایی معنایی، فنی و علمی از پیش موجود جای گرفته است. این بدان معناست که مادۀ دیجیتال فقط «دیجیتال» نیست، بلکه به شیوه‌های گوناگونی دیجیتال است (بحثی مشابه دربارۀ ابزارهای دیجیتال و جای‌گرفتن آن‌ها در ساختارهای موجود در [Collins 2011] مطرح شده است).

در این بخش، گونه‌شناسی کلی‌ای از «دیجیتالی‌بودن» پیشنهاد می‌شود که بر پایۀ «خاستگاه» مادۀ دیجیتال بنا شده و سه نوع اصلی را از هم متمایز می‌سازد:
۱. مواد دیجیتالی‌شده (Digitized)،
۲. مواد زادۀ دیجیتال (Born-digital)،
۳. مواد باززادۀ دیجیتال (Reborn-digital).

مواد دیجیتالی‌شده موادی‌اند که در اصل به‌صورت آنالوگ وجود داشته‌اند و سپس دیجیتالی شده‌اند؛ برای مثال اسناد مکتوب روی کاغذ یا پوست، یا رسانه‌های الکترونیکی مانند رادیو و تلویزیون، و حتی عکس‌ها یا مدل‌های سه‌بعدی از اشیای فیزیکی.
فرآیند دیجیتالی‌سازی، هر نوع تبدیل مادۀ آنالوگ به شکل دیجیتال است — چه تایپ کردن پرزحمت اسناد بر روی کارت‌های پانچ، چه اسکن آسان‌تر اسناد برای تبدیل به فایل تصویری، و چه ضبط دیجیتال صدا یا تصویر متحرک.

ویژگی اصلی مواد دیجیتالی‌شده این است که «دیجیتال شدن» آن‌ها بر مبنای نسخه‌ای اصلی است که دیجیتال نبوده — نسخه‌ای که در بسیاری موارد هنوز قابل بازیابی است و می‌تواند به عنوان معیار یا نقطه‌ی مرجع مورد استفاده قرار گیرد (برای بازتاب‌هایی دربارۀ مجموعه‌های دیجیتالی‌شده، بنگرید به: [Hockey 2000, 11–23] و [Terras 2012]).

مواد زاده‌ دیجیتال به موادی گفته می‌شود که هرگز در قالبی غیر از دیجیتال وجود نداشته‌اند. این دسته شامل همۀ انواع محتوایی است که از آغاز بر رسانه‌های دیجیتال مانند CD-ROM، DVD، اینترنت و وب منتشر شده‌اند. این نوع از مواد دیجیتال نسخه‌ی آنالوگی برای بازگشت ندارد، زیرا «نسخۀ اصلی» آن از همان ابتدا دیجیتال بوده است (نگاه کنید به: [Berry 2012, 4]، همچنین [Jones 2014] و [Kirschenbaum 2013] که این اصطلاح را به کار برده‌اند).

مواد باززاده‌ دیجیتال اصطلاحی است که برای توصیف موادی پیشنهاد شده که در اصل «زاده‌ دیجیتال» بوده‌اند، سپس گردآوری و بایگانی شده‌اند، و در این فرایند، تا حد زیادی دچار دگرگونی شده‌اند. نمونه‌هایی از این دست عبارت‌اند از بازی‌های رایانه‌ای شبیه‌سازی‌شده (emulated) یا مطالب بایگانی‌شده از وب — که مورد دوم در بخش ۴ با جزئیات بیشتری بررسی خواهد شد.

هر یک از این سه نوع کلی را می‌توان به زیرگونه‌هایی تقسیم کرد، چنان‌که نمونه‌های بالا نیز نشان می‌دهند: برای مثال، اسناد دیجیتالی‌شده‌ای مانند روزنامه‌ها با رسانه‌های زمان‌مند دیجیتالی‌شده‌ای همچون رادیو یا تلویزیون متفاوت‌اند؛ همان‌گونه که مواد زاده‌ دیجیتال، مثلاً بازی‌های کامپیوتری روی DVD با محتوای آنلاین یا اپلیکیشن‌های موجود روی آی‌پد تفاوت دارند (نگاه کنید به بخش ۳.۲).

3.2 دیجیتال در فرایند پژوهش پژوهشگر علوم انسانی – یک رویکرد نظام‌مند

ماهیت خاص هر یک از سه نوع ماده‌ی دیجیتال تأثیر مستقیمی بر نحوه‌ی استفاده و مواجهه‌ی پژوهشگر با آن‌ها در فرایند تحقیق دارد. اما پیش از بررسی جزئی‌تر اینکه این تأثیر چگونه در جهان دیجیتال بروز می‌یابد، بهتر است نگاهی به یک نمایش شماتیک از چگونگی شکل‌گیری فرایند تحقیق در دوران پیشا‌دیجیتال بیندازیم (نگاه کنید به شکل ۱). این مدل بسیار کلی ممکن است با همه‌ی شاخه‌های علوم انسانی همخوانی نداشته باشد، اما تصویری مناسب از جایگاه احتمالی دیجیتال در فرایند پژوهشی بیشتر رشته‌ها ارائه می‌دهد. افزون بر این، باید تأکید کرد که آنچه به عنوان دو جهان متمایز — آنالوگ و دیجیتال — ارائه می‌شود، در عمل و در دنیای دیجیتال امروز بسیار درهم‌تنیده است، به این معنا که حتی پژوهشگرانی که خود را «انسان‌گرای دیجیتال» می‌نامند، در مراحل مختلف پژوهش خود بین محیط‌های آنالوگ و دیجیتال جابجا می‌شوند. اما برای وضوح بحث، این دو محیط علمی به‌صورت دو محیط مجزا معرفی می‌شوند.

فرایند پژوهش به چهار مرحله‌ی اصلی تقسیم می‌شود: گردآوری مواد مورد مطالعه، تحلیل آن‌ها، بحث و بررسی نتایج و در نهایت انتشار آن‌ها. این روند ممکن است تکرارشونده باشد؛ برای نمونه، تحلیل ممکن است به گردآوری داده‌های جدید منجر شود، بحث‌ها ممکن است به بازنگری تحلیل بینجامد، و فرآیند انتشار ممکن است بر همه‌ی مراحل پیشین اثر بگذارد (ماهیت تکرارشونده از طریق فلش‌های بازگشتی نشان داده شده است).

نکته‌ی کلیدی در این رویکرد آن است که ماهیت ماده‌ی مورد مطالعه تا حد زیادی تعیین‌کننده – یا دست‌کم محدودکننده‌ی دامنه‌ی امکانات – برای هر یک از این چهار مرحله است. مواد آنالوگ باید به شیوه‌ای آنالوگ گردآوری شوند، که این ممکن است به معنای نیاز پژوهشگر به مراجعه‌ی حضوری به محل نگهداری اشیاء یا اسناد باشد؛ تحلیل آن‌ها نیز باید با بهره‌گیری از ابزارهای کمکی همچون نمایه‌های چاپی، کارت‌های فیش‌برداری و نیز نحوه‌ی سازمان‌دهی در بناها و نهادهای فیزیکی حاوی مجموعه‌ها صورت گیرد (برای مثال در نهادهایی همچون موزه‌ها، کتابخانه‌ها، آرشیوها و گالری‌ها که به اختصار «GLAM» نامیده می‌شوند). بحث‌ها عمدتاً باید به‌صورت حضوری، مثلاً در همایش‌ها، یا از طریق ارائه‌های پیش‌انتشار مانند مقالات کنفرانسی صورت گیرد، و مرحله‌ی انتشار معمولاً در رسانه‌های چاپی مانند کتاب‌ها، مجلات یا روزنامه‌ها یا در برخی موارد در رسانه‌های الکترونیکی (رادیو، تلویزیون) انجام می‌شود.

اما تنها آنالوگ بودن اشیاء مورد مطالعه بر مراحل پژوهش تأثیر نمی‌گذارد، بلکه ویژگی‌های آن‌ها در سطحی دقیق‌تر نیز اثرگذار است. از این رو، تمایزی نظام‌مند معرفی می‌شود میان، از یک‌سو، اشیای نشانه‌مند (سِمیوتیکی) و غیرنشانه‌مند، و از سوی دیگر، موادی که یا از گذشته به ما رسیده‌اند یا توسط خود پژوهشگر خلق شده‌اند. اسناد نشانه‌مند که از گذشته به‌جا مانده‌اند، می‌توانند شامل اشیائی باشند که حاوی نظام‌های نشانه‌ای‌اند، مبتنی بر واحدهای گسسته (مانند اسناد، کتاب‌ها، روزنامه‌ها همراه با نوشتار یا تصاویر ثابت، یا فیلم/تلویزیون همراه با نوشتار، صدا و تصویر متحرک)؛ در حالی‌که اشیای غیرنشانه‌مند می‌توانند هرگونه مصنوع فیزیکی باشند. درباره‌ی مواد خلق‌شده توسط خود پژوهشگر، این مواد نیز می‌توانند یا نشانه‌مند باشند (مثلاً مصاحبه‌ی ضبط‌شده، یادداشت‌های میدانی، پرسش‌نامه‌های کاغذی و مانند آن) یا غیرنشانه‌مند، همچون طرح‌های اولیه‌ی طراحی یا بازسازی‌های باستان‌شناسی تجربی. باید تأکید کرد که این دو دسته‌بندی، تمایزاتی تحلیلی هستند که با هدف برجسته‌سازی ویژگی غالب هر نوع ماده‌ی مطالعاتی صورت می‌گیرند. بنابراین، تمایز روشن بین نشانه‌مند و غیرنشانه‌مند، این واقعیت را کمرنگ می‌کند که مواد نشانه‌مند نیز به‌نوعی مصنوعات فیزیکی هستند (مثلاً کتاب‌ها)، و در عین حال، مصنوعات نیز دارای معنایی هستند، حتی اگر حامل نظام نشانه‌ای خاصی نباشند (مثلاً یک سلاح باستانی می‌تواند نماد قدرت فرهنگی باشد). همچنین، مواد به‌جا‌مانده از گذشته هرگز به‌صورت بی‌طرفانه بررسی نمی‌شوند، بلکه همیشه از سوی پژوهشگر با نیت خاصی انتخاب می‌شوند تا سوژه‌ی مطالعه ساخته شود؛ و از سوی دیگر، مواد خلق‌شده توسط پژوهشگر نیز اغلب بر پایه‌ی مواد گذشته ساخته می‌شوند.

همان‌گونه که اشاره شد، هدف این است که تأکید شود ویژگی‌های گوناگون اشیای مطالعاتی تأثیر مستقیمی بر نحوه‌ی مواجهه با آن‌ها در چهار مرحله‌ی پژوهش دارند (که با پیکان‌های نازک نشان داده شده‌اند). رویکرد تحلیلی نسبت به ماده‌ی مورد مطالعه، بسته به آنکه با اسناد یا مصنوعات به‌جا‌مانده سروکار داشته باشیم یا با مصاحبه‌ها یا آزمایش‌های باستان‌شناسی خلق‌شده توسط پژوهشگر، متفاوت است؛ و به همان نسبت، بحث و انتشار نتایج نیز ممکن است بسته به نوع ماده تفاوت یابد.

اکنون بیایید ببینیم که این فرآیند در جهان دیجیتال چگونه رخ می‌دهد، جایی که پژوهشگر با سه نوع اصلی ماده‌ی دیجیتال که در بخش ۳.۱ مطرح شد، مواجه می‌شود.

این واقعیت که ماهیت ماده‌ی مورد مطالعه، دامنه‌ای از امکانات را برای هر یک از چهار مرحله‌ی فرایند تحقیق فراهم می‌کند، در مورد مواد دیجیتال نیز صدق می‌کند. در مقایسه با مواد آنالوگ، مواد دیجیتال – اگر به صورت آنلاین در دسترس باشند – می‌توانند از راه دور گردآوری شوند؛ ابزارهای دیجیتال برای جستجو، پالایش و تحلیل مواد می‌توانند تحلیل را پشتیبانی کنند؛ و مواد دیجیتال فرصت‌های تازه‌ای برای بحث (مانند وبلاگ‌ها، ویکی‌ها، پایگاه‌های پیش‌انتشار) و برای انتشار و تعامل (مانند فایل‌های کامپیوتری، پایگاه‌داده‌ها، وب‌سایت‌ها، مصورسازی‌هایی همچون جهان‌های مجازی، سامانه‌های اطلاعات جغرافیایی، نقشه‌ها و جدول‌های زمانی تعاملی) فراهم می‌کنند.

با این حال، هرچند این فرصت‌ها برای تعامل با مواد دیجیتال تا حد زیادی ناشی از ماهیت دیجیتال آن‌هاست، اما در سطحی جزئی‌تر، آن‌ها همچنین تابعی هستند از نوع مشخص هر یک از سه دسته‌ی اصلی مواد دیجیتال که پیش‌تر معرفی شدند. مواد دیجیتال‌شده، زاده‌دیجیتال، و باززاده‌دیجیتال، هر یک شکل‌های خاصی از بهره‌برداری علمی را فراهم می‌کنند، گرچه ممکن است هم‌پوشانی‌هایی نیز رخ دهد: مواد دیجیتال‌شده می‌توانند به‌شیوه‌هایی خاص برای جمع‌آوری، تحلیل، بحث و انتشار مورد استفاده قرار گیرند که مختص دیجیتال بودن آن‌هاست؛ در حالی‌که مواد زاده‌دیجیتال باید به‌شیوه‌ای دیگر و مواد باززاده‌دیجیتال نیز به شکلی متفاوت دیگر مورد بررسی قرار گیرند. این موضوع در بخش ۴ با مقایسه‌ی ماهیت مواد دیجیتال‌شده و باززاده‌دیجیتال به‌تفصیل بررسی خواهد شد.

این سه نوع اصلی ماده‌ی دیجیتال، فرایند پژوهش را به روش‌های گوناگون تحت تأثیر قرار می‌دهند، اما پرسش‌های دیگری نیز در این میان قابل طرح هستند: آیا ماده‌ی مورد نظر نشانه‌مند است یا غیرنشانه‌مند؟ و آیا این ماده از گذشته به‌جا‌مانده یا توسط پژوهشگر خلق شده است؟ درباره‌ی مواد دیجیتال‌شده، یکی از مسائل اساسی این است که مصنوعات آنالوگ و اشیاء خلق‌شده توسط پژوهشگران نمی‌توانند خود به خود دیجیتال شوند، بلکه باید به‌گونه‌ای به تصویر یا بازنمایی دیجیتال تبدیل شوند. و در مورد مواد زاده‌دیجیتال، اشیاء غیرنشانه‌مند احتمالاً به‌طور کامل دیجیتال نیستند، بلکه تنها اجزایی دیجیتال دارند. درباره‌ی مواد باززاده‌دیجیتال نیز، هر یک از چهار زیرگروه ماده احتمالاً تفاوت‌هایی خواهند داشت، چرا که این مواد به احتمال زیاد در فرآیند انتقال از فضای زاده‌دیجیتال به فضای آرشیوی، به‌شکل‌های مختلف دچار دگرگونی می‌شوند.

شکل ۱. نمایی شماتیک از فرایند پژوهش پیش از ظهور فناوری دیجیتال.
شکل ۲. نمایی شماتیک از فرایند پژوهش در عصر دیجیتال.

3.3 تعامل میان دیجیتال و علوم انسانی – نگاهی اجمالی بر یک روند تاریخی

رویکرد نظام‌مندی که پیش‌تر توضیح داده شد، با تکیه بر منشأ سه نوع اصلی از مواد دیجیتال، جایگاه فناوری دیجیتال را در روند پژوهش علمی مشخص می‌کند. اما همین رویکرد تحلیلی را می‌توان برای ترسیم اجمالی تحولات تاریخی در تعامل بین علوم انسانی و فناوری دیجیتال نیز به کار گرفت. ه‌عنوان یک فرض اولیه، می‌توان سه موج اصلی را در رابطه‌ی میان علوم انسانی و فناوری دیجیتال شناسایی کرد (برای نمونه‌هایی دیگر از دوره‌بندی، بنگرید به: [Berry 2012, 3–6]، [Thaller 2012, 14–17]، و [Finnemann 2014, 95–100]).

موج نخست در دهۀ ۱۹۶۰ آغاز می‌شود، زمانی که حوزه‌های پژوهشی تازه‌ای چون «محاسبات علوم انسانی» (Humanities Computing)، «محاسبات ادبی» (Literary Computing)، «زبان‌شناسی رایانشی» (Computational Linguistics) و بعدها «تاریخ دیجیتال» (Digital History) شکل گرفتند. [Screibman]، [Cohen and Rosenzweig 2005]، [Finnemann 2014]، و [McCarty 2005].
این رشته‌های نوظهور در ابتدا بر پایۀ استفاده از رایانه‌های بزرگ مستقل (stand-alone mainframes) بنا شدند؛ با گذشت زمان، شبکه‌های اختصاصی رایانه‌ای گسترش یافتند و در مرحله‌ای بعد، اینترنتِ باز به کار گرفته شد. ادر این دوره، تمرکز اصلی بر «مواد دیجیتال‌شده» (digitized material) بود؛ یعنی منابع آنالوگ که به صورت دیجیتال تبدیل شده‌اند.

موج دوم در اواسط دهۀ ۱۹۹۰ آغاز می‌شود، زمانی که دو حوزۀ پژوهشی جدید و تا حدی هم‌پوشان، یعنی «مطالعات رسانه‌های نو» (New Media Studies) و «مطالعات اینترنت» (Internet Studies) پدیدار می‌شوند. این دو حوزه معمولاً در زمرۀ علوم انسانی دیجیتال طبقه‌بندی نمی‌شوند، اما اگر نگاه‌مان به چگونگی ورود فناوری دیجیتال به دل علوم انسانی باشد – یا دست‌کم به برخی از رشته‌های آن – شاید بهتر باشد که آن‌ها را نیز در این دسته بگنجانیم. مطالعات رسانه‌های نو و مطالعات اینترنت، حوزه‌هایی گسترده‌اند که طیف متنوعی از رشته‌ها را دربرمی‌گیرند، اما نقطۀ اشتراک همه‌ی آن‌ها، تمرکز بر رسانه‌های جدید و اینترنت است (برای نگاهی اجمالی به ارتباط میان علوم انسانی دیجیتال و مطالعات اینترنت، بنگرید به: [Brügger 2005, 106–107]). برخلاف موج اول، موج دوم از همان آغاز بر «مواد زادۀ دیجیتال» (born-digital material) متمرکز است – یعنی منابعی که ذاتاً دیجیتال هستند و هرگز شکل آنالوگ نداشته‌اند، زیرا موضوعات مورد مطالعه از ابتدا دیجیتال بوده‌اند.

موج سوم، درواقع ادامه و گسترش موج دوم است و زیرمجموعه‌ای از آن به شمار می‌آید، با این تفاوت که بُعد تاریخی را هم به مطالعۀ مواد زادۀ دیجیتال می‌افزاید: از اوایل دهۀ ۲۰۰۰، مطالعات تاریخی اینترنت به‌عنوان بخشی از مطالعات اینترنت ظهور می‌کنند.. یکی از مهم‌ترین موضوعات این موج «وب آرشیوشده» (archived web) است، اگرچه انواع دیگرِ مواد زادۀ دیجیتال که حفظ شده‌اند نیز در آن گنجانده می‌شوند. در موج سوم، تمرکز بر «مواد باززادۀ دیجیتال» (reborn-digital material) است ؛ یعنی منابعی که ابتدا به شکل دیجیتال پدید آمده‌اند و سپس با هدف بایگانی‌شدن، به‌نوعی دگرگون یا منتقل شده‌اند(برای مروری بر تاریخ‌نگاری‌های وب، بنگرید به: [Brügger 2010, 8–13]).

نکتۀ مهم این است که این سه موج جایگزین یکدیگر نشده‌اند، بلکه به شکل هم‌زمان به مسیر خود ادامه داده‌اند، به همین دلیل امروزه ما با هر سه نوع اصلی از مواد دیجیتال مواجهیم: مواد دیجیتال‌شده، زادۀ دیجیتال، و باززادۀ دیجیتال.

4. محتوای باززادۀ دیجیتال – مطالعه موردی: وب آرشیوشده

همان‌طور که پیش‌تر اشاره شد، یکی از مهم‌ترین انواع مواد باززادۀ دیجیتال، وب آرشیوشده است. در این بخش، مطالعۀ موردی وب آرشیوشده معرفی می‌شود، زیرا اهمیت تشخیص تفاوت‌های میان انواع مواد دیجیتال را نشان می‌دهد، و در نتیجه می‌تواند ضرورت به‌کارگیری رویکردهای متفاوت در مواجهه با این مواد را روشن کند.
در این‌جا وب آرشیوشده با مواد دیجیتال‌شده مقایسه می‌شود، زیرا هر دو نوع، شکلی از تبدیل مواد موجود هستند: یکی از مواد آنالوگ و دیگری از مواد زادۀ دیجیتال‌. اما چون هم ماهیت ماده‌ای که تبدیل می‌شود و هم فرآیندهای تبدیل، بسیار متفاوت‌اند، در نتیجه، نتایج نیز متفاوت خواهند بود. این مقایسه کمک می‌کند تفاوت‌های میان این دو نوع محتوای دیجیتال بهتر دیده شوند. (برای بحث‌های دقیق‌تر در این زمینه، نگاه کنید به منابع [Brügger 2005], [Brügger 2009], [Brügger 2011a], [Brügger 2011b], [Brügger 2012a], [Brügger 2013] و نیز [Dougherty 2010], [Thomas 2010], [Foot and Scheider 2006], و [Masanès 2006]).
با این حال باید تأکید کرد که چون فرایند دیجیتال‌سازی می‌تواند دامنه‌ای بسیار گسترده داشته باشد – از تایپ کردن اسناد نوشتاری، کارت‌های پانچ، رمزگذاری متون، اسکن تصاویر، تا ضبط دیجیتالی صدا و تصویر – مجموعه‌های دیجیتال‌شده پیچیده‌تر و متنوع‌تر از چیزی هستند که در این معرفی کلی ارائه می‌شود. بنابراین اگر بخواهیم آن‌ها را دقیق‌تر تحلیل کنیم، باید به تفاوت‌های میان انواع‌شان – از جمله منبع اولیه و نحوۀ دسترسی – توجه داشته باشیم.

4.1 چرا وب را بایگانی می‌کنیم، در حالی که خودش دیجیتال است؟

پیش از پرداختن به ویژگی‌های وب آرشیوشده مهم است به این نکته توجه کنیم که چرا اساساً وب بایگانی می‌شود؛ زیرا وب، رسانه‌ای ذاتاً دیجیتال است که همواره «در دسترس» به نظر می‌رسد.
اگرچه ممکن است تصور کنیم همیشه می‌توان محتوای وب را یافت، اما واقعیت این است که محتوای وب با سرعتی بی‌سابقه در حال تغییر است [Brügger 2005, 15]، [Dougherty 2010, 8]، [Brügger 2012a, 318]. آگاهی از این تغییرات پیوسته در کنار درک اهمیت فزایندۀ وب در جوامع ما و نقش آن به‌عنوان منبعی تاریخی در آینده، احتمالاً محرک اصلی مؤسسات میراث فرهنگی و پژوهشگران برای بایگانی کردن وب بوده است. آن‌ها می‌خواهند مطمئن شوند که این محتوا برای آیندگان حفظ خواهد شد.

4.2 بایگانی وب در مقیاس کلان و خرد

«بایگانی وب» به هر نوع اقدام هدفمند و آگاهانه برای حفظ محتوای آنلاین اطلاق می‌شود [Brügger 2011a, 25]. دو نوع بایگانی وب را می‌توان از هم متمایز کرد: بایگانی کلان و بایگانی خرد [Brügger 2005, 10–11].

بایگانی در مقیاس کلان به بایگانی‌ای گفته می‌شود که توسط نهادهای رسمی مانند کتابخانه‌های ملی انجام می‌شود، با هدف حفظ میراث فرهنگی یک کشور و فراهم‌سازی امکان پژوهش‌های گوناگون در آینده.

بایگانی در مقیاس خرد معمولاً توسط پژوهشگران یا گروه‌هایی تحقیقاتی انجام می‌شود، و هدف آن، حفظ محتوای مرتبط با پروژه‌ای پژوهشی خاص است.

آنچه در ادامه می‌آید بیشتر به بایگانی کلان مربوط می‌شود، اما بسیاری از نکات آن در مورد بایگانی‌های کوچک‌تر و پژوهش‌محور نیز صدق می‌کند…

4.3 اصل پایدار و ناپایدار

دیجیتال‌سازی معمولاً بر پایۀ یک نسخه‌ی آنالوگ پایدار صورت می‌گیرد؛ چه سندی روی پوست، روزنامه‌ای چاپی، یا برنامه‌ای رادیویی یا تلویزیونی روی نوار باشد.
در مقابل، «اصل» وب برای بایگانی بسیار ناپایدار است، دقیقاً به همان معنای واژه. همان‌طور که اشاره شد، احتمال زیادی وجود دارد که صفحۀ وب در مدت‌زمان کوتاهی تغییر کند یا ناپدید شود؛ بنابراین هیچ نسخۀ اصلی قابل بازگشتی وجود ندارد [Schneider and Foot 2004, 115]، [Masanès 2006, 1].

4.4 چه چیز و چگونه باید بایگانی شود؟

پیش از دیجیتال‌سازی یک مجموعۀ آنالوگ، اصلی‌ترین دغدغه این است که چه چیزی باید دیجیتال شود، و «چگونه» دیجیتال‌سازی انجام شود، و این معمولاً محدود به انتخاب سخت‌افزار و نرم‌افزار مناسب است.
اما آرشیو یا بایگانی وب راه‌های متنوعی دارد که هرکدام نتایج متفاوتی به همراه دارند. مثلاً باید تصمیم گرفت که از کجا بایگانی آغاز و در کجا متوقف شود، چه نوع فایل‌هایی لحاظ یا حذف شوند، و آیا اجازۀ بازیابی محتوای سرورهای دیگر داده شود یا نه.
در نتیجه، پرسش «چه چیزی باید بایگانی شود» در مورد وب نیز مطرح است، اما مسئلۀ مهم‌تر این است که چگونه باید وب را بایگانی یا آرشیو کرد. پیامدهای این موضوع دو مورد است:
۱) وب آرشیوشده تا زمانی که فرآیند بایگانی انجام نشده، اساساً وجود ندارد، بلکه در همین فرآیند خلق می‌شود؛
۲) اگر دو نهاد بایگانی در یک زمان مشخص بخواهند یک وب‌سایت را بایگانی کنند، به احتمال زیاد نتایج آن‌ها متفاوت خواهد بود، زیرا تنظیمات فنی بایگانی متفاوت است.
در حالی که در مجموعه‌های دیجیتال‌شده، تفاوت‌ها در نحوۀ دیجیتال‌سازی معمولاً به تفاوت‌هایی جزئی منجر می‌شود، اما در مورد بایگانی وب، نحوۀ انجام بایگانی می‌تواند دو نسخۀمنحصربه‌فرد اما متفاوت خلق کند. (همچنین باید افزود که نحوۀ کنار هم قرار دادن قطعات بایگانی‌شده در درون آرشیو می‌تواند این تفاوت‌ها را پیچیده‌تر نیز کند.)

4.5 شفافیت و ابهام

فرآیند دیجیتال‌سازی تا حد زیادی شفاف است: نهاد دیجیتال‌کننده، دید روشنی از مجموعۀ مورد نظر و از آنچه در حین دیجیتال‌سازی رخ می‌دهد، دارد.
اما در مورد بایگانی وب چنین نیست. بایگانی وب فرآیندی مبهم‌تر است، عمدتاً به این دلیل که پس از آغاز عملیات بایگانی، دقیقاً نمی‌دانیم در فضای وب چه اتفاقی می‌افتد.
مشکلات فنی ممکن است پیش بیاید؛ مثلاً ممکن است فرآیند بایگانی متوقف شود، منحرف گردد (مثلاً با افتادن در تله‌هایی مانند تقویم‌ها یا صفحات تولیدکنندۀ لینک‌های بی‌پایان)، یا با فرمت‌هایی مواجه شود که قابل بایگانی نیستند (مثل ویدئوی استریم‌شده، جاوا اسکریپت و غیره).
افزون بر این، پدیده‌ای خاص بایگانی وب که «پویایی به‌روزرسانی» نامیده می‌شود نیز به ابهام می‌افزاید [Brügger 2005, 22–23] — یعنی این‌که وب‌سایتی که در حال بایگانی است، ممکن است هم‌زمان در حال تغییر باشد، بدون آن‌که بدانیم دقیقاً چه زمانی، در کجا و چگونه این تغییرات رخ می‌دهند؛ گویی صفحات یک روزنامه حین اسکن، دائماً در حال ویرایش باشند.
از آن‌جا که نسخۀ «اصلی» وب‌سایت معمولاً پس از بایگانی دیگر در دسترس نیست، امکان مقایسه یا بازگشت هم وجود ندارد.

4.6 نقاط زمانی و تداوم در وب

به‌طور کلی، رسانه‌های آنالوگی که دیجیتال می‌شوند معمولاً به یک نقطه مشخص در زمان (مثلاً تاریخ انتشار رسانه‌های چاپی) یا به بازه‌های زمانی با آغاز و پایان مشخص (مثل رادیو و تلویزیون) مربوط‌اند.
اما در مورد وب، این روند کاملاً متفاوت است. انتشار وب‌سایت‌ها نه در یک لحظه خاص رخ می‌دهد و نه محدود به یک بازه زمانی مشخص است؛ بلکه فرآیندی پیوسته و مداوم است که زمان شروع و پایان مشخصی ندارد. علاوه بر این، معمولاً زمان انتشار محتوای آنلاین به‌صراحت از سوی ناشر مشخص نمی‌شود. نتیجه اینکه، زمانی که به آرشیو وب تخصیص داده می‌شود—مثلاً به شکل تاریخ‌های روزانه—در واقع توسط خود نهاد بایگانی‌کننده ایجاد شده و بخشی ذاتی از محتوای اصلی نیست و در نتیجه، تصادفی و قابل ویرایش است.. به همین دلیل، این زمان‌ها قابل تغییرند و نمی‌توان آن‌ها را قطعی دانست.

4.7 از «نسخه کپی‌شده» تا «نسخه متفاوت»

ترکیب شیوه‌های مختلف بایگانی وب و ابهام در این فرایند به این معناست که نتیجۀ بایگانی وب را نمی‌توان کپی‌ای دقیق (۱:۱) در نظر گرفت، همان‌گونه که شیء دیجیتال‌شده معمولاً نسخه‌ای تقریباً یکسان از اصل است. بلکه باید نسخۀ بایگانی‌شدۀ وب را نوعی نسخۀ منحصربه‌فرد دانست؛ نسخه‌ای از اصل (احتمالاً) از دست‌رفته، و بسیار محتمل است که این تنها یک نسخه از چندین نسخه‌ی دیگر باشد، که هیچ‌کدام را نمی‌توان به‌طور قطع به‌عنوان نسخه‌ی اصلی شناسایی کرد.

4.8 از تک نسخه تا نسخه‌های بسیار زیاد یا بسیار کم

در مجموعه‌های دیجیتال‌شده معمولاً تنها یک نسخه از هر سند وجود دارد، خواه دست‌نوشته‌ای باشد یا روزنامه یا برنامه‌ی رادیویی، زیرا فقط یک نسخۀ اصلی وجود دارد و دلیل منطقی برای ایجاد چندین نسخۀ کاملاً مشابه نیست.
در مقابل، در آرشیوهای وب با موقعیت متفاوتی روبه‌رو هستیم. گاهی از یک وب‌سایت فقط چند نسخه بایگانی شده (در نتیجه بخش‌هایی از آن از دست رفته‌اند) و گاهی آن‌قدر نسخه‌های متعدد و نزدیک به‌هم از یک صفحه ذخیره شده که بررسی آن‌ها دشوار می‌شود. از یک‌سو، احتمال کمی دارد که هیچ وب‌سایتی در تمام مدت (مثلاً هر روز) بایگانی شده باشد، که این بدان معناست که پژوهشگر بخشی از مواد آنلاین اولیه را از دست می‌دهد (علاوه بر این، عناصر وب‌سایت مانند تصاویر، ویدیوها، تبلیغات و … نیز ممکن است مفقود باشند). از سوی دیگر، ممکن است برخی از وب‌سایت‌ها (یا بخش‌هایی از آن‌ها) چندین بار در فواصل زمانی کوتاه بایگانی شده باشند، به‌گونه‌ای که چندین نسخه از یک نقطه زمانی (تقریباً) وجود دارد. بنابراین، برای پژوهشگری که می‌خواهد با مواد آرشیوشدۀ وب کار کند، اغلب تنها یک نسخه از هر سند وجود ندارد. بلکه فرآیندها و راهبردهای بایگانی وب به‌گونه‌ای است که در برخی موارد، بخش زیادی از آنچه قبلاً آنلاین بوده از دست رفته، و در برخی دیگر، نسخه‌های بسیار زیادی وجود دارد که بخشی از آن‌ها مشابه اما دقیقاً یکسان نیستند. یافتن مسیر مشخص در این شبکۀ نسخه‌های (احتمالاً) هم‌پوشان و پیچیده از نسخه‌های ناقص یا متفاوت، چالشی جدی است.

4.9 فقدان فهرست‌بندی مشخص

مجموعه‌های دیجیتال‌شده عمدتاً بر پایه‌ی یک مجموعۀ آنالوگ اصلی (منابع فیزیکی) ساخته شده‌اند که نهاد بایگانی‌کننده بر آن نظارتی نظام‌مند دارد؛ مثلاً فهرست یا کاتالوگی برای آن موجود است.

در بایگانی وب نیز ممکن است تا حدودی این نظم وجود داشته باشد، به‌ویژه اگر آرشیو وب برای هر وب‌سایت بایگانی‌شده فراداده (metadata) تولید کند (مانند آرشیو وب استرالیا “پاندورا” به نشانی pandora.nla.gov.au). اما این وضعیت در همه‌ی بایگانی‌ها وجود ندارد، به‌خصوص در بایگانی‌هایی که از راهبرد موسوم به بایگانی انبوه (bulk archiving) استفاده می‌کنند. در این روش، حجم وسیعی از وب‌سایت‌ها یا بر اساس فهرستی از نام‌های دامنه (مانند Netarkivet دانمارک) یا از طریق دنبال‌کردن پیوندها از محتوای قبلاً بایگانی‌شده (مانند Internet Archive آمریکا) بایگانی می‌شوند. در این موارد، تعداد زیاد دامنه‌ها باعث می‌شود فهرست‌برداری دستی از وب‌سایت‌های بایگانی‌شده ناممکن باشد. مثلاً دامنه‌ی کشوری .uk بریتانیا حدود ۱۰ میلیون نام دامنه دارد. در این شرایط، تنها فهرست‌های موجود یکی فهرست دامنه‌های بایگانی‌شده و دیگری لاگ فنی خزنده (crawl log) است که اطلاعات فنی درباره‌ی بایگانی ارائه می‌دهد، گرچه اولی اطلاعات اندکی دارد و دومی باید به‌شکلی قابل‌فهم برای پژوهشگر تبدیل شود و هنوز افزودن دستی اطلاعات امکان‌پذیر نیست.

به همین دلایل، ممکن است آرشیو وب دقیقاً نداند چه چیزی در آرشیوش هست و نبودِ یک فهرست نظام‌مند این مشکل را تشدید می‌کند (حتی تهیه‌ی فهرستی برای تعداد کمی وب‌سایت نیز به دلیل ماهیت آرشیو وب چالش‌برانگیز است [Brügger 2011b]).

ظهور ابرپیوند (hyperlink) در اواسط دهه‌ی ۱۹۸۰، راه‌های جدیدی برای جست‌وجو و ارتباط میان اسناد در مجموعه‌های دیجیتال‌شده گشود. مثل اینکه در نسخه دیجیتال یک روزنامه به مقاله‌ای در روزنامه‌ای دیگر ارجاع داده شود. این پیوندها جنبه‌ی تکمیلی دارند و نبودشان لطمه‌ای به اصل سند نمی‌زند.

اما در وب، ابرپیوند بخشی جدایی‌ناپذیر از ماهیت آن است. به‌طور کلی بدون ابرپیوند، چیزی به‌نام وب وجود نخواهد داشت. به همین دلیل، درج ابرپیوند در آرشیو وب اختیاری نیست. در نگاه اول ممکن است گنجاندن ابرپیوندها در آرشیو وب مشکلی به نظر نرسد، اما با بررسی دقیق‌تر روشن می‌شود که وجود ابرپیوندها می‌تواند چالش‌هایی برای استفاده‌ی پژوهشی از آرشیو ایجاد کند؛ چالش‌هایی که در مجموعه‌های دیجیتال‌شده وجود ندارند، زیرا در آن‌ها فقط یک نسخه از هر سند وجود دارد و انتشار آن‌ها قبلاً در نقطه‌ای مشخص از زمان انجام شده است.

ضرورت گنجاندن ابرپیوندها در آرشیو وب یک چالش است، بخشی به این دلیل که فرایند بایگانی زمان‌بر است (مثلاً بایگانی کل وب دانمارک در دامنه‌ی .dk دو ماه طول می‌کشد) و بخشی به دلیل این‌که همه‌ی وب‌سایت‌ها لزوماً تا عمق مشخصی بایگانی نمی‌شوند (چه به‌دلیل تنظیمات بایگانی، چه مشکلات فنی). بنابراین، وجود ابرپیوندها دو نوع ناسازگاری در کل آرشیو وب ایجاد می‌کند:

۱. ناسازگاری زمانی: ممکن است هم‌زمانی میان صفحه‌ی مبدأ پیوند و صفحه‌ی مقصد وجود نداشته باشد، چون این صفحات ممکن است با فاصله‌ی چند روز، هفته یا حتی ماه بایگانی شده باشند.

۲. ناهمگونی ساختاری در تحلیل شبکه‌ای: اگر بخواهیم مجموعه‌ای از وب‌سایت‌های بایگانی‌شده را از نظر شبکه‌ی پیوندها بررسی کنیم، ممکن است شبکۀ پیوندی نامنسجم باشد، زیرا وب‌سایت‌ها با عمق‌های مختلفی بایگانی شده‌اند. بعضی‌ها ممکن است تعداد زیادی پیوند داشته باشند و برخی دیگر بسیار کم — مانند این است که روزنامه‌هایی را مقایسه کنیم که برخی فقط صفحه اصلی‌شان ذخیره شده، برخی تا چندین لایه داخلی یا یکی فقط جلد دارد و دیگری ۱۲ بخش داخلی کامل. این ناهمگونی باعث می‌شود ساختار شبکه‌ای پیوندها در بایگانی ناقص یا غیرقابل اعتماد باشد.

در مجموع، الزام به گنجاندن ابرپیوندها در آرشیو وب باعث می‌شود مجموعۀ آرشیوی از نظر زمانی و ساختاری ناهماهنگ باشند، به‌ویژه وقتی تمرکز پژوهش روی روابط نرم‌افزاری میان وب‌سایت‌ها یا دیگر موجودیت‌های وب باشد.

5. استفادۀ علمی از آرشیو وب

در مقایسه با مجموعه‌های دیجیتالی‌شده که معمولاً همگن‌تر هستند، آرشیوهای وب در آغاز کار اغلب ناهمگن، آشفته و مبهم‌اند. این ویژگی‌ها در مورد آرشیوهای وب اساسی‌تر از سایر انواع مجموعه‌ها هستند، زیرا اولاً خود وب که در ابتدا بایگانی شده نیز به‌صورت ذاتی ناهمگن، آشفته و مبهم بوده، و ثانیاً خود فرایند آرشیوسازی، نگهداری و فراهم کردن دسترسی به وب در قالب آرشیو، نوعی دیگر از آشفتگی و ناهمگنی به آن می‌افزاید. به‌بیان‌دیگر، این ناهمگنی بنیادین را نمی‌توان با ابزارهای فنی برطرف یا حل کرد، چرا که جزء جدایی‌ناپذیر از ذات وب و فرایند بایگانی آن است. افزون بر این، ناهمگنی آرشیو وب خود دارای تاریخی است، چرا که وب و آرشیو آن همواره در حال تحول‌اند و این باعث انباشت ناهمگونی‌های پیشین می‌شود.

در ادامه‌ی بحثی که پیش‌تر مطرح شد – این‌که دیجیتال بودن به‌خودی‌خود به معنای ساده و منسجم بودن نیست – اکنون به بررسی این موضوع می‌پردازیم که تفاوت‌های میان یک مجموعۀ دیجیتالی‌شده و نمونه‌ای از یک مجموعۀ زادۀ دیجیتال (reborn-digital) مانند آرشیو وب، چگونه بر نحوۀ استفاده پژوهشگران از آن‌ها تأثیر می‌گذارد.

5.1 ساختن موضوع مطالعاتی دیجیتال

اولین گام در ساختن موضوع مطالعاتی دیجیتال، چه در یک مجموعۀ دیجیتالی‌شده و چه در آرشیو وب، جست‌وجو در آن مجموعه است. اینجاست که مزایای متن دیجیتال دودویی (به بخش ۲.۱ مراجعه شود) آشکار می‌شود.

در مجموعه‌های دیجیتالی‌شده، جست‌وجو معمولاً به روش‌های گوناگونی انجام‌پذیر است که به امکانات فنی و تنظیمات مجموعه یا ترجیحات کاربران بستگی دارد. در اغلب موارد می‌توان بر اساس نام، تاریخ یا جست‌وجوی آزاد در متن به نتایج رسید؛ در بسیاری موارد نیز امکان فیلتر کردن نتایج بر اساس معیارهای مختلف فراهم است.

در مورد آرشیو وب، جست‌وجوی نام یک وب‌سایت ممکن است امکان‌پذیر نباشد، چرا که معمولاً وب‌سایت‌ها نام مشخصی ندارند [Brügger 2011b]، و اغلب تنها راه جست‌وجو، وارد کردن یک آدرس URL مشخص است؛ یعنی نام دامنه‌ای که در نوار آدرس مرورگر دیده می‌شود. البته برخی از آرشیوهای وب اخیراً قابلیت جست‌وجوی آزاد متنی را نیز فراهم کرده‌اند که کمک بزرگی برای پژوهشگران محسوب می‌شود. با این حال، همین پیشرفت نیز چالش‌هایی ایجاد می‌کند که تفاوت آن را با مجموعه‌های دیجیتالی‌شده برجسته می‌سازد.

حتی ارائۀ نتایج جست‌وجو – که امری ساده و آشنا به نظر می‌رسد – در این‌جا قدری پیچیده‌تر است؛ بخشی به این دلیل که مشخص نیست دقیقاً باید چه چیزی به نمایش گذاشته شود، و بخشی دیگر به دلیل وجود نسخه‌های متعددی از «یک چیز واحد» که ممکن است در زمان یا محتوا با یکدیگر هم‌پوشانی داشته باشند. برای مثال، جست‌وجوی واژۀ «علوم انسانی» در یک مجموعۀ دیجیتالی‌شده از روزنامه‌ها، تمامی صفحاتی را نمایش می‌دهد که این واژه در آن‌ها آمده است، و کاربر می‌تواند نتایج را بر اساس نام روزنامه، بازۀ زمانی یا معیارهای دیگر فیلتر کند. اما در هر صورت، از هر صفحه فقط یک نسخه وجود دارد؛ یعنی هر صفحه عمق زمانی ندارد.

حال اگر همین جست‌وجو در آرشیوی از وب که ۱۰ سال پیش ایجاد شده انجام شود، صفحۀ نتایج، صفحات وبی را نمایش می‌دهد که واژۀ موردنظر در آن‌ها یافت شده، و احتمالاً امکان فیلتر کردن بر اساس آدرس URL، بازۀ زمانی و غیره نیز وجود دارد. با این حال، در این حالت باید با نسخه‌های متعدد – و اغلب هم‌پوشان – از یک صفحۀ واحد مواجه شد، چرا که در آرشیو وب، یک «صفحه یافته‌شده» لزوماً به معنای «یک نسخه در هر بازۀ زمانی» نیست، بلکه ممکن است به «چندین نسخه» از یک صفحه اشاره کند. بنابراین، هر صفحه می‌تواند دارای عمق زمانی و فضایی خاص خود باشد، که این عمق ناشی از نسخه‌هایی است که به‌طور نسبی با یکدیگر هم‌پوشانی دارند. علاوه بر این، در صورتی که آرشیو فاقد فراداده (metadata) باشد، ارزیابی نسخه‌های مختلف برای پژوهشگر بسیار دشوار خواهد بود.

بنابراین، این آشفتگی ذاتی آرشیو وب در نتایج جستجو نیز بازتاب پیدا می‌کند، به‌گونه‌ای که نمایش سادۀ نتایج یک جست‌وجوی آزاد متنی، در آرشیو وب بسیار دشوارتر از مجموعه‌های دیجیتالی‌شده است. و و راه‌حل ساده‌ای هم برای این مشکل وجود ندارد، چرا که ریشۀ مشکل، در خود ماهیت وب بایگانی‌شده نهفته است.

5.2 شناسایی، ارزیابی و انتخاب نسخه‌ها

گام بعدی پس از جست‌وجو در مجموعه، معمولاً انتخاب و جداسازی مواد یافته‌شده برای بررسی‌های بعدی است. این موضوع در آرشیو وب نیز صادق است، اما پیش از آن باید کاری انجام داد که در مجموعه‌های دیجیتالی‌شده معمولاً نیازی به آن نیست: تصمیم‌گیری درباره این‌که کدام یک از نسخه‌های موجود از «یک مطلب» باید وارد قلمرو مطالعه شود.
همان‌گونه که پیش‌تر اشاره شد، دلایل متعددی برای وجود نسخه‌های متعدد از «یک» محتوای وب در آرشیو وجود دارد؛ اما نکتۀ مهم این است که این نسخه‌ها معمولاً کپی‌های یکسان نیستند، بلکه تفاوت‌هایی دارند که می‌تواند از جزئی و بی‌اهمیت تا اساسی و مهم متغیر باشد. از این رو، پژوهشگر باید نسخه‌ها را شناسایی، ارزیابی و انتخاب کند تا بتواند آن‌ها را در مطالعه‌اش بگنجاند.

برای نمونه، فرض کنیم می‌خواهیم وب‌سایت بی‌بی‌سی (bbc.com) را بررسی کنیم؛ به‌ویژه صفحۀ اصلی و دو بخش فرعی News (bbc.com/news) و Sport (bbc.com/sport). ممکن است صفحۀ اصلی در روز هشت‌بار آرشیو شده باشد، صفحات News و Sport سه‌بار در روز، و زیرصفحات دیگر در فواصل مختلف (مثلاً روزانه یا یک‌روز در میان). در نتیجه، از برخی صفحات نسخه‌های زیادی داریم، از برخی دیگر تعداد کمی، و از برخی هیچ نسخه‌ای وجود ندارد. بنابراین، پژوهشگر باید تصمیم بگیرد کدام نسخه‌ها را برای تشکیل موضوع مطالعه انتخاب و با یکدیگر ترکیب کند. با این حال، باید به این نکته آگاه بود که به‌دلیل ناهماهنگی‌های زمانی و فضایی عناصر وب آرشیوشده، بازسازی دقیق صفحۀ اصلی وب‌سایت و دو بخش فرعی آن در یک زمان مشخص ممکن نیست؛ بلکه تنها می‌توان بازسازی‌هایی را براساس نقاط زمانی مختلف انجام داد.

شناسایی، ارزیابی و انتخاب نسخه‌ها کاری دشوار است؛ به همین دلیل باید ابزارهایی طراحی شوند که به پژوهشگر کمک کنند تا انتخاب‌های آگاهانه‌تری داشته باشد. این ابزارها باید اطلاعات کافی دربارۀ هر نسخه فراهم کنند (مثلاً زمان شروع و پایان بایگانی شدن)، همچنین ابزارهای دیداری‌سازی و بصری که نسخه‌های مختلف را به‌صورت قابل درک نمایش دهد، و نیز ابزارهایی را برای انتخاب یا حتی ترکیب نسخه‌های مناسب که قرار است به‌عنوان موضوع مطالعه استفاده شوند، ارائه کنند.

5.3 جدا کردن نسخه‌های یافت‌شده

پس از آن‌که پژوهشگر نسخه‌هایی را که می‌خواهد بررسی کند انتخاب کرد، نوبت به مرحله‌ای می‌رسد که پیش‌تر به آن اشاره شد: جدا کردن مواد برای بررسی بعدی. در مجموعه‌های دیجیتالی‌شده، این کار معمولاً بسیار ساده است، زیرا هر سند به‌روشنی به‌عنوان یک (یا چند) فایل قابل شناسایی است و معمولاً به اسناد دیگر مرتبط نیست (و اگر هم مرتبط باشد، این ارتباط معمولاً به‌صورت کاملاً مشخص انجام می‌شود). به‌عنوان مثال، روزنامه‌های دیجیتالی‌شده معمولاً به صورت فایل‌های PDF نگهداری می‌شوند، در حالی‌که برنامه‌های رادیویی اغلب به‌صورت فایل‌های AVI ذخیره می‌شوند. بنابراین، فایل‌های مربوطه را می‌توان از مجموعه خارج کرد و بیرون از آرشیو تحلیل کرد، یا آن‌ها را نشانه‌گذاری کرد و در پوشه‌ای قرار داد تا بعداً مطالعه شوند.

اما باز هم، در آرشیو وب شرایط متفاوت است، عمدتاً به دلیل وجود اَبَرپیوندها (hyperlinks) که جزء جدایی‌ناپذیر اغلب اسناد وب هستند. این ویژگی باعث می‌شود جدا کردن فایل‌ها از آرشیو کمی پیچیده‌تر شود. برای مثال: در مطالعۀ وب‌سایت bbc.com ما نسخه‌هایی را برای بررسی انتخاب کرده‌ایم، اما اگر این نسخه‌ها را از آرشیو بیرون بکشیم و مثلاً در رایانه خود ذخیره کنیم، آن‌ها را از محیط ارتباطی‌ای که در آرشیو داشتند جدا کرده‌ایم و ممکن است ناگهان اجزاء وب‌سایت به‌درستی کار نکنند یا رفتارهای عجیب از خود نشان دهند. ممکن است برخی از لینک‌ها دیگر کار نکنند، زیرا هدف لینک بخشی از پیکره‌ی انتخابی ما نیست؛ و این موضوع نه فقط در مورد لینک‌های قابل‌مشاهده در صفحه، بلکه در مورد لینک‌های نامرئی‌تری که باعث ظاهر شدن صفحه به شکل خاصی می‌شوند (مانند لینک به تبلیغات، تصاویر یا ویدیوهای جاسازی‌شده در سرورهای دیگر) نیز صدق می‌کند. یا ممکن است برخی لینک‌ها کار کنند، ولی به‌شکلی عجیب. برای مثال، اگر نسخه بایگانی‌شده صفحه اول bbc.com اسکریپتی داشته باشد که اطلاعات آب‌وهوای امروز را از سرور خدمات هواشناسی دریافت کند، اگر آن سرور هنوز آنلاین باشد، ممکن است آب‌وهوای امروز نمایش داده شود، یعنی گذشته با اطلاعات امروز وصله‌پینه شود [Brügger 2008, 159].

بنابراین، بهترین راه برای جدا کردن مواد بایگانی‌شدۀ وب جهت مطالعه، انجام این کار درون خود آرشیو است؛ مثلاً با ایجاد فهرستی از موارد انتخاب‌شده و محدود کردن مطالعه به همین فهرست. بااین‌حال، از لحاظ فنی، این کار ممکن است ساده نباشد. برای مثال، باید به مسئلۀ «حذف تکراری‌ها» (deduplication) توجه داشت؛ یعنی این‌که آرشیو وب به‌طور مداوم بررسی می‌کند که آیا یک فایل (مثلاً فایل PDF) قبلاً در آرشیو وجود دارد یا نه، و اگر داشته باشد، دوباره آن را ذخیره نمی‌کند تا فضای دیسک ذخیره و حفظ شود. اما اگر پژوهشگری بعداً بخواهد یک پیکره را محدود به بازۀ زمانی خاصی کند، و فایل مورد نظر قبل از شروع آن بازۀ زمانی آرشیوشده باشد، آن فایل نمایش داده نمی‌شود؛ حتی اگر در آرشیو وجود داشته باشد. برای این مسئله راه‌حل‌های فنی وجود دارد، اما این پدیده نشان می‌دهد که آرشیو وب به‌دلیل وجود اَبَرپیوندها، مجموعه‌ای پیچیده‌تر از دیگر انواع آرشیو است.

5.4 تحلیل، گفت‌وگو، و انتشار

وقتی که موضوع مطالعه محدود و جدا شد، پژوهشگر می‌تواند فرآیند تحلیل را آغاز کند. در اینجا امکان پرداختن دقیق به ابزارهای تحلیلی متنوعی که می‌توان در تحلیل مواد آرشیوشدۀ وب به کار برد وجود ندارد، اما چالش اصلی تمام این ابزارها این است که کارکرد آن‌ها به این بستگی دارد که آرشیو وب چگونه ساخته شده و موضوع مورد مطالعه در آن چگونه ساخته و شکل گرفته است و نتیجۀ این فرایند چه بوده. به‌عبارت دیگر، ماهیت بنیادین مجموعه‌های باززادۀ دیجیتال، مانند آرشیو وب، بستر امکان تحلیل را تعیین می‌کند.

5.5 راه‌حل‌ها؟؛ نیاز به زبان‌شناسی وب

حال که پژوهشگر با چالش‌های استفاده علمی از آرشیو وب مواجه است، آیا راه‌حل‌هایی برای مقابله با این چالش‌ها وجود دارد؟

از آنجا که طبیعت و ماهیت ناهمگن، آشفته و مبهم آرشیو وب جزء ذاتی فرآیند آرشیوسازی و خود آرشیو است، راه‌حل آسانی برای غلبه بر این چالش‌ها وجود ندارد. اما این موضوع نباید پژوهشگر علوم انسانی را ناتوان سازد، چرا که یکی از ابزارهای کلیدی در جعبه‌ابزار سنتی علوم انسانی، توانایی و مهارت کار با منابع و درک منشأ آن‌هاست. این مهارت‌ها فقط باید بازتفسیر و با محیط دیجیتال جدید تطبیق داده شوند. برای نمونه، کاری که پیش‌تر برای مقایسۀ نسخه‌ها گفته شد، از بسیاری جهات شبیه به زبان‌شناسی سنتی (philology) است؛ به این معنا که «زبان‌شناسی وب» آینده نیازی ندارد از صفر آغاز شود، بلکه می‌تواند با تمرکز و توجه به تفاوت‌های میان متون نوشته‌شده بر کاغذ یا پوست و متون آرشیوشده در وب، خود را با ماهیت خاص وب بایگانی‌شده وفق دهد (برای طرح اولیه‌ای از زبان‌شناسی وب، نک: Brügger 2008, 161–171).

نخستین گام‌ به‌سوی زبان‌شناسی وب این است که ویژگی خاص «دیجیتال بودن» بایگانی وب را به رسمیت بشناسیم، و بپذیریم که دسترسی به کد دیجیتال حتی می‌تواند به پژوهشگر کمک بزرگی کند، زیرا این لایۀ نامرئی متن (در مقایسه با متن قابل‌مشاهده)، اطلاعات و فراداده‌های مهمی در خود دارد؛ از جمله دربارۀ منشأ. بنابراین، آنچه نیاز داریم، جعبه‌ابزار جدیدی برای زبان‌شناسی وب است که به پژوهشگر کمک کند تا بیشترین اطلاعات ممکن را دربارۀ موضوع مورد مطالعۀ خود به‌دست آورد. چنین رویکردی چالش‌ها را برطرف نمی‌کند، اما به پژوهشگران کمک می‌کند تا تصمیم‌ها و انتخاب‌هایی آگاهانه‌تر داشته باشند.

6. نتیجه‌گیری

با در نظر گرفتن این واقعیت که یکی از عوامل تحول‌آفرین اصلی در علوم انسانی در آغاز قرن بیست‌ویکم، گذار از منابع آنالوگ به انواع گوناگون منابع دیجیتال است، در این مقاله استدلال شد که این تغییر، علوم انسانی را از جنبه‌های مختلفی تحت تأثیر قرار می‌دهد. در پایان، بار دیگر به پرسشی که در ابتدا مطرح شد بازمی‌گردیم: علوم انسانی تا چه اندازه دیجیتال خواهد شد؟

از یک سو، علوم انسانی به‌طور فزاینده‌ای به سمت «دیجیتالی» شدن حرکت می‌کند. دلیل این امر همان تغییر اشاره شده از منابع آنالوگ به منابع دیجیتال، و نیز امکان به کارگیری روش‌های پشتیبانی‌شده با فناوری دیجیتال است که این نوع منابع فراهم کرده‌اند و روزبه‌روز نیز ضروری‌تر می‌سازد. بنابراین، گسترش فناوری دیجیتال به احتمال زیاد علوم انسانی را بیش از پیش به‌سمت «علوم انسانی دیجیتال» سوق خواهد داد.

اما از سوی دیگر، علوم انسانی دیجیتال، اساساً همان علوم انسانی باقی می‌ماند. پرسش‌ها، نظریه‌ها، روش‌ها و اهداف بنیادین علوم انسانی، با وجود گسترش فزایندۀ دیجیتال و چالش‌هایی که همراه دارد، تا حد زیادی بدون تغییر باقی می‌مانند. علوم انسانی دیجیتال به‌خودی‌خود یک پارادایم کاملاً جدید محسوب نمی‌شود، بلکه مجموعه‌ای از امکانات جدید را پدید می‌آورد؛ چه برای انجام همان کارهای پیشین به شیوه‌ای نو، و چه برای بازاندیشی در شیوه‌های شناخته‌شدۀ علوم انسانی. برای مثال، می‌توان به بهره بردن از روش‌های پشتیبانی‌شده توسط نرم‌افزارها، و نیز زیرساخت‌های پژوهشی دیجیتال اشاره کرد.

آنچه نیاز داریم، نوعی علوم انسانی دیجیتال متعادل است؛ علمی که از یک‌سو تغییرات بنیادی در بنیان فعالیت‌های علمی علوم انسانی را به رسمیت بشناسد، و از سوی دیگر، اذعان کند که این تغییرات لزوماً ماهیت علوم انسانی را به‌طور بنیادی دگرگون نمی‌کنند. لازم نیست تمام شاخه‌های علوم انسانی به علوم انسانی دیجیتال تبدیل شوند، اما بعید است که هیچ‌یک از آن‌ها بدون تغییر باقی بمانند؛ چرا که یا با دیجیتالی بودن خودِ موضوع مطالعه مواجه‌اند، یا با روش‌ها و ابزارهای پژوهشی دیجیتالی پشتیبانی‌شده که در علوم انسانی به کار گرفته می‌شود، و یا با هر دو.
بنابراین، در قرن بیست‌ویکم، تفاوت میان علوم انسانی و علوم انسانی دیجیتال، بیشتر کمّی است تا کیفی: همۀ شاخه‌های علوم انسانی تا حدی دیجیتال خواهند شد، اما نه به یک اندازه. از این‌رو، پرسش اصلی دیگر آن نیست که دیجیتال هستند یا نه، بلکه این است که «چقدر» دیجیتال هستند.

و صرف‌نظر از این‌که این تعادل را در چه نقطه‌ای میان دیجیتالی بودن «بیشتر» یا «کمتر» بخواهیم برقرار کنیم، باید پذیرفت که ورود فناوری دیجیتال به علوم انسانی، یک نقطه عطف است که تاکنون نیز بحث‌هایی اساسی و ارزشمند را درباره اینکه علوم انسانی (دیجیتال) چه می‌تواند باشد، به جریان انداخته است.

منابع


مأخد: اتحادیه سازمان‌های علوم انسانی دیجیتال : DHQ: Digital Humanities Quarterly: Digital Humanities in the 21st Century: Digital Material as a Driving Force

American Council of Learned Societies 2006 American Council of Learned Societies. Our Cultural Commonwealth: The report of the American Council of Learned Societies Commission on Cyberinfrastructure for the Humanities and Social Sciences. New York: American Council of Learned Societies, 2006.

Arts and Humanities in Higher Education 2011Arts and Humanities in Higher Education 11, no. 1-2 (2011), special double issue: Digital humanities, digital futures.

Barnett 2014 Ronald Barnett. “Imagining the Humanities – Amid the inhuman.” Arts & Humanities in Higher Education 13, no. 1-2 (2014): 42-53.

Bassnett 2002 Susan Bassnett. “Is There Hope for the Humanities in the 21st Century?” Arts & Humanities in Higher Education 1, no. 1 (2002): 101-110.

Belfiore 2014 Eleonora Belfiore. “‘Impact,’ ‘value’ and ‘bad economics’: Making sense of the problem of value in the arts and humanities.” Arts & Humanities in Higher Education OnlineFirst, April (2014).

Beňuš 2010 Stefan Beňuš. “Building interfaces between the humanities and cognitive sciences: The case of human speech.” Arts & Humanities in Higher Education 9, no. 3 (2010): 353-374.

Berry 2012 David M. Berry. “Introduction: Understanding the Digital Humanities.” In Understanding Digital Humanities. Edited by David M. Berry. New York: Palgrave Macmillan, 2012, pp. 1–20.

Bolton 2008 Gillie Bolton. “Boundaries of Humanities: Writing Medical Humanities.” Arts & Humanities in Higher Education 7, no. 2 (2008): 131-148.

Borgman 2009 Christine L. Borgman. “The Digital Future is Now: A Call to Action for the Humanities.” Digital Humanities Quarterly, 3, no. 4 (2009). http://www.digitalhumanities.org/dhq/vol/3/4/000077/000077.html

Brügger 2005 Niels Brügger. Archiving Websites: General Considerations and Strategies. Aarhus: The Centre for Internet Studies, 2005.

Brügger 2008 Niels Brügger. “The Archived Website and Website Philology: A New Type of Historical Document?” Nordicom Review 29, no. 2 (2008): 155-175.

Brügger 2009 51. Niels Brügger. “Website history and the website as an object of study.” New Media & Society 11, no. 1-2 (2009): 115-132.

Brügger 2010 Niels Brügger. “Introduction: Web history, an emerginrg field of study.” In Web history. Edited by Niels Brügger. New York: Peter Lang, 2010, pp. 1-25.

Brügger 2011a Niels Brügger. “Web archiving — Between past, present, and future.” In The handbook of Internet studies. Edited by Mia Consalvo, and Charles Ess. Oxford: Wiley-Blackwell, 2011, pp. 24-42.

Brügger 2011b Niels Brügger. “Digital history and a register of websites: An old practice with new implications.” In The long history of new media: Technology, historiography, and contextualizing newness. Edited by David W. Park, Nick W. Jankowski, and Steve Jones. New York: Peter Lang, 2011, pp. 283-298.

Brügger 2012a Niels Brügger. “Web History and the Web as a Historical Source.” Zeithistorische Forschungen, 9, no. 2 (2012): 316-325.

Brügger 2012b  Niels Brügger. “When the Present Web is Later the Past: Web Historiography, Digital History, and Internet Studies.” Historical Social Research, 37, no. 4 (2012): 102-117.

Brügger 2013 Niels Brügger. “Historical network analysis of the Web.” Social Science Computer Review, 31, no. 3 (2013): 306-321.

Brügger and Finnemann 2013 Niels Brügger and Niels Ole Finnemann. “The Web and Digital Humanities: Theoretical and Methodological Concerns.” Journal of Broadcasting and Electronic Media, 57, no. 1 (2013): 66-80.

Burdick et al 2012 Anne Burdick, Johanna Drucker, Peter Lunenfeld, Todd Presner, and Jeffrey Schnapp. Digital_Humanities. Cambridge, MA: MIT Press, 2012. http://lab.softwarestudies.com/2012/11/digitalhumanities-book-is-out.html

Cohen and Rosenzweig 2005 Daniel J. Cohen, and Roy Rosenzweig. Digital History: A Guide to Gathering, Preserving, and Presenting the Past on the Web. Philadelphia, Penn.: University of Pennsylvania Press, 2005.

Collins 2011 Ellen Collins, Monica E. Bulger, and Eric T. Meyer. “Discipline matters: Technology use in the humanities.” Arts & Humanities in Higher Education 11, no. 1-2 (2011): 76-92.

DHQ e-Science 2009Digital Humanities Quarterly, 3, no. 4 (2009), Special Cluster: e-Science for the Arts and Humanities. http://digitalhumanities.org:8081/dhq/vol/3/4/000079/000079.html

Deegan 2014 Marilyn Deegan. “‘This ever more amorphous thing called Digital Humanities’: Whither the Humanities Project?” Arts & Humanities in Higher Education 13, no. 1-2 (2014): 24-41.

Digital Humanities ManifestoA Digital Humanities Manifesto. 2008, http://manifesto.humanities.ucla.edu/2008/12/15/digital-humanities-manifesto/

Dougherty 2010 Meghan Dougherty, Eric T. Meyer, Christine Madsen, Charles van den Heuvel, Arthur Thomas, and Sally Wyatt. Researcher Engagement with Web Archives: State of the Art. London: JISC, 2010.

European Commission 2011 European Commission. The New Renaissance: Report of the “Comité des Sages” on bringing Europe’s cultural heritage online. Luxembourg: Publications Office of the European Union, 2011.

Evens 2012 Aden Evens. “Web 2.0 and the Ontology of the Digital.” Digital Humanities Quarterly, 6, no. 2 (2012). http://www.digitalhumanities.org/dhq/vol/6/2/000120/000120.html

Finnemann 1999 Niels Ole Finnemann. “Modernity Modernised: The Cultural Impact of Computerisation.” In Computer, Media and Communication. Edited by Paul A. Mayer. Oxford: Oxford University Press, 1999, pp. 141–159.

Finnemann 2014 Niels Ole Finnemann. “Digital humanities and networked digital media.” MedieKultur. Journal of media and communication research 57 (2014): 94-114.

Foot and Scheider 2006 Kirsten A. Foot, and Steven M. Schneider. Web campaigning. Cambridge, Mass.: MIT Press, 2006.

Gold 2012 Matthew K. Gold. Debates in the Digital Humanities, ed. Minneapolis/London: University of Minnesota Press, 2012.

Gronbeck 2005 Bruce E. Gronbeck. “Is Communication a Humanities Discipline? Struggles for academic identity.” Arts & Humanities in Higher Education 4, no. 3 (2005): 229-246.

Harpham 2005 Geoffrey Galt Harpham. “Beneath and Beyond the ‘Crisis in the Humanities’”. New Literary History 36, no. 1 (2005): 21–36.

Historical Social Research 2012Historical Social Research/Historische Sozialforschung 37, no. 3 (2012), special theme: Controversies around the Digital Humanities.

Hockey 2000 Susan Hockey. Electronic texts in the Humanities. Oxford: Oxford University Press, 2000.

Holm 2015 Poul Holm, Arne Jarrick, and Dominic Scott. Humanities World Report 2015. New York: Palgrave Macmillan, 2014.

Howarth 2004 David Howarth. “Is Law a Humanity (or is it more like Engineering)?” Arts & Humanities in Higher Education 3, no. 1 (2004): 9-28.

Jones 2014 Steve E. Jones. The emergence of the digital humanities. New York & London: Routledge, 2014.

Kirschenbaum 2013  Matthew Kirschenbaum. “The .txtual Condition: Digital Humanities, Born-Digital Archives, and the Future Literary.” Digital Humanities Quarterly, 7, no. 1 (2013). http://www.digitalhumanities.org/dhq/vol/7/1/000151/000151.html

Laue 2004 Andrea Laue. “How the computer works.” In A Companion to Digital Humanities. Edited by Susan Schreibman, Ray Siemens, and John Unsworth. Oxford: Blackwell, 2004, pp. 145–160.

Liu 2011 Alan Liu. “The state of the digital humanities: A report and a critique.” Arts & Humanities in Higher Education 11, no. 1-2 (2011): 8-41.

Masanès 2006 Julien Masanès. Web Archiving, ed. Berlin: Springer, 2006.

Mayer-Schönberger 2013 Viktor Mayer-Schönberger and Kenneth Cukier. Big Data: A revolution that will transform how we live, work, and think. Houghton Mifflin Harcourt Publishing Company, New York, 2013.

McCarty 2005 Willard McCarty. Humanities computing. New York: Palgrave Macmillan, 2005.

MedieKultur 2014 MedieKultur. Journal of media and communication research 57 (2014), special issue: Digital Humanities: Now and Beyond

Nussbaum 2010 Martha C. Nussbaum. Not For Profit: Why Democracy Needs the Humanities. Princeton: Princeton University Press, 2010.

Olmos-Peñuela 2014 Julia Olmos-Peñuela, Paul Benneworth, and Elena Castro-Martínez. “Are sciences essential and humanities elective? Disentangling competing claims for humanities’ research public value.” Arts & Humanities in Higher Education OnlineFirst, May (2014).

Parker 2007 Jan Parker. “Future Priorities of the Humanities in Europe: What Have the Humanities to Offer? Report of a round table conference held to draft a manifesto for the European Commissioner and working papers for the EC Working Party on Future Priorities for Humanities Research.” Arts & Humanities in Higher Education 6, no. 1 (2007): 123-127.

Pascoe 2002 Robert Pascoe. “An Australian Perspective on the Humanities.” Arts & Humanities in Higher Education 2, no. 1 (2002): 7-22.

Schneider and Foot 2004 Steven M. Schneider, and Kirsten A. Foot. “The Web as an Object of Study.” New Media Society 6, no. 1 (2004): 114–122.

Screibman Susan Schreibman, Ray Siemens, and John Unsworth. A Companion to Digital Humanities, eds. Oxford: Blackwell, 2004.

Svensson 2010 Patrik Svensson. “The Landscape of Digital Humanities.” Digital Humanities Quarterly, 4, no. 1 (2010). http://digitalhumanities.org/dhq/vol/4/1/000080/000080.html

Svensson 2011 Patrik Svensson. “The digital humanities as a humanities project.” Arts & Humanities in Higher Education 11, no. 1-2 (2011): 42-60.

Svensson 2012a Patrik Svensson. “Envisioning the Digital Humanities.” Digital Humanities Quarterly, 6, no. 1 (2012). http://www.digitalhumanities.org/dhq/vol/6/1/000112/000112.html

Svensson 2012b Patrik Svensson. “Beyond the Big Tent.” In Debates in the Digital Humanities. Edited by Matthew K. Gold. Minneapolis/London: University of Minnesota Press, 2012, pp. 36–49.

Terras 2012 Melissa Terras. “Digitization and digital resources in the humanities.” In Digital Humanities in practice. Edited by Claire Warwick, Melissa Terras, and Julianne Nyhan. London: UCL/Facet Publishing, 2012, pp. 47–70.

Thaller 2012 Manfred Thaller. “Controversies around the Digital Humanities: An agenda.” Historical Social Research 37, no. 3 (2012): 7-23.

Thomas 2010 Arthur Thomas, Eric T. Meyer, Meghan Dougherty, Charles van den Heuvel, Christine Madsen, and Sally Wyatt. Researcher Engagement with Web Archives: Challenges and Opportunities for Investment. London: JISC, 2010.

Warwick 2012 Claire Warwick, Melissa Terras, and Julianne Nyhan. Digital Humanities in practice, eds. London: UCL/Facet Publishing, 2012.

دیدگاهتان را بنویسید