علوم انسانی دیجیتال در قرن بیست و یکم: مادۀ دیجیتال بهعنوان یک نیروی محرکه

یکی از عوامل تحولآفرین اصلی در علوم انسانی در آغاز قرن بیست و یکم، تغییر از منابع آنالوگ به منابع دیجیتال است و این تغییر به روشهای گوناگونی بر علوم انسانی تأثیر خواهد گذاشت. اما همه انواع مواد دیجیتال به یک شکل دیجیتالی نیستند؛ تمایز میان «دیجیتالیشده»، «متولد دیجیتال» و «دیجیتال از نو متولدشده» میتواند به ما کمک کند که درک کنیم چگونه هر…
نویسنده: نیلز بروگر (Niels Brügger)، مرکز مطالعات اینترنت و نتلب، دانشگاه آرهوس
چکیده
در این مقاله استدلال میشود که یکی از عوامل تحولآفرین اصلی در علوم انسانی در آغاز قرن بیست و یکم، تغییر از منابع آنالوگ به منابع دیجیتال است و این تغییر به روشهای گوناگونی بر علوم انسانی تأثیر خواهد گذاشت. اما همه انواع مواد دیجیتال به یک شکل دیجیتالی نیستند؛ تمایز میان «دیجیتالیشده»، «متولد دیجیتال» و «دیجیتال از نو متولدشده» میتواند به ما کمک کند که درک کنیم چگونه هر یک از این انواع مواد دیجیتال، مراحل مختلف کار پژوهشی را به شیوهای منحصر به فرد تحت تأثیر قرار میدهند. این موضوع با مقایسهای دقیق بین ماهیت مجموعههای دیجیتالیشده و بایگانیهای وب تشریح میشود.
فهرست
- چکیده
- 1. علوم انسانی – مسئله چیست؟
- 2. دیجیتال، علوم انسانی – علوم انسانی دیجیتال
- 3. سه نوع مادۀ دیجیتال در علوم انسانی دیجیتال
- 4. محتوای باززادۀ دیجیتال – مطالعه موردی: وب آرشیوشده
- 4.1 چرا وب را بایگانی میکنیم، در حالی که خودش دیجیتال است؟
- 4.2 بایگانی وب در مقیاس کلان و خرد
- 4.3 اصل پایدار و ناپایدار
- 4.4 چه چیز و چگونه باید بایگانی شود؟
- 4.5 شفافیت و ابهام
- 4.6 نقاط زمانی و تداوم در وب
- 4.7 از «نسخه کپیشده» تا «نسخه متفاوت»
- 4.8 از تک نسخه تا نسخههای بسیار زیاد یا بسیار کم
- 4.9 فقدان فهرستبندی مشخص
- 4.10 ابرپیوند؛ از ویژگی اختیاری تا جزء جداییناپذیر
- 5.استفادۀ علمی از آرشیو وب
- 6. نتیجهگیری
1. علوم انسانی – مسئله چیست؟
چالشها و بحرانهایی که علوم انسانی با آنها روبهرو بوده، برای دههها بر مباحث مربوط به جایگاه و آینده این حوزه تأثیر گذاشته است. جفری گالت هارپام در مقاله تأثیرگذارش با عنوان «زیر و فراتر از بحران در علوم انسانی»، از اصطلاح «بحران دائمی در علوم انسانی» استفاده میکند که به باور او، در نیم قرن گذشته بر این حوزه سایه انداخته است [Harpham 2005, 21]. او ادامه میدهد:
«گاهی این بحران — که ابعاد آن را میتوان با کاهش تعداد ثبتنامها، تعداد دانشجویان، دروس ارائهشده و دستمزدها اندازهگیری کرد — بهعنوان یک فاجعه جداگانه و تا حد زیادی خودتحمیلشده که محدود به چند رشته خاص است، توصیف میشود؛ گاهی نیز این بحران با آشفتگی کلی در آموزش لیبرال یا حتی با فروپاشی اخلاقی و فقر فکری کل فرهنگ مرتبط دانسته میشود. اما یک نکته با نظم و تأکید فراوان پدیدار میشود: دانشمندان علوم انسانی، که در مورد مأموریت خود پراکنده و سردرگم هستند، از عدم توانایی در انتقال ارزش خاص خود به فرهنگ عمومی رنج میبرند؛ آنها دچار چیزی هستند که منتقد و پژوهشگر، لوئیس مناند، آن را “بحران توجیه” نامیده است.» [Harpham 2005, 21–22]
بسیاری از نشانههای بحران که هارپام مطرح میکند، در مباحثات مختلف بررسی شدهاند [Olmos-Peñuela 2014]، [Belfiore 2014]، [Parker 2007]، [Nussbaum 2010] و نشانههای دیگری نیز به آن افزوده شده است؛ از جمله کاهش بودجه عمومی [Pascoe 2002]، فقدان میانرشتهای بودن [Bassnett 2002] و تأثیر آنچه بهعنوان «غیرانسانی» در علوم انسانی شناخته میشود [Barnett 2014].
این ویژگیهای علوم انسانی ممکن است کاملاً درست و مرتبط باشند، اما معمولاً از یک تغییر عمده که بهآرامی از اواخر دهه ۱۹۶۰ علوم انسانی را تحت تأثیر قرار داده و اکنون با سرعت زیادی در حال ظهور است، غافل میمانند: ورود «دیجیتال» به علوم انسانی.
در دهۀ گذشته، مباحث پیرامون رایانۀ دیجیتال و علوم انسانی عمدتاً تحت عنوان کلی «علوم انسانی دیجیتال» مطرح شدهاند. علوم انسانی از طریق دیجیتالیسازی موضوعات مورد مطالعه، بهکارگیری ابزارهای تحلیلی دیجیتال، و ایجاد ابزارهای ارتباطی دیجیتال برای همکاری در فرآیند پژوهش، بحث و انتشار نتایج علمی، و تعامل با جامعه بهطور کلی، ماهیتی دیجیتال یافته است.
رویکردی خودبازاندیشانهتر نسبت به علوم انسانی دیجیتال نیز پدیدار شده است که طیفی از مانیفستهایی مانند مانیفست علوم انسانی دیجیتال [Digital Humanities Manifesto]، تا مجموعههای ویرایششده، تکنگاریها و مقالاتی را دربرمیگیرد که این حوزه را ترسیم میکنند [Screibman]، [Berry 2012]، [Gold 2012]، [Burdick et al. 2012]، [Warwick 2012]، [Borgman 2009]، [Svensson 2010]، [Deegan 2014]، [Svensson 2012a]، [Liu 2011]، [Jones 2014]. همچنین، ویژهنامههایی از مجلات علمی [DHQ e-Science 2009]، [Arts and Humanities in Higher Education 2011]، [Historical Social Research 2012]، [MedieKultur 2014] و گزارشهایی از نهادهایی نظیر [American Council of Learned Societies 2006]، [European Commission 2011]، [Holm 2015] در این زمینه منتشر شدهاند.
با این حال، تلاشهای نظاممندی برای شناسایی (برخی از) عوامل محرک ورود فناوری دیجیتال به علوم انسانی انجام نشده است. اگر دیجیتالسازی واقعاً در علوم انسانی جایگاه پررنگتری مییابد، دلیل این امر چه میتواند باشد؟
بهطور مسلم، تغییری عمده و غیرقابلبرگشت در بطن علوم انسانی رخ داده است، زیرا منابع و دادههایی که در بسیاری از رشتههای انسانی مطالعه میشوند، از آنالوگ به دیجیتال تبدیل شدهاند. چند عدد میتواند این موضوع را نشان دهد: در سال ۲۰۰۰، ۷۵٪ از کل دادههای ذخیرهشده بهصورت آنالوگ (کاغذ، فیلم، عکس چاپی، صفحه وینیل، نوار کاست مغناطیسی و غیره) بودند، اما در سال ۲۰۰۷ این مقدار به ۷٪ کاهش یافت و در سال ۲۰۱۲، به ۲٪ رسید [Mayer-Schönberger 2013, 8–9]. از سال ۱۴۵۳ تا ۱۵۰۳، پس از اختراع چاپ، هشت میلیون کتاب منتشر شد و مقدار مطالب نوشتاری در جهان در عرض ۵۰ سال دو برابر شد. اما امروزه حجم دادههای دیجیتال تقریباً هر سه سال یکبار دو برابر میشود، در حالی که حجم دادههای آنالوگ تقریباً هیچ رشدی ندارد [Mayer-Schönberger 2013, 8–10].
اگرچه ممکن است این ارقام مورد بحث قرار گیرند، اما روند کلی بدون تردید مشخص است: در دهه اخیر، ما شاهد تغییر اساسی از مواد آنالوگ به دیجیتال بودهایم و احتمالاً این تازه آغاز راه است. بنابراین میتوان استدلال کرد که یکی از عوامل دگرگونکننده اصلی در علوم انسانی قرن ۲۱، حرکت از منابع آنالوگ به منابع دیجیتال است. قبل از سال ۲۰۰۰، ورود دیجیتال به علوم انسانی از طریق مجموعههای دیجیتالیشده، ابزارها و بسترهای ارتباطی شاید یک انتخاب اضافی بود، اما در آینده اینگونه نخواهد بود.
اگر این ویژگی علوم انسانی در آغاز قرن ۲۱ درست باشد، باید از خود بپرسیم که چگونه باید این تغییر را مفهومسازی کنیم، این تغییر چه تأثیری بر علوم انسانی خواهد داشت و علوم انسانی تا چه حد دیجیتالی خواهد شد.
با در نظر گرفتن آمارهای ذکرشده بهعنوان نقطۀ آغاز، این مقاله به بررسی این پرسشهای کلی خواهد پرداخت، با تمرکز بر پرسش اصلی، یعنی ماهیت منابع دیجیتال. استدلال اصلی این است که همۀ انواع مادۀ دیجیتال صرفاً به دلیل دیجیتال بودن، به یک شکل دیجیتال نیستند. برای پشتیبانی از این استدلال، تمایزی میان منابع دیجیتالیشده (digitized)، ذاتاً دیجیتال (born-digital) و بازدیجیتالشده (reborn-digital) معرفی میشود. با استفاده از این تمایز بهعنوان نقطۀ شروع، تفاوتهای اساسی بین دو نمونۀ مادۀ دیجیتالیشده و بازدیجیتالشده از طریق مقایسۀ دقیق ماهیت مجموعههای دیجیتالیشده و آرشیوهای وب تشریح میشود و بررسی میگردد که این تفاوتها چگونه بر نحوۀ استفادۀ علمی از این منابع تأثیر میگذارند.
اما پیش از پرداختن به جزئیات بیشتر در این زمینه، لازم است ابتدا تأملی کوتاه بر این مسئله داشته باشیم که «دیجیتال» چه معنایی میتواند داشته باشد و این مفهوم چگونه در ترکیب با علوم انسانی، مفهوم «علوم انسانی دیجیتال» را شکل میدهد.
2. دیجیتال، علوم انسانی – علوم انسانی دیجیتال
یکی از چالشهای اصلی در بررسی پرسشهای مطرحشده این است که «علوم انسانی دیجیتال» میدان رقابت تعاریف مختلف است – آیا این حوزه یک «بستر گسترده» است؟ [Svensson 2012b, 36] یا یک «منطقۀ مبادله و محل ملاقات»؟ ([Svensson 2011, 50–56]). این مسئله نهتنها در مورد علوم انسانی دیجیتال بلکه درباره خود مفهوم «دیجیتال» و همچنین «علوم انسانی» نیز صادق است. تلاشها برای تعریف علوم انسانی دیجیتال اغلب فراموش میکنند که علوم انسانی پیش از آنکه ظاهراً دیجیتال شوند، چه بودند، و این امر بر پیچیدگی و ابهام آن میافزاید.
با هدف معرفی درکی از علوم انسانی دیجیتال که بهعنوان چارچوب و پشتیبان استدلالهای مقاله درباره منابع دیجیتال به کار خواهد رفت، این بخش بهطور مختصر به «رایانه دیجیتال» و همچنین موضوعات اصلی که تعاریف و ترسیمهای علوم انسانی باید به آنها بپردازند، اشاره خواهد کرد. سپس این دو محور فکری با یکدیگر ترکیب میشوند تا به درکی جامع از علوم انسانی دیجیتال دست یابیم.
2.1 دیجیتال
نکته قابلتوجه در ادبیات مربوط به علوم انسانی دیجیتال این است که به مفهوم «دیجیتال» چندان پرداخته نشده است (برای مثال، [Laue 2004]، [Deegan 2014, 30]). اشارهها به دیجیتال عمدتاً بر توسعه تاریخی رایانهها بهعنوان مصنوعات و استفاده از آنها در علوم انسانی متمرکز است، بدون آنکه بازتابهای نظاممندی درباره خود مفهوم «دیجیتال» و ماهیت دیجیتالی رایانه ارائه شود؛ چیزی که ویژگی اصلی آن را تشکیل میدهد.
یکی از استثناها در این زمینه اوِنز (Evens) است که کد دودویی متشکل از صفرها و یکها را نقطه آغازین توسعه مصنوعات و فرهنگ دیجیتال میداند: «عنصر مشترک در تمام فناوریهای دیجیتال، جنبه وحدتبخش فرهنگها، هنرها و رسانههایی که ما آنها را دیجیتال مینامیم، کد دودویی گسسته است.» [Evens 2012, 7]. بنابراین، کد دودویی شرط امکان مصنوعات فناوری است (بری نیز بر مفهوم دیجیتال تأکید دارد و به کارهای انجامشده در حوزه نرمافزار و مطالعات انتقادی کد تکیه میکند)، اما بدون ارائه تعریفی از دیجیتال [Berry 2012, 4–6]. اوِنز کد دودویی صفرها و یکها را بهعنوان اعدادی که میتوان محاسبه کرد، در نظر میگیرد [Evens 2012]، اما رویکرد دیگری نیز وجود دارد که آنها را بهجای اعداد، بهعنوان حروف در نظر بگیرد. در این صورت، مفهوم دیجیتال از یک مسئله ریاضی به یک مسئله متنی تغییر میکند. این رویکرد را میتوان در تعریف فینمن (Finnemann) از رایانه دیجیتال یافت.
در مفهومپردازی فینمن، رایانه دیجیتال دارای سه ویژگی ثابت و تغییرناپذیر است:
۱) یک الفبای مکانیکی متشکل از تعداد محدودی از حروف که هرکدام از معنا تهی هستند،
۲) یک نحو الگوریتمی، و
۳) یک واسط که تعیینکننده معناشناسی آن نحو است [Finnemann 1999]، همچنین بنگرید به [Brügger and Finnemann 2013, 68–69].
ایدهای که بیان میکند صفرها و یکها را میتوان بهعنوان حروف و نه اعداد در نظر گرفت، مبتنی بر این فرض است که اعداد از معنا تهی نیستند—عدد ۰ به معنی «صفر» و عدد ۱ به معنی «یک» است—اما برای اینکه بتوان آنها را از طریق نحو الگوریتمی ترکیب کرد، باید همانند دیگر حروفی که در قالب کلمات ترکیب میشوند، تهی از معنا باشند. هر سه ویژگی یادشده ضروری هستند، اما ضرورتاً شکل خاصی ندارند. امروزه، الفبای مکانیکی متشکل از تعداد محدودی از حروف همان الفبای دودویی است که شامل دو حرف ۰ و ۱ میشود، نحو الگوریتمی در اشکال مختلفی از سطح ماشین تا سطح کاربر وجود دارد، و واسط میتواند هر نوع دستگاهی باشد که بتواند الفبای دیجیتال و نحوهای الگوریتمی آن را پردازش کند، از رایانههای شخصی و دستگاههای همراه گرفته تا رایانههای مرکزی و شبکهای.
پیامد این رویکرد به مفهوم دیجیتال این است که در بنیادیترین سطح، رایانه دیجیتال را میتوان بهعنوان یک «ماشین نوشتن» در نظر گرفت، که در آن حروف برای تشکیل «متون» در تمام سطوح رایانه با یکدیگر ترکیب میشوند، و این متون در هر لحظه، حتی در سطح تکبیتی، قابل ویرایش هستند. در راستای نکتهای که اوِنز مطرح کرد، مهم است که ماهیت بنیادی دیجیتالی رایانهها را در درک علوم انسانی دیجیتال لحاظ کنیم، زیرا این ویژگی، شرط امکان تمام اشکال عینی علوم انسانی دیجیتال است.
2.2 علوم انسانی
شایان ذکر است که علوم انسانی همواره بهصورت جمع به کار میروند. البته، این جمع بودن به تنوع رشتههای مختلف علوم انسانی اشاره دارد، اما میتوان آن را نشانهای از این دانست که «علوم انسانی» حوزهای بسیار گسترده و متنوع است و تعریف واحد و مشترکی برای آن وجود ندارد. با این حال، میتوان چندین موضوع کلیدی را شناسایی کرد که معمولاً در تعریف علوم انسانی مورد بحث قرار میگیرند.
نخست، باید به مسئلۀ مرزبندیها پرداخت: چه چیزی درون یا بیرون علوم انسانی قرار میگیرد؟ آیا انسانشناسی یک علم اجتماعی است یا بخشی از علوم انسانی محسوب میشود؟ آیا حقوق باید جزو علوم انسانی دانسته شود یا بخشی از علوم اجتماعی؟ [Howarth 2004] همچنین، آیا ارتباطات یک رشتۀ علوم انسانی است یا علوم اجتماعی؟ [Gronbeck 2005] و چگونه باید رشتههای نوظهوری مانند ادبیات و پزشکی [Bolton 2008]، یا مطالعاتی را که در مرز میان علوم انسانی و علوم شناختی قرار دارند، درک کرد؟ [Beňuš 2010]
دوم، بحثهای مربوط به علوم انسانی معمولاً پیرامون این موضوع شکل میگیرند که آیا میتوان یک موضوع مطالعۀ واحد و بهوضوح تعریفشده برای آن مشخص کرد، و اینکه آیا مجموعهای از رویکردهای نظری و روششناختی غالب وجود دارد که در تمامی رشتههای این حوزه قابل استفاده باشد یا خیر.
سوم، هدف علوم انسانی اغلب بهعنوان یک ویژگی تعیینکنندهی این حوزه مطرح میشود. برای مثال، این پرسش مطرح است که آیا علوم انسانی باید به پیشرفت بشریت و فرهنگ انسانی کمک کنند، یا ماهیتی توصیفی داشته باشند، یا اینکه به ارزشهای فردی، اجتماعی یا صنعتی تبدیل شوند.
و چهارم، علوم انسانی را میتوان بر اساس تقسیمبندیهای اداری آموزش عالی و پژوهش نیز مرزبندی کرد، که در این صورت، تعریف آن بیشتر ماهیتی رسمی خواهد داشت. در چنین تعریفی، علوم انسانی به آنچه در یک نهاد دانشگاهی، مانند دانشکدۀ علوم انسانی، جای میگیرد، محدود میشود.
اگرچه تعریف دقیق و یکسانی از علوم انسانی وجود ندارد، اما این چهار موضوع همواره در تلاشها برای تعریف این حوزه مطرح میشوند. بنابراین، هر تعریفی از علوم انسانی، مجموعهای خاص از پاسخها به پرسشهای مطرحشده در این چهار حوزه را دربر میگیرد: مرزهای این حوزه چیست؟ موضوع(های) مطالعۀ آن کداماند؟ نظریهها و روشهای آن چیست؟ اهداف آن چیست؟ و وابستگی نهادی آن چگونه است؟ این مجموعۀ پاسخها در طول تاریخ دستخوش تغییر بوده و ممکن است به زمینۀ ملی نیز بستگی داشته باشد. ازاینرو، تعریف «علوم انسانی» بهطور دقیق و قطعی دشوار است، و نمیتوان از آن بهعنوان مبنای مشخصی برای درک علوم انسانی دیجیتال استفاده کرد. درعوض، باید این واقعیت را پذیرفت که علوم انسانی حوزهای پویا، پیچیده و در حال تغییر است که بسته به شرایط، اشکال متفاوتی به خود میگیرد. به همین دلیل، هر درک و تعریفی از علوم انسانی دیجیتال باید ابتدا مشخص کند که کدام شکل از علوم انسانی موردنظر است که به عرصۀ دیجیتال وارد میشود.
2.3 علوم انسانی دیجیتال
همانطور که پیشتر اشاره شد، یکی از بزرگترین چالشها در هر تلاشی برای تعریف علوم انسانی دیجیتال این است که نه «دیجیتال» و نه «علوم انسانی» تعریفی مشخص و یکدست ندارند. بهویژه باید توجه داشت که ابهام و پیچیدگی موجود در «علوم انسانی» صرفاً با اضافه شدن واژۀ «دیجیتال» از میان نمیرود یا حل نمیشود. برعکس، این تفاوتها همچنان باقی میمانند و حتی ممکن است افزایش یابند، و هر تلاشی برای تعریف علوم انسانی دیجیتال بدون در نظر گرفتن تعریفی برای علوم انسانی، در نهایت به بحثهایی دربارهی چیستی علوم انسانی منجر خواهد شد.
بنابراین، شاید رویکرد بهتر این باشد که ابتدا از «دیجیتال» آغاز کنیم، مثلاً بر اساس تعریفی که پیشتر از دیجیتال ارائه شد. چنین رویکردی پیچیدگیهای علوم انسانی را برطرف نمیکند، اما یک مبنای مشترک حداقلی برای بررسی چگونگی ارتباط میان علوم انسانی و دیجیتال فراهم میآورد.
بر این اساس، تعریف زیر برای علوم انسانی دیجیتال پیشنهاد میشود تا چارچوب کلی بحث دربارهی ماهیت خاص منابع دیجیتال را شکل دهد: علوم انسانی (فارغ از اینکه «علوم انسانی» چگونه تعریف شود) که بهنوعی از رایانههای دیجیتال استفاده میکند و از این طریق، ویژگیهای بنیادی رایانه را متناسب با نیازهای پژوهشی خاص خود شکل میدهد؛ این شکلدهی نیز مبتنی بر تعریفی است که خود از علوم انسانی ارائه میدهد، پرسشهای پژوهشیای که مطرح میکند، و روشهایی که در عمل به کار میبندد. مزیت این تعریف این است که، از یک سو، یک مبنای مشترک برای هرگونه تعریف دقیقتر از علوم انسانی دیجیتال فراهم میکند – یعنی مفهومی از دیجیتالی بودن – و از سوی دیگر، بهاندازهای باز و انعطافپذیر است که بتواند طیف وسیع تعاریف مختلف از علوم انسانی را که در نظریه یا در عمل پژوهشی شکل گرفتهاند، در بر گیرد، و همچنین، اشکال متنوع استفاده از رایانه را در این حوزه لحاظ کند. نکتۀ مهم این است که رابطهی میان «دیجیتال» و «علوم انسانی» بهصورت یک مسیر یکسویه و جبری از «دیجیتال» به «علوم انسانی» در نظر گرفته نمیشود. بلکه این رابطه بهعنوان یک تعامل دیالکتیکی میان «دیجیتال» و «علوم انسانی» تلقی میشود که در آن، هریک دیگری را شکل داده و بازتعریف میکند؛ این دو به یکدیگر وابستهاند.
با این درک از علوم انسانی دیجیتال، اکنون نگاهی دقیقتر خواهیم داشت به برخی از شیوههای مشخصی که در آنها ویژگیهای بنیادی رایانه – شامل الفبای دیجیتال، نحو الگوریتمی و واسط کاربری – توسط روشهای پژوهشی در علوم انسانی شکل داده شده و تغییر یافتهاند.
3. سه نوع مادۀ دیجیتال در علوم انسانی دیجیتال
رابطۀ میان علوم انسانی و دیجیتال از جهتی بسیار بنیادین با «مادۀ مورد مطالعه» گره خورده است، زیرا بهکارگیری ابزارهای تحلیلی دیجیتال زمانی معنا پیدا میکند که موضوع پژوهش، بهنوعی در قالب دیجیتال وجود داشته باشد. در این بخش، سه رویکرد برای درک اهمیت «دیجیتالیبودنهای متفاوت» مواد دیجیتال ارائه میشود:
نخست، یک گونهشناسی کلی از سه نوع مادۀ دیجیتال پیشنهاد میشود، بر پایهی این فرض که اگرچه همۀ انواع مادۀ دیجیتال از الفبای دیجیتال مشترکی بهره میبرند، اما این بدان معنا نیست که تمام مواد دیجیتال از هر لحاظ یکساناند — به بیان دیگر، «مادۀ دیجیتال»، صرفاً «مادۀ دیجیتال» نیست.
دوم، رویکردی نظاممند ارائه میشود تا نشان دهد «دیجیتال» دقیقاً در کجای فرایند پژوهش در علوم انسانی قرار میگیرد.
و سوم، خلاصهای کوتاه از روند تاریخی تعامل میان علوم انسانی و فناوری دیجیتال ارائه خواهد شد.
3.1 مواد دیجیتالیشده، زاده دیجیتال، و باززاده دیجیتال
از یک سو، همۀ انواع مادۀ دیجیتال ویژگی مشترکی دارند و آن اینکه «دیجیتال» هستند. اما از سوی دیگر، این «دیجیتالیبودن» همواره در ساختارهایی معنایی، فنی و علمی از پیش موجود جای گرفته است. این بدان معناست که مادۀ دیجیتال فقط «دیجیتال» نیست، بلکه به شیوههای گوناگونی دیجیتال است (بحثی مشابه دربارۀ ابزارهای دیجیتال و جایگرفتن آنها در ساختارهای موجود در [Collins 2011] مطرح شده است).
در این بخش، گونهشناسی کلیای از «دیجیتالیبودن» پیشنهاد میشود که بر پایۀ «خاستگاه» مادۀ دیجیتال بنا شده و سه نوع اصلی را از هم متمایز میسازد:
۱. مواد دیجیتالیشده (Digitized)،
۲. مواد زادۀ دیجیتال (Born-digital)،
۳. مواد باززادۀ دیجیتال (Reborn-digital).
مواد دیجیتالیشده موادیاند که در اصل بهصورت آنالوگ وجود داشتهاند و سپس دیجیتالی شدهاند؛ برای مثال اسناد مکتوب روی کاغذ یا پوست، یا رسانههای الکترونیکی مانند رادیو و تلویزیون، و حتی عکسها یا مدلهای سهبعدی از اشیای فیزیکی.
فرآیند دیجیتالیسازی، هر نوع تبدیل مادۀ آنالوگ به شکل دیجیتال است — چه تایپ کردن پرزحمت اسناد بر روی کارتهای پانچ، چه اسکن آسانتر اسناد برای تبدیل به فایل تصویری، و چه ضبط دیجیتال صدا یا تصویر متحرک.
ویژگی اصلی مواد دیجیتالیشده این است که «دیجیتال شدن» آنها بر مبنای نسخهای اصلی است که دیجیتال نبوده — نسخهای که در بسیاری موارد هنوز قابل بازیابی است و میتواند به عنوان معیار یا نقطهی مرجع مورد استفاده قرار گیرد (برای بازتابهایی دربارۀ مجموعههای دیجیتالیشده، بنگرید به: [Hockey 2000, 11–23] و [Terras 2012]).
مواد زاده دیجیتال به موادی گفته میشود که هرگز در قالبی غیر از دیجیتال وجود نداشتهاند. این دسته شامل همۀ انواع محتوایی است که از آغاز بر رسانههای دیجیتال مانند CD-ROM، DVD، اینترنت و وب منتشر شدهاند. این نوع از مواد دیجیتال نسخهی آنالوگی برای بازگشت ندارد، زیرا «نسخۀ اصلی» آن از همان ابتدا دیجیتال بوده است (نگاه کنید به: [Berry 2012, 4]، همچنین [Jones 2014] و [Kirschenbaum 2013] که این اصطلاح را به کار بردهاند).
مواد باززاده دیجیتال اصطلاحی است که برای توصیف موادی پیشنهاد شده که در اصل «زاده دیجیتال» بودهاند، سپس گردآوری و بایگانی شدهاند، و در این فرایند، تا حد زیادی دچار دگرگونی شدهاند. نمونههایی از این دست عبارتاند از بازیهای رایانهای شبیهسازیشده (emulated) یا مطالب بایگانیشده از وب — که مورد دوم در بخش ۴ با جزئیات بیشتری بررسی خواهد شد.
هر یک از این سه نوع کلی را میتوان به زیرگونههایی تقسیم کرد، چنانکه نمونههای بالا نیز نشان میدهند: برای مثال، اسناد دیجیتالیشدهای مانند روزنامهها با رسانههای زمانمند دیجیتالیشدهای همچون رادیو یا تلویزیون متفاوتاند؛ همانگونه که مواد زاده دیجیتال، مثلاً بازیهای کامپیوتری روی DVD با محتوای آنلاین یا اپلیکیشنهای موجود روی آیپد تفاوت دارند (نگاه کنید به بخش ۳.۲).
3.2 دیجیتال در فرایند پژوهش پژوهشگر علوم انسانی – یک رویکرد نظاممند
ماهیت خاص هر یک از سه نوع مادهی دیجیتال تأثیر مستقیمی بر نحوهی استفاده و مواجههی پژوهشگر با آنها در فرایند تحقیق دارد. اما پیش از بررسی جزئیتر اینکه این تأثیر چگونه در جهان دیجیتال بروز مییابد، بهتر است نگاهی به یک نمایش شماتیک از چگونگی شکلگیری فرایند تحقیق در دوران پیشادیجیتال بیندازیم (نگاه کنید به شکل ۱). این مدل بسیار کلی ممکن است با همهی شاخههای علوم انسانی همخوانی نداشته باشد، اما تصویری مناسب از جایگاه احتمالی دیجیتال در فرایند پژوهشی بیشتر رشتهها ارائه میدهد. افزون بر این، باید تأکید کرد که آنچه به عنوان دو جهان متمایز — آنالوگ و دیجیتال — ارائه میشود، در عمل و در دنیای دیجیتال امروز بسیار درهمتنیده است، به این معنا که حتی پژوهشگرانی که خود را «انسانگرای دیجیتال» مینامند، در مراحل مختلف پژوهش خود بین محیطهای آنالوگ و دیجیتال جابجا میشوند. اما برای وضوح بحث، این دو محیط علمی بهصورت دو محیط مجزا معرفی میشوند.
فرایند پژوهش به چهار مرحلهی اصلی تقسیم میشود: گردآوری مواد مورد مطالعه، تحلیل آنها، بحث و بررسی نتایج و در نهایت انتشار آنها. این روند ممکن است تکرارشونده باشد؛ برای نمونه، تحلیل ممکن است به گردآوری دادههای جدید منجر شود، بحثها ممکن است به بازنگری تحلیل بینجامد، و فرآیند انتشار ممکن است بر همهی مراحل پیشین اثر بگذارد (ماهیت تکرارشونده از طریق فلشهای بازگشتی نشان داده شده است).
نکتهی کلیدی در این رویکرد آن است که ماهیت مادهی مورد مطالعه تا حد زیادی تعیینکننده – یا دستکم محدودکنندهی دامنهی امکانات – برای هر یک از این چهار مرحله است. مواد آنالوگ باید به شیوهای آنالوگ گردآوری شوند، که این ممکن است به معنای نیاز پژوهشگر به مراجعهی حضوری به محل نگهداری اشیاء یا اسناد باشد؛ تحلیل آنها نیز باید با بهرهگیری از ابزارهای کمکی همچون نمایههای چاپی، کارتهای فیشبرداری و نیز نحوهی سازماندهی در بناها و نهادهای فیزیکی حاوی مجموعهها صورت گیرد (برای مثال در نهادهایی همچون موزهها، کتابخانهها، آرشیوها و گالریها که به اختصار «GLAM» نامیده میشوند). بحثها عمدتاً باید بهصورت حضوری، مثلاً در همایشها، یا از طریق ارائههای پیشانتشار مانند مقالات کنفرانسی صورت گیرد، و مرحلهی انتشار معمولاً در رسانههای چاپی مانند کتابها، مجلات یا روزنامهها یا در برخی موارد در رسانههای الکترونیکی (رادیو، تلویزیون) انجام میشود.
اما تنها آنالوگ بودن اشیاء مورد مطالعه بر مراحل پژوهش تأثیر نمیگذارد، بلکه ویژگیهای آنها در سطحی دقیقتر نیز اثرگذار است. از این رو، تمایزی نظاممند معرفی میشود میان، از یکسو، اشیای نشانهمند (سِمیوتیکی) و غیرنشانهمند، و از سوی دیگر، موادی که یا از گذشته به ما رسیدهاند یا توسط خود پژوهشگر خلق شدهاند. اسناد نشانهمند که از گذشته بهجا ماندهاند، میتوانند شامل اشیائی باشند که حاوی نظامهای نشانهایاند، مبتنی بر واحدهای گسسته (مانند اسناد، کتابها، روزنامهها همراه با نوشتار یا تصاویر ثابت، یا فیلم/تلویزیون همراه با نوشتار، صدا و تصویر متحرک)؛ در حالیکه اشیای غیرنشانهمند میتوانند هرگونه مصنوع فیزیکی باشند. دربارهی مواد خلقشده توسط خود پژوهشگر، این مواد نیز میتوانند یا نشانهمند باشند (مثلاً مصاحبهی ضبطشده، یادداشتهای میدانی، پرسشنامههای کاغذی و مانند آن) یا غیرنشانهمند، همچون طرحهای اولیهی طراحی یا بازسازیهای باستانشناسی تجربی. باید تأکید کرد که این دو دستهبندی، تمایزاتی تحلیلی هستند که با هدف برجستهسازی ویژگی غالب هر نوع مادهی مطالعاتی صورت میگیرند. بنابراین، تمایز روشن بین نشانهمند و غیرنشانهمند، این واقعیت را کمرنگ میکند که مواد نشانهمند نیز بهنوعی مصنوعات فیزیکی هستند (مثلاً کتابها)، و در عین حال، مصنوعات نیز دارای معنایی هستند، حتی اگر حامل نظام نشانهای خاصی نباشند (مثلاً یک سلاح باستانی میتواند نماد قدرت فرهنگی باشد). همچنین، مواد بهجامانده از گذشته هرگز بهصورت بیطرفانه بررسی نمیشوند، بلکه همیشه از سوی پژوهشگر با نیت خاصی انتخاب میشوند تا سوژهی مطالعه ساخته شود؛ و از سوی دیگر، مواد خلقشده توسط پژوهشگر نیز اغلب بر پایهی مواد گذشته ساخته میشوند.
همانگونه که اشاره شد، هدف این است که تأکید شود ویژگیهای گوناگون اشیای مطالعاتی تأثیر مستقیمی بر نحوهی مواجهه با آنها در چهار مرحلهی پژوهش دارند (که با پیکانهای نازک نشان داده شدهاند). رویکرد تحلیلی نسبت به مادهی مورد مطالعه، بسته به آنکه با اسناد یا مصنوعات بهجامانده سروکار داشته باشیم یا با مصاحبهها یا آزمایشهای باستانشناسی خلقشده توسط پژوهشگر، متفاوت است؛ و به همان نسبت، بحث و انتشار نتایج نیز ممکن است بسته به نوع ماده تفاوت یابد.
اکنون بیایید ببینیم که این فرآیند در جهان دیجیتال چگونه رخ میدهد، جایی که پژوهشگر با سه نوع اصلی مادهی دیجیتال که در بخش ۳.۱ مطرح شد، مواجه میشود.
این واقعیت که ماهیت مادهی مورد مطالعه، دامنهای از امکانات را برای هر یک از چهار مرحلهی فرایند تحقیق فراهم میکند، در مورد مواد دیجیتال نیز صدق میکند. در مقایسه با مواد آنالوگ، مواد دیجیتال – اگر به صورت آنلاین در دسترس باشند – میتوانند از راه دور گردآوری شوند؛ ابزارهای دیجیتال برای جستجو، پالایش و تحلیل مواد میتوانند تحلیل را پشتیبانی کنند؛ و مواد دیجیتال فرصتهای تازهای برای بحث (مانند وبلاگها، ویکیها، پایگاههای پیشانتشار) و برای انتشار و تعامل (مانند فایلهای کامپیوتری، پایگاهدادهها، وبسایتها، مصورسازیهایی همچون جهانهای مجازی، سامانههای اطلاعات جغرافیایی، نقشهها و جدولهای زمانی تعاملی) فراهم میکنند.
با این حال، هرچند این فرصتها برای تعامل با مواد دیجیتال تا حد زیادی ناشی از ماهیت دیجیتال آنهاست، اما در سطحی جزئیتر، آنها همچنین تابعی هستند از نوع مشخص هر یک از سه دستهی اصلی مواد دیجیتال که پیشتر معرفی شدند. مواد دیجیتالشده، زادهدیجیتال، و باززادهدیجیتال، هر یک شکلهای خاصی از بهرهبرداری علمی را فراهم میکنند، گرچه ممکن است همپوشانیهایی نیز رخ دهد: مواد دیجیتالشده میتوانند بهشیوههایی خاص برای جمعآوری، تحلیل، بحث و انتشار مورد استفاده قرار گیرند که مختص دیجیتال بودن آنهاست؛ در حالیکه مواد زادهدیجیتال باید بهشیوهای دیگر و مواد باززادهدیجیتال نیز به شکلی متفاوت دیگر مورد بررسی قرار گیرند. این موضوع در بخش ۴ با مقایسهی ماهیت مواد دیجیتالشده و باززادهدیجیتال بهتفصیل بررسی خواهد شد.
این سه نوع اصلی مادهی دیجیتال، فرایند پژوهش را به روشهای گوناگون تحت تأثیر قرار میدهند، اما پرسشهای دیگری نیز در این میان قابل طرح هستند: آیا مادهی مورد نظر نشانهمند است یا غیرنشانهمند؟ و آیا این ماده از گذشته بهجامانده یا توسط پژوهشگر خلق شده است؟ دربارهی مواد دیجیتالشده، یکی از مسائل اساسی این است که مصنوعات آنالوگ و اشیاء خلقشده توسط پژوهشگران نمیتوانند خود به خود دیجیتال شوند، بلکه باید بهگونهای به تصویر یا بازنمایی دیجیتال تبدیل شوند. و در مورد مواد زادهدیجیتال، اشیاء غیرنشانهمند احتمالاً بهطور کامل دیجیتال نیستند، بلکه تنها اجزایی دیجیتال دارند. دربارهی مواد باززادهدیجیتال نیز، هر یک از چهار زیرگروه ماده احتمالاً تفاوتهایی خواهند داشت، چرا که این مواد به احتمال زیاد در فرآیند انتقال از فضای زادهدیجیتال به فضای آرشیوی، بهشکلهای مختلف دچار دگرگونی میشوند.


3.3 تعامل میان دیجیتال و علوم انسانی – نگاهی اجمالی بر یک روند تاریخی
رویکرد نظاممندی که پیشتر توضیح داده شد، با تکیه بر منشأ سه نوع اصلی از مواد دیجیتال، جایگاه فناوری دیجیتال را در روند پژوهش علمی مشخص میکند. اما همین رویکرد تحلیلی را میتوان برای ترسیم اجمالی تحولات تاریخی در تعامل بین علوم انسانی و فناوری دیجیتال نیز به کار گرفت. هعنوان یک فرض اولیه، میتوان سه موج اصلی را در رابطهی میان علوم انسانی و فناوری دیجیتال شناسایی کرد (برای نمونههایی دیگر از دورهبندی، بنگرید به: [Berry 2012, 3–6]، [Thaller 2012, 14–17]، و [Finnemann 2014, 95–100]).
موج نخست در دهۀ ۱۹۶۰ آغاز میشود، زمانی که حوزههای پژوهشی تازهای چون «محاسبات علوم انسانی» (Humanities Computing)، «محاسبات ادبی» (Literary Computing)، «زبانشناسی رایانشی» (Computational Linguistics) و بعدها «تاریخ دیجیتال» (Digital History) شکل گرفتند. [Screibman]، [Cohen and Rosenzweig 2005]، [Finnemann 2014]، و [McCarty 2005].
این رشتههای نوظهور در ابتدا بر پایۀ استفاده از رایانههای بزرگ مستقل (stand-alone mainframes) بنا شدند؛ با گذشت زمان، شبکههای اختصاصی رایانهای گسترش یافتند و در مرحلهای بعد، اینترنتِ باز به کار گرفته شد. ادر این دوره، تمرکز اصلی بر «مواد دیجیتالشده» (digitized material) بود؛ یعنی منابع آنالوگ که به صورت دیجیتال تبدیل شدهاند.
موج دوم در اواسط دهۀ ۱۹۹۰ آغاز میشود، زمانی که دو حوزۀ پژوهشی جدید و تا حدی همپوشان، یعنی «مطالعات رسانههای نو» (New Media Studies) و «مطالعات اینترنت» (Internet Studies) پدیدار میشوند. این دو حوزه معمولاً در زمرۀ علوم انسانی دیجیتال طبقهبندی نمیشوند، اما اگر نگاهمان به چگونگی ورود فناوری دیجیتال به دل علوم انسانی باشد – یا دستکم به برخی از رشتههای آن – شاید بهتر باشد که آنها را نیز در این دسته بگنجانیم. مطالعات رسانههای نو و مطالعات اینترنت، حوزههایی گستردهاند که طیف متنوعی از رشتهها را دربرمیگیرند، اما نقطۀ اشتراک همهی آنها، تمرکز بر رسانههای جدید و اینترنت است (برای نگاهی اجمالی به ارتباط میان علوم انسانی دیجیتال و مطالعات اینترنت، بنگرید به: [Brügger 2005, 106–107]). برخلاف موج اول، موج دوم از همان آغاز بر «مواد زادۀ دیجیتال» (born-digital material) متمرکز است – یعنی منابعی که ذاتاً دیجیتال هستند و هرگز شکل آنالوگ نداشتهاند، زیرا موضوعات مورد مطالعه از ابتدا دیجیتال بودهاند.
موج سوم، درواقع ادامه و گسترش موج دوم است و زیرمجموعهای از آن به شمار میآید، با این تفاوت که بُعد تاریخی را هم به مطالعۀ مواد زادۀ دیجیتال میافزاید: از اوایل دهۀ ۲۰۰۰، مطالعات تاریخی اینترنت بهعنوان بخشی از مطالعات اینترنت ظهور میکنند.. یکی از مهمترین موضوعات این موج «وب آرشیوشده» (archived web) است، اگرچه انواع دیگرِ مواد زادۀ دیجیتال که حفظ شدهاند نیز در آن گنجانده میشوند. در موج سوم، تمرکز بر «مواد باززادۀ دیجیتال» (reborn-digital material) است ؛ یعنی منابعی که ابتدا به شکل دیجیتال پدید آمدهاند و سپس با هدف بایگانیشدن، بهنوعی دگرگون یا منتقل شدهاند(برای مروری بر تاریخنگاریهای وب، بنگرید به: [Brügger 2010, 8–13]).
نکتۀ مهم این است که این سه موج جایگزین یکدیگر نشدهاند، بلکه به شکل همزمان به مسیر خود ادامه دادهاند، به همین دلیل امروزه ما با هر سه نوع اصلی از مواد دیجیتال مواجهیم: مواد دیجیتالشده، زادۀ دیجیتال، و باززادۀ دیجیتال.
4. محتوای باززادۀ دیجیتال – مطالعه موردی: وب آرشیوشده
همانطور که پیشتر اشاره شد، یکی از مهمترین انواع مواد باززادۀ دیجیتال، وب آرشیوشده است. در این بخش، مطالعۀ موردی وب آرشیوشده معرفی میشود، زیرا اهمیت تشخیص تفاوتهای میان انواع مواد دیجیتال را نشان میدهد، و در نتیجه میتواند ضرورت بهکارگیری رویکردهای متفاوت در مواجهه با این مواد را روشن کند.
در اینجا وب آرشیوشده با مواد دیجیتالشده مقایسه میشود، زیرا هر دو نوع، شکلی از تبدیل مواد موجود هستند: یکی از مواد آنالوگ و دیگری از مواد زادۀ دیجیتال. اما چون هم ماهیت مادهای که تبدیل میشود و هم فرآیندهای تبدیل، بسیار متفاوتاند، در نتیجه، نتایج نیز متفاوت خواهند بود. این مقایسه کمک میکند تفاوتهای میان این دو نوع محتوای دیجیتال بهتر دیده شوند. (برای بحثهای دقیقتر در این زمینه، نگاه کنید به منابع [Brügger 2005], [Brügger 2009], [Brügger 2011a], [Brügger 2011b], [Brügger 2012a], [Brügger 2013] و نیز [Dougherty 2010], [Thomas 2010], [Foot and Scheider 2006], و [Masanès 2006]).
با این حال باید تأکید کرد که چون فرایند دیجیتالسازی میتواند دامنهای بسیار گسترده داشته باشد – از تایپ کردن اسناد نوشتاری، کارتهای پانچ، رمزگذاری متون، اسکن تصاویر، تا ضبط دیجیتالی صدا و تصویر – مجموعههای دیجیتالشده پیچیدهتر و متنوعتر از چیزی هستند که در این معرفی کلی ارائه میشود. بنابراین اگر بخواهیم آنها را دقیقتر تحلیل کنیم، باید به تفاوتهای میان انواعشان – از جمله منبع اولیه و نحوۀ دسترسی – توجه داشته باشیم.
4.1 چرا وب را بایگانی میکنیم، در حالی که خودش دیجیتال است؟
پیش از پرداختن به ویژگیهای وب آرشیوشده مهم است به این نکته توجه کنیم که چرا اساساً وب بایگانی میشود؛ زیرا وب، رسانهای ذاتاً دیجیتال است که همواره «در دسترس» به نظر میرسد.
اگرچه ممکن است تصور کنیم همیشه میتوان محتوای وب را یافت، اما واقعیت این است که محتوای وب با سرعتی بیسابقه در حال تغییر است [Brügger 2005, 15]، [Dougherty 2010, 8]، [Brügger 2012a, 318]. آگاهی از این تغییرات پیوسته در کنار درک اهمیت فزایندۀ وب در جوامع ما و نقش آن بهعنوان منبعی تاریخی در آینده، احتمالاً محرک اصلی مؤسسات میراث فرهنگی و پژوهشگران برای بایگانی کردن وب بوده است. آنها میخواهند مطمئن شوند که این محتوا برای آیندگان حفظ خواهد شد.
4.2 بایگانی وب در مقیاس کلان و خرد
«بایگانی وب» به هر نوع اقدام هدفمند و آگاهانه برای حفظ محتوای آنلاین اطلاق میشود [Brügger 2011a, 25]. دو نوع بایگانی وب را میتوان از هم متمایز کرد: بایگانی کلان و بایگانی خرد [Brügger 2005, 10–11].
بایگانی در مقیاس کلان به بایگانیای گفته میشود که توسط نهادهای رسمی مانند کتابخانههای ملی انجام میشود، با هدف حفظ میراث فرهنگی یک کشور و فراهمسازی امکان پژوهشهای گوناگون در آینده.
بایگانی در مقیاس خرد معمولاً توسط پژوهشگران یا گروههایی تحقیقاتی انجام میشود، و هدف آن، حفظ محتوای مرتبط با پروژهای پژوهشی خاص است.
آنچه در ادامه میآید بیشتر به بایگانی کلان مربوط میشود، اما بسیاری از نکات آن در مورد بایگانیهای کوچکتر و پژوهشمحور نیز صدق میکند…
4.3 اصل پایدار و ناپایدار
دیجیتالسازی معمولاً بر پایۀ یک نسخهی آنالوگ پایدار صورت میگیرد؛ چه سندی روی پوست، روزنامهای چاپی، یا برنامهای رادیویی یا تلویزیونی روی نوار باشد.
در مقابل، «اصل» وب برای بایگانی بسیار ناپایدار است، دقیقاً به همان معنای واژه. همانطور که اشاره شد، احتمال زیادی وجود دارد که صفحۀ وب در مدتزمان کوتاهی تغییر کند یا ناپدید شود؛ بنابراین هیچ نسخۀ اصلی قابل بازگشتی وجود ندارد [Schneider and Foot 2004, 115]، [Masanès 2006, 1].
4.4 چه چیز و چگونه باید بایگانی شود؟
پیش از دیجیتالسازی یک مجموعۀ آنالوگ، اصلیترین دغدغه این است که چه چیزی باید دیجیتال شود، و «چگونه» دیجیتالسازی انجام شود، و این معمولاً محدود به انتخاب سختافزار و نرمافزار مناسب است.
اما آرشیو یا بایگانی وب راههای متنوعی دارد که هرکدام نتایج متفاوتی به همراه دارند. مثلاً باید تصمیم گرفت که از کجا بایگانی آغاز و در کجا متوقف شود، چه نوع فایلهایی لحاظ یا حذف شوند، و آیا اجازۀ بازیابی محتوای سرورهای دیگر داده شود یا نه.
در نتیجه، پرسش «چه چیزی باید بایگانی شود» در مورد وب نیز مطرح است، اما مسئلۀ مهمتر این است که چگونه باید وب را بایگانی یا آرشیو کرد. پیامدهای این موضوع دو مورد است:
۱) وب آرشیوشده تا زمانی که فرآیند بایگانی انجام نشده، اساساً وجود ندارد، بلکه در همین فرآیند خلق میشود؛
۲) اگر دو نهاد بایگانی در یک زمان مشخص بخواهند یک وبسایت را بایگانی کنند، به احتمال زیاد نتایج آنها متفاوت خواهد بود، زیرا تنظیمات فنی بایگانی متفاوت است.
در حالی که در مجموعههای دیجیتالشده، تفاوتها در نحوۀ دیجیتالسازی معمولاً به تفاوتهایی جزئی منجر میشود، اما در مورد بایگانی وب، نحوۀ انجام بایگانی میتواند دو نسخۀمنحصربهفرد اما متفاوت خلق کند. (همچنین باید افزود که نحوۀ کنار هم قرار دادن قطعات بایگانیشده در درون آرشیو میتواند این تفاوتها را پیچیدهتر نیز کند.)
4.5 شفافیت و ابهام
فرآیند دیجیتالسازی تا حد زیادی شفاف است: نهاد دیجیتالکننده، دید روشنی از مجموعۀ مورد نظر و از آنچه در حین دیجیتالسازی رخ میدهد، دارد.
اما در مورد بایگانی وب چنین نیست. بایگانی وب فرآیندی مبهمتر است، عمدتاً به این دلیل که پس از آغاز عملیات بایگانی، دقیقاً نمیدانیم در فضای وب چه اتفاقی میافتد.
مشکلات فنی ممکن است پیش بیاید؛ مثلاً ممکن است فرآیند بایگانی متوقف شود، منحرف گردد (مثلاً با افتادن در تلههایی مانند تقویمها یا صفحات تولیدکنندۀ لینکهای بیپایان)، یا با فرمتهایی مواجه شود که قابل بایگانی نیستند (مثل ویدئوی استریمشده، جاوا اسکریپت و غیره).
افزون بر این، پدیدهای خاص بایگانی وب که «پویایی بهروزرسانی» نامیده میشود نیز به ابهام میافزاید [Brügger 2005, 22–23] — یعنی اینکه وبسایتی که در حال بایگانی است، ممکن است همزمان در حال تغییر باشد، بدون آنکه بدانیم دقیقاً چه زمانی، در کجا و چگونه این تغییرات رخ میدهند؛ گویی صفحات یک روزنامه حین اسکن، دائماً در حال ویرایش باشند.
از آنجا که نسخۀ «اصلی» وبسایت معمولاً پس از بایگانی دیگر در دسترس نیست، امکان مقایسه یا بازگشت هم وجود ندارد.
4.6 نقاط زمانی و تداوم در وب
بهطور کلی، رسانههای آنالوگی که دیجیتال میشوند معمولاً به یک نقطه مشخص در زمان (مثلاً تاریخ انتشار رسانههای چاپی) یا به بازههای زمانی با آغاز و پایان مشخص (مثل رادیو و تلویزیون) مربوطاند.
اما در مورد وب، این روند کاملاً متفاوت است. انتشار وبسایتها نه در یک لحظه خاص رخ میدهد و نه محدود به یک بازه زمانی مشخص است؛ بلکه فرآیندی پیوسته و مداوم است که زمان شروع و پایان مشخصی ندارد. علاوه بر این، معمولاً زمان انتشار محتوای آنلاین بهصراحت از سوی ناشر مشخص نمیشود. نتیجه اینکه، زمانی که به آرشیو وب تخصیص داده میشود—مثلاً به شکل تاریخهای روزانه—در واقع توسط خود نهاد بایگانیکننده ایجاد شده و بخشی ذاتی از محتوای اصلی نیست و در نتیجه، تصادفی و قابل ویرایش است.. به همین دلیل، این زمانها قابل تغییرند و نمیتوان آنها را قطعی دانست.
4.7 از «نسخه کپیشده» تا «نسخه متفاوت»
ترکیب شیوههای مختلف بایگانی وب و ابهام در این فرایند به این معناست که نتیجۀ بایگانی وب را نمیتوان کپیای دقیق (۱:۱) در نظر گرفت، همانگونه که شیء دیجیتالشده معمولاً نسخهای تقریباً یکسان از اصل است. بلکه باید نسخۀ بایگانیشدۀ وب را نوعی نسخۀ منحصربهفرد دانست؛ نسخهای از اصل (احتمالاً) از دسترفته، و بسیار محتمل است که این تنها یک نسخه از چندین نسخهی دیگر باشد، که هیچکدام را نمیتوان بهطور قطع بهعنوان نسخهی اصلی شناسایی کرد.
4.8 از تک نسخه تا نسخههای بسیار زیاد یا بسیار کم
در مجموعههای دیجیتالشده معمولاً تنها یک نسخه از هر سند وجود دارد، خواه دستنوشتهای باشد یا روزنامه یا برنامهی رادیویی، زیرا فقط یک نسخۀ اصلی وجود دارد و دلیل منطقی برای ایجاد چندین نسخۀ کاملاً مشابه نیست.
در مقابل، در آرشیوهای وب با موقعیت متفاوتی روبهرو هستیم. گاهی از یک وبسایت فقط چند نسخه بایگانی شده (در نتیجه بخشهایی از آن از دست رفتهاند) و گاهی آنقدر نسخههای متعدد و نزدیک بههم از یک صفحه ذخیره شده که بررسی آنها دشوار میشود. از یکسو، احتمال کمی دارد که هیچ وبسایتی در تمام مدت (مثلاً هر روز) بایگانی شده باشد، که این بدان معناست که پژوهشگر بخشی از مواد آنلاین اولیه را از دست میدهد (علاوه بر این، عناصر وبسایت مانند تصاویر، ویدیوها، تبلیغات و … نیز ممکن است مفقود باشند). از سوی دیگر، ممکن است برخی از وبسایتها (یا بخشهایی از آنها) چندین بار در فواصل زمانی کوتاه بایگانی شده باشند، بهگونهای که چندین نسخه از یک نقطه زمانی (تقریباً) وجود دارد. بنابراین، برای پژوهشگری که میخواهد با مواد آرشیوشدۀ وب کار کند، اغلب تنها یک نسخه از هر سند وجود ندارد. بلکه فرآیندها و راهبردهای بایگانی وب بهگونهای است که در برخی موارد، بخش زیادی از آنچه قبلاً آنلاین بوده از دست رفته، و در برخی دیگر، نسخههای بسیار زیادی وجود دارد که بخشی از آنها مشابه اما دقیقاً یکسان نیستند. یافتن مسیر مشخص در این شبکۀ نسخههای (احتمالاً) همپوشان و پیچیده از نسخههای ناقص یا متفاوت، چالشی جدی است.
4.9 فقدان فهرستبندی مشخص
مجموعههای دیجیتالشده عمدتاً بر پایهی یک مجموعۀ آنالوگ اصلی (منابع فیزیکی) ساخته شدهاند که نهاد بایگانیکننده بر آن نظارتی نظاممند دارد؛ مثلاً فهرست یا کاتالوگی برای آن موجود است.
در بایگانی وب نیز ممکن است تا حدودی این نظم وجود داشته باشد، بهویژه اگر آرشیو وب برای هر وبسایت بایگانیشده فراداده (metadata) تولید کند (مانند آرشیو وب استرالیا “پاندورا” به نشانی pandora.nla.gov.au). اما این وضعیت در همهی بایگانیها وجود ندارد، بهخصوص در بایگانیهایی که از راهبرد موسوم به بایگانی انبوه (bulk archiving) استفاده میکنند. در این روش، حجم وسیعی از وبسایتها یا بر اساس فهرستی از نامهای دامنه (مانند Netarkivet دانمارک) یا از طریق دنبالکردن پیوندها از محتوای قبلاً بایگانیشده (مانند Internet Archive آمریکا) بایگانی میشوند. در این موارد، تعداد زیاد دامنهها باعث میشود فهرستبرداری دستی از وبسایتهای بایگانیشده ناممکن باشد. مثلاً دامنهی کشوری .uk بریتانیا حدود ۱۰ میلیون نام دامنه دارد. در این شرایط، تنها فهرستهای موجود یکی فهرست دامنههای بایگانیشده و دیگری لاگ فنی خزنده (crawl log) است که اطلاعات فنی دربارهی بایگانی ارائه میدهد، گرچه اولی اطلاعات اندکی دارد و دومی باید بهشکلی قابلفهم برای پژوهشگر تبدیل شود و هنوز افزودن دستی اطلاعات امکانپذیر نیست.
به همین دلایل، ممکن است آرشیو وب دقیقاً نداند چه چیزی در آرشیوش هست و نبودِ یک فهرست نظاممند این مشکل را تشدید میکند (حتی تهیهی فهرستی برای تعداد کمی وبسایت نیز به دلیل ماهیت آرشیو وب چالشبرانگیز است [Brügger 2011b]).
4.10 ابرپیوند؛ از ویژگی اختیاری تا جزء جداییناپذیر
ظهور ابرپیوند (hyperlink) در اواسط دههی ۱۹۸۰، راههای جدیدی برای جستوجو و ارتباط میان اسناد در مجموعههای دیجیتالشده گشود. مثل اینکه در نسخه دیجیتال یک روزنامه به مقالهای در روزنامهای دیگر ارجاع داده شود. این پیوندها جنبهی تکمیلی دارند و نبودشان لطمهای به اصل سند نمیزند.
اما در وب، ابرپیوند بخشی جداییناپذیر از ماهیت آن است. بهطور کلی بدون ابرپیوند، چیزی بهنام وب وجود نخواهد داشت. به همین دلیل، درج ابرپیوند در آرشیو وب اختیاری نیست. در نگاه اول ممکن است گنجاندن ابرپیوندها در آرشیو وب مشکلی به نظر نرسد، اما با بررسی دقیقتر روشن میشود که وجود ابرپیوندها میتواند چالشهایی برای استفادهی پژوهشی از آرشیو ایجاد کند؛ چالشهایی که در مجموعههای دیجیتالشده وجود ندارند، زیرا در آنها فقط یک نسخه از هر سند وجود دارد و انتشار آنها قبلاً در نقطهای مشخص از زمان انجام شده است.
ضرورت گنجاندن ابرپیوندها در آرشیو وب یک چالش است، بخشی به این دلیل که فرایند بایگانی زمانبر است (مثلاً بایگانی کل وب دانمارک در دامنهی .dk دو ماه طول میکشد) و بخشی به دلیل اینکه همهی وبسایتها لزوماً تا عمق مشخصی بایگانی نمیشوند (چه بهدلیل تنظیمات بایگانی، چه مشکلات فنی). بنابراین، وجود ابرپیوندها دو نوع ناسازگاری در کل آرشیو وب ایجاد میکند:
۱. ناسازگاری زمانی: ممکن است همزمانی میان صفحهی مبدأ پیوند و صفحهی مقصد وجود نداشته باشد، چون این صفحات ممکن است با فاصلهی چند روز، هفته یا حتی ماه بایگانی شده باشند.
۲. ناهمگونی ساختاری در تحلیل شبکهای: اگر بخواهیم مجموعهای از وبسایتهای بایگانیشده را از نظر شبکهی پیوندها بررسی کنیم، ممکن است شبکۀ پیوندی نامنسجم باشد، زیرا وبسایتها با عمقهای مختلفی بایگانی شدهاند. بعضیها ممکن است تعداد زیادی پیوند داشته باشند و برخی دیگر بسیار کم — مانند این است که روزنامههایی را مقایسه کنیم که برخی فقط صفحه اصلیشان ذخیره شده، برخی تا چندین لایه داخلی یا یکی فقط جلد دارد و دیگری ۱۲ بخش داخلی کامل. این ناهمگونی باعث میشود ساختار شبکهای پیوندها در بایگانی ناقص یا غیرقابل اعتماد باشد.
در مجموع، الزام به گنجاندن ابرپیوندها در آرشیو وب باعث میشود مجموعۀ آرشیوی از نظر زمانی و ساختاری ناهماهنگ باشند، بهویژه وقتی تمرکز پژوهش روی روابط نرمافزاری میان وبسایتها یا دیگر موجودیتهای وب باشد.
5. استفادۀ علمی از آرشیو وب
در مقایسه با مجموعههای دیجیتالیشده که معمولاً همگنتر هستند، آرشیوهای وب در آغاز کار اغلب ناهمگن، آشفته و مبهماند. این ویژگیها در مورد آرشیوهای وب اساسیتر از سایر انواع مجموعهها هستند، زیرا اولاً خود وب که در ابتدا بایگانی شده نیز بهصورت ذاتی ناهمگن، آشفته و مبهم بوده، و ثانیاً خود فرایند آرشیوسازی، نگهداری و فراهم کردن دسترسی به وب در قالب آرشیو، نوعی دیگر از آشفتگی و ناهمگنی به آن میافزاید. بهبیاندیگر، این ناهمگنی بنیادین را نمیتوان با ابزارهای فنی برطرف یا حل کرد، چرا که جزء جداییناپذیر از ذات وب و فرایند بایگانی آن است. افزون بر این، ناهمگنی آرشیو وب خود دارای تاریخی است، چرا که وب و آرشیو آن همواره در حال تحولاند و این باعث انباشت ناهمگونیهای پیشین میشود.
در ادامهی بحثی که پیشتر مطرح شد – اینکه دیجیتال بودن بهخودیخود به معنای ساده و منسجم بودن نیست – اکنون به بررسی این موضوع میپردازیم که تفاوتهای میان یک مجموعۀ دیجیتالیشده و نمونهای از یک مجموعۀ زادۀ دیجیتال (reborn-digital) مانند آرشیو وب، چگونه بر نحوۀ استفاده پژوهشگران از آنها تأثیر میگذارد.
5.1 ساختن موضوع مطالعاتی دیجیتال
اولین گام در ساختن موضوع مطالعاتی دیجیتال، چه در یک مجموعۀ دیجیتالیشده و چه در آرشیو وب، جستوجو در آن مجموعه است. اینجاست که مزایای متن دیجیتال دودویی (به بخش ۲.۱ مراجعه شود) آشکار میشود.
در مجموعههای دیجیتالیشده، جستوجو معمولاً به روشهای گوناگونی انجامپذیر است که به امکانات فنی و تنظیمات مجموعه یا ترجیحات کاربران بستگی دارد. در اغلب موارد میتوان بر اساس نام، تاریخ یا جستوجوی آزاد در متن به نتایج رسید؛ در بسیاری موارد نیز امکان فیلتر کردن نتایج بر اساس معیارهای مختلف فراهم است.
در مورد آرشیو وب، جستوجوی نام یک وبسایت ممکن است امکانپذیر نباشد، چرا که معمولاً وبسایتها نام مشخصی ندارند [Brügger 2011b]، و اغلب تنها راه جستوجو، وارد کردن یک آدرس URL مشخص است؛ یعنی نام دامنهای که در نوار آدرس مرورگر دیده میشود. البته برخی از آرشیوهای وب اخیراً قابلیت جستوجوی آزاد متنی را نیز فراهم کردهاند که کمک بزرگی برای پژوهشگران محسوب میشود. با این حال، همین پیشرفت نیز چالشهایی ایجاد میکند که تفاوت آن را با مجموعههای دیجیتالیشده برجسته میسازد.
حتی ارائۀ نتایج جستوجو – که امری ساده و آشنا به نظر میرسد – در اینجا قدری پیچیدهتر است؛ بخشی به این دلیل که مشخص نیست دقیقاً باید چه چیزی به نمایش گذاشته شود، و بخشی دیگر به دلیل وجود نسخههای متعددی از «یک چیز واحد» که ممکن است در زمان یا محتوا با یکدیگر همپوشانی داشته باشند. برای مثال، جستوجوی واژۀ «علوم انسانی» در یک مجموعۀ دیجیتالیشده از روزنامهها، تمامی صفحاتی را نمایش میدهد که این واژه در آنها آمده است، و کاربر میتواند نتایج را بر اساس نام روزنامه، بازۀ زمانی یا معیارهای دیگر فیلتر کند. اما در هر صورت، از هر صفحه فقط یک نسخه وجود دارد؛ یعنی هر صفحه عمق زمانی ندارد.
حال اگر همین جستوجو در آرشیوی از وب که ۱۰ سال پیش ایجاد شده انجام شود، صفحۀ نتایج، صفحات وبی را نمایش میدهد که واژۀ موردنظر در آنها یافت شده، و احتمالاً امکان فیلتر کردن بر اساس آدرس URL، بازۀ زمانی و غیره نیز وجود دارد. با این حال، در این حالت باید با نسخههای متعدد – و اغلب همپوشان – از یک صفحۀ واحد مواجه شد، چرا که در آرشیو وب، یک «صفحه یافتهشده» لزوماً به معنای «یک نسخه در هر بازۀ زمانی» نیست، بلکه ممکن است به «چندین نسخه» از یک صفحه اشاره کند. بنابراین، هر صفحه میتواند دارای عمق زمانی و فضایی خاص خود باشد، که این عمق ناشی از نسخههایی است که بهطور نسبی با یکدیگر همپوشانی دارند. علاوه بر این، در صورتی که آرشیو فاقد فراداده (metadata) باشد، ارزیابی نسخههای مختلف برای پژوهشگر بسیار دشوار خواهد بود.
بنابراین، این آشفتگی ذاتی آرشیو وب در نتایج جستجو نیز بازتاب پیدا میکند، بهگونهای که نمایش سادۀ نتایج یک جستوجوی آزاد متنی، در آرشیو وب بسیار دشوارتر از مجموعههای دیجیتالیشده است. و و راهحل سادهای هم برای این مشکل وجود ندارد، چرا که ریشۀ مشکل، در خود ماهیت وب بایگانیشده نهفته است.
5.2 شناسایی، ارزیابی و انتخاب نسخهها
گام بعدی پس از جستوجو در مجموعه، معمولاً انتخاب و جداسازی مواد یافتهشده برای بررسیهای بعدی است. این موضوع در آرشیو وب نیز صادق است، اما پیش از آن باید کاری انجام داد که در مجموعههای دیجیتالیشده معمولاً نیازی به آن نیست: تصمیمگیری درباره اینکه کدام یک از نسخههای موجود از «یک مطلب» باید وارد قلمرو مطالعه شود.
همانگونه که پیشتر اشاره شد، دلایل متعددی برای وجود نسخههای متعدد از «یک» محتوای وب در آرشیو وجود دارد؛ اما نکتۀ مهم این است که این نسخهها معمولاً کپیهای یکسان نیستند، بلکه تفاوتهایی دارند که میتواند از جزئی و بیاهمیت تا اساسی و مهم متغیر باشد. از این رو، پژوهشگر باید نسخهها را شناسایی، ارزیابی و انتخاب کند تا بتواند آنها را در مطالعهاش بگنجاند.
برای نمونه، فرض کنیم میخواهیم وبسایت بیبیسی (bbc.com) را بررسی کنیم؛ بهویژه صفحۀ اصلی و دو بخش فرعی News (bbc.com/news) و Sport (bbc.com/sport). ممکن است صفحۀ اصلی در روز هشتبار آرشیو شده باشد، صفحات News و Sport سهبار در روز، و زیرصفحات دیگر در فواصل مختلف (مثلاً روزانه یا یکروز در میان). در نتیجه، از برخی صفحات نسخههای زیادی داریم، از برخی دیگر تعداد کمی، و از برخی هیچ نسخهای وجود ندارد. بنابراین، پژوهشگر باید تصمیم بگیرد کدام نسخهها را برای تشکیل موضوع مطالعه انتخاب و با یکدیگر ترکیب کند. با این حال، باید به این نکته آگاه بود که بهدلیل ناهماهنگیهای زمانی و فضایی عناصر وب آرشیوشده، بازسازی دقیق صفحۀ اصلی وبسایت و دو بخش فرعی آن در یک زمان مشخص ممکن نیست؛ بلکه تنها میتوان بازسازیهایی را براساس نقاط زمانی مختلف انجام داد.
شناسایی، ارزیابی و انتخاب نسخهها کاری دشوار است؛ به همین دلیل باید ابزارهایی طراحی شوند که به پژوهشگر کمک کنند تا انتخابهای آگاهانهتری داشته باشد. این ابزارها باید اطلاعات کافی دربارۀ هر نسخه فراهم کنند (مثلاً زمان شروع و پایان بایگانی شدن)، همچنین ابزارهای دیداریسازی و بصری که نسخههای مختلف را بهصورت قابل درک نمایش دهد، و نیز ابزارهایی را برای انتخاب یا حتی ترکیب نسخههای مناسب که قرار است بهعنوان موضوع مطالعه استفاده شوند، ارائه کنند.
5.3 جدا کردن نسخههای یافتشده
پس از آنکه پژوهشگر نسخههایی را که میخواهد بررسی کند انتخاب کرد، نوبت به مرحلهای میرسد که پیشتر به آن اشاره شد: جدا کردن مواد برای بررسی بعدی. در مجموعههای دیجیتالیشده، این کار معمولاً بسیار ساده است، زیرا هر سند بهروشنی بهعنوان یک (یا چند) فایل قابل شناسایی است و معمولاً به اسناد دیگر مرتبط نیست (و اگر هم مرتبط باشد، این ارتباط معمولاً بهصورت کاملاً مشخص انجام میشود). بهعنوان مثال، روزنامههای دیجیتالیشده معمولاً به صورت فایلهای PDF نگهداری میشوند، در حالیکه برنامههای رادیویی اغلب بهصورت فایلهای AVI ذخیره میشوند. بنابراین، فایلهای مربوطه را میتوان از مجموعه خارج کرد و بیرون از آرشیو تحلیل کرد، یا آنها را نشانهگذاری کرد و در پوشهای قرار داد تا بعداً مطالعه شوند.
اما باز هم، در آرشیو وب شرایط متفاوت است، عمدتاً به دلیل وجود اَبَرپیوندها (hyperlinks) که جزء جداییناپذیر اغلب اسناد وب هستند. این ویژگی باعث میشود جدا کردن فایلها از آرشیو کمی پیچیدهتر شود. برای مثال: در مطالعۀ وبسایت bbc.com ما نسخههایی را برای بررسی انتخاب کردهایم، اما اگر این نسخهها را از آرشیو بیرون بکشیم و مثلاً در رایانه خود ذخیره کنیم، آنها را از محیط ارتباطیای که در آرشیو داشتند جدا کردهایم و ممکن است ناگهان اجزاء وبسایت بهدرستی کار نکنند یا رفتارهای عجیب از خود نشان دهند. ممکن است برخی از لینکها دیگر کار نکنند، زیرا هدف لینک بخشی از پیکرهی انتخابی ما نیست؛ و این موضوع نه فقط در مورد لینکهای قابلمشاهده در صفحه، بلکه در مورد لینکهای نامرئیتری که باعث ظاهر شدن صفحه به شکل خاصی میشوند (مانند لینک به تبلیغات، تصاویر یا ویدیوهای جاسازیشده در سرورهای دیگر) نیز صدق میکند. یا ممکن است برخی لینکها کار کنند، ولی بهشکلی عجیب. برای مثال، اگر نسخه بایگانیشده صفحه اول bbc.com اسکریپتی داشته باشد که اطلاعات آبوهوای امروز را از سرور خدمات هواشناسی دریافت کند، اگر آن سرور هنوز آنلاین باشد، ممکن است آبوهوای امروز نمایش داده شود، یعنی گذشته با اطلاعات امروز وصلهپینه شود [Brügger 2008, 159].
بنابراین، بهترین راه برای جدا کردن مواد بایگانیشدۀ وب جهت مطالعه، انجام این کار درون خود آرشیو است؛ مثلاً با ایجاد فهرستی از موارد انتخابشده و محدود کردن مطالعه به همین فهرست. بااینحال، از لحاظ فنی، این کار ممکن است ساده نباشد. برای مثال، باید به مسئلۀ «حذف تکراریها» (deduplication) توجه داشت؛ یعنی اینکه آرشیو وب بهطور مداوم بررسی میکند که آیا یک فایل (مثلاً فایل PDF) قبلاً در آرشیو وجود دارد یا نه، و اگر داشته باشد، دوباره آن را ذخیره نمیکند تا فضای دیسک ذخیره و حفظ شود. اما اگر پژوهشگری بعداً بخواهد یک پیکره را محدود به بازۀ زمانی خاصی کند، و فایل مورد نظر قبل از شروع آن بازۀ زمانی آرشیوشده باشد، آن فایل نمایش داده نمیشود؛ حتی اگر در آرشیو وجود داشته باشد. برای این مسئله راهحلهای فنی وجود دارد، اما این پدیده نشان میدهد که آرشیو وب بهدلیل وجود اَبَرپیوندها، مجموعهای پیچیدهتر از دیگر انواع آرشیو است.
5.4 تحلیل، گفتوگو، و انتشار
وقتی که موضوع مطالعه محدود و جدا شد، پژوهشگر میتواند فرآیند تحلیل را آغاز کند. در اینجا امکان پرداختن دقیق به ابزارهای تحلیلی متنوعی که میتوان در تحلیل مواد آرشیوشدۀ وب به کار برد وجود ندارد، اما چالش اصلی تمام این ابزارها این است که کارکرد آنها به این بستگی دارد که آرشیو وب چگونه ساخته شده و موضوع مورد مطالعه در آن چگونه ساخته و شکل گرفته است و نتیجۀ این فرایند چه بوده. بهعبارت دیگر، ماهیت بنیادین مجموعههای باززادۀ دیجیتال، مانند آرشیو وب، بستر امکان تحلیل را تعیین میکند.
5.5 راهحلها؟؛ نیاز به زبانشناسی وب
حال که پژوهشگر با چالشهای استفاده علمی از آرشیو وب مواجه است، آیا راهحلهایی برای مقابله با این چالشها وجود دارد؟
از آنجا که طبیعت و ماهیت ناهمگن، آشفته و مبهم آرشیو وب جزء ذاتی فرآیند آرشیوسازی و خود آرشیو است، راهحل آسانی برای غلبه بر این چالشها وجود ندارد. اما این موضوع نباید پژوهشگر علوم انسانی را ناتوان سازد، چرا که یکی از ابزارهای کلیدی در جعبهابزار سنتی علوم انسانی، توانایی و مهارت کار با منابع و درک منشأ آنهاست. این مهارتها فقط باید بازتفسیر و با محیط دیجیتال جدید تطبیق داده شوند. برای نمونه، کاری که پیشتر برای مقایسۀ نسخهها گفته شد، از بسیاری جهات شبیه به زبانشناسی سنتی (philology) است؛ به این معنا که «زبانشناسی وب» آینده نیازی ندارد از صفر آغاز شود، بلکه میتواند با تمرکز و توجه به تفاوتهای میان متون نوشتهشده بر کاغذ یا پوست و متون آرشیوشده در وب، خود را با ماهیت خاص وب بایگانیشده وفق دهد (برای طرح اولیهای از زبانشناسی وب، نک: Brügger 2008, 161–171).
نخستین گام بهسوی زبانشناسی وب این است که ویژگی خاص «دیجیتال بودن» بایگانی وب را به رسمیت بشناسیم، و بپذیریم که دسترسی به کد دیجیتال حتی میتواند به پژوهشگر کمک بزرگی کند، زیرا این لایۀ نامرئی متن (در مقایسه با متن قابلمشاهده)، اطلاعات و فرادادههای مهمی در خود دارد؛ از جمله دربارۀ منشأ. بنابراین، آنچه نیاز داریم، جعبهابزار جدیدی برای زبانشناسی وب است که به پژوهشگر کمک کند تا بیشترین اطلاعات ممکن را دربارۀ موضوع مورد مطالعۀ خود بهدست آورد. چنین رویکردی چالشها را برطرف نمیکند، اما به پژوهشگران کمک میکند تا تصمیمها و انتخابهایی آگاهانهتر داشته باشند.
6. نتیجهگیری
با در نظر گرفتن این واقعیت که یکی از عوامل تحولآفرین اصلی در علوم انسانی در آغاز قرن بیستویکم، گذار از منابع آنالوگ به انواع گوناگون منابع دیجیتال است، در این مقاله استدلال شد که این تغییر، علوم انسانی را از جنبههای مختلفی تحت تأثیر قرار میدهد. در پایان، بار دیگر به پرسشی که در ابتدا مطرح شد بازمیگردیم: علوم انسانی تا چه اندازه دیجیتال خواهد شد؟
از یک سو، علوم انسانی بهطور فزایندهای به سمت «دیجیتالی» شدن حرکت میکند. دلیل این امر همان تغییر اشاره شده از منابع آنالوگ به منابع دیجیتال، و نیز امکان به کارگیری روشهای پشتیبانیشده با فناوری دیجیتال است که این نوع منابع فراهم کردهاند و روزبهروز نیز ضروریتر میسازد. بنابراین، گسترش فناوری دیجیتال به احتمال زیاد علوم انسانی را بیش از پیش بهسمت «علوم انسانی دیجیتال» سوق خواهد داد.
اما از سوی دیگر، علوم انسانی دیجیتال، اساساً همان علوم انسانی باقی میماند. پرسشها، نظریهها، روشها و اهداف بنیادین علوم انسانی، با وجود گسترش فزایندۀ دیجیتال و چالشهایی که همراه دارد، تا حد زیادی بدون تغییر باقی میمانند. علوم انسانی دیجیتال بهخودیخود یک پارادایم کاملاً جدید محسوب نمیشود، بلکه مجموعهای از امکانات جدید را پدید میآورد؛ چه برای انجام همان کارهای پیشین به شیوهای نو، و چه برای بازاندیشی در شیوههای شناختهشدۀ علوم انسانی. برای مثال، میتوان به بهره بردن از روشهای پشتیبانیشده توسط نرمافزارها، و نیز زیرساختهای پژوهشی دیجیتال اشاره کرد.
آنچه نیاز داریم، نوعی علوم انسانی دیجیتال متعادل است؛ علمی که از یکسو تغییرات بنیادی در بنیان فعالیتهای علمی علوم انسانی را به رسمیت بشناسد، و از سوی دیگر، اذعان کند که این تغییرات لزوماً ماهیت علوم انسانی را بهطور بنیادی دگرگون نمیکنند. لازم نیست تمام شاخههای علوم انسانی به علوم انسانی دیجیتال تبدیل شوند، اما بعید است که هیچیک از آنها بدون تغییر باقی بمانند؛ چرا که یا با دیجیتالی بودن خودِ موضوع مطالعه مواجهاند، یا با روشها و ابزارهای پژوهشی دیجیتالی پشتیبانیشده که در علوم انسانی به کار گرفته میشود، و یا با هر دو.
بنابراین، در قرن بیستویکم، تفاوت میان علوم انسانی و علوم انسانی دیجیتال، بیشتر کمّی است تا کیفی: همۀ شاخههای علوم انسانی تا حدی دیجیتال خواهند شد، اما نه به یک اندازه. از اینرو، پرسش اصلی دیگر آن نیست که دیجیتال هستند یا نه، بلکه این است که «چقدر» دیجیتال هستند.
و صرفنظر از اینکه این تعادل را در چه نقطهای میان دیجیتالی بودن «بیشتر» یا «کمتر» بخواهیم برقرار کنیم، باید پذیرفت که ورود فناوری دیجیتال به علوم انسانی، یک نقطه عطف است که تاکنون نیز بحثهایی اساسی و ارزشمند را درباره اینکه علوم انسانی (دیجیتال) چه میتواند باشد، به جریان انداخته است.
منابع
مأخد: اتحادیه سازمانهای علوم انسانی دیجیتال : DHQ: Digital Humanities Quarterly: Digital Humanities in the 21st Century: Digital Material as a Driving Force
American Council of Learned Societies 2006 American Council of Learned Societies. Our Cultural Commonwealth: The report of the American Council of Learned Societies Commission on Cyberinfrastructure for the Humanities and Social Sciences. New York: American Council of Learned Societies, 2006.
Arts and Humanities in Higher Education 2011Arts and Humanities in Higher Education 11, no. 1-2 (2011), special double issue: Digital humanities, digital futures.
Barnett 2014 Ronald Barnett. “Imagining the Humanities – Amid the inhuman.” Arts & Humanities in Higher Education 13, no. 1-2 (2014): 42-53.
Bassnett 2002 Susan Bassnett. “Is There Hope for the Humanities in the 21st Century?” Arts & Humanities in Higher Education 1, no. 1 (2002): 101-110.
Belfiore 2014 Eleonora Belfiore. “‘Impact,’ ‘value’ and ‘bad economics’: Making sense of the problem of value in the arts and humanities.” Arts & Humanities in Higher Education OnlineFirst, April (2014).
Beňuš 2010 Stefan Beňuš. “Building interfaces between the humanities and cognitive sciences: The case of human speech.” Arts & Humanities in Higher Education 9, no. 3 (2010): 353-374.
Berry 2012 David M. Berry. “Introduction: Understanding the Digital Humanities.” In Understanding Digital Humanities. Edited by David M. Berry. New York: Palgrave Macmillan, 2012, pp. 1–20.
Bolton 2008 Gillie Bolton. “Boundaries of Humanities: Writing Medical Humanities.” Arts & Humanities in Higher Education 7, no. 2 (2008): 131-148.
Borgman 2009 Christine L. Borgman. “The Digital Future is Now: A Call to Action for the Humanities.” Digital Humanities Quarterly, 3, no. 4 (2009). http://www.digitalhumanities.org/dhq/vol/3/4/000077/000077.html
Brügger 2005 Niels Brügger. Archiving Websites: General Considerations and Strategies. Aarhus: The Centre for Internet Studies, 2005.
Brügger 2008 Niels Brügger. “The Archived Website and Website Philology: A New Type of Historical Document?” Nordicom Review 29, no. 2 (2008): 155-175.
Brügger 2009 51. Niels Brügger. “Website history and the website as an object of study.” New Media & Society 11, no. 1-2 (2009): 115-132.
Brügger 2010 Niels Brügger. “Introduction: Web history, an emerginrg field of study.” In Web history. Edited by Niels Brügger. New York: Peter Lang, 2010, pp. 1-25.
Brügger 2011a Niels Brügger. “Web archiving — Between past, present, and future.” In The handbook of Internet studies. Edited by Mia Consalvo, and Charles Ess. Oxford: Wiley-Blackwell, 2011, pp. 24-42.
Brügger 2011b Niels Brügger. “Digital history and a register of websites: An old practice with new implications.” In The long history of new media: Technology, historiography, and contextualizing newness. Edited by David W. Park, Nick W. Jankowski, and Steve Jones. New York: Peter Lang, 2011, pp. 283-298.
Brügger 2012a Niels Brügger. “Web History and the Web as a Historical Source.” Zeithistorische Forschungen, 9, no. 2 (2012): 316-325.
Brügger 2012b Niels Brügger. “When the Present Web is Later the Past: Web Historiography, Digital History, and Internet Studies.” Historical Social Research, 37, no. 4 (2012): 102-117.
Brügger 2013 Niels Brügger. “Historical network analysis of the Web.” Social Science Computer Review, 31, no. 3 (2013): 306-321.
Brügger and Finnemann 2013 Niels Brügger and Niels Ole Finnemann. “The Web and Digital Humanities: Theoretical and Methodological Concerns.” Journal of Broadcasting and Electronic Media, 57, no. 1 (2013): 66-80.
Burdick et al 2012 Anne Burdick, Johanna Drucker, Peter Lunenfeld, Todd Presner, and Jeffrey Schnapp. Digital_Humanities. Cambridge, MA: MIT Press, 2012. http://lab.softwarestudies.com/2012/11/digitalhumanities-book-is-out.html
Cohen and Rosenzweig 2005 Daniel J. Cohen, and Roy Rosenzweig. Digital History: A Guide to Gathering, Preserving, and Presenting the Past on the Web. Philadelphia, Penn.: University of Pennsylvania Press, 2005.
Collins 2011 Ellen Collins, Monica E. Bulger, and Eric T. Meyer. “Discipline matters: Technology use in the humanities.” Arts & Humanities in Higher Education 11, no. 1-2 (2011): 76-92.
DHQ e-Science 2009Digital Humanities Quarterly, 3, no. 4 (2009), Special Cluster: e-Science for the Arts and Humanities. http://digitalhumanities.org:8081/dhq/vol/3/4/000079/000079.html
Deegan 2014 Marilyn Deegan. “‘This ever more amorphous thing called Digital Humanities’: Whither the Humanities Project?” Arts & Humanities in Higher Education 13, no. 1-2 (2014): 24-41.
Digital Humanities ManifestoA Digital Humanities Manifesto. 2008, http://manifesto.humanities.ucla.edu/2008/12/15/digital-humanities-manifesto/
Dougherty 2010 Meghan Dougherty, Eric T. Meyer, Christine Madsen, Charles van den Heuvel, Arthur Thomas, and Sally Wyatt. Researcher Engagement with Web Archives: State of the Art. London: JISC, 2010.
European Commission 2011 European Commission. The New Renaissance: Report of the “Comité des Sages” on bringing Europe’s cultural heritage online. Luxembourg: Publications Office of the European Union, 2011.
Evens 2012 Aden Evens. “Web 2.0 and the Ontology of the Digital.” Digital Humanities Quarterly, 6, no. 2 (2012). http://www.digitalhumanities.org/dhq/vol/6/2/000120/000120.html
Finnemann 1999 Niels Ole Finnemann. “Modernity Modernised: The Cultural Impact of Computerisation.” In Computer, Media and Communication. Edited by Paul A. Mayer. Oxford: Oxford University Press, 1999, pp. 141–159.
Finnemann 2014 Niels Ole Finnemann. “Digital humanities and networked digital media.” MedieKultur. Journal of media and communication research 57 (2014): 94-114.
Foot and Scheider 2006 Kirsten A. Foot, and Steven M. Schneider. Web campaigning. Cambridge, Mass.: MIT Press, 2006.
Gold 2012 Matthew K. Gold. Debates in the Digital Humanities, ed. Minneapolis/London: University of Minnesota Press, 2012.
Gronbeck 2005 Bruce E. Gronbeck. “Is Communication a Humanities Discipline? Struggles for academic identity.” Arts & Humanities in Higher Education 4, no. 3 (2005): 229-246.
Harpham 2005 Geoffrey Galt Harpham. “Beneath and Beyond the ‘Crisis in the Humanities’”. New Literary History 36, no. 1 (2005): 21–36.
Historical Social Research 2012Historical Social Research/Historische Sozialforschung 37, no. 3 (2012), special theme: Controversies around the Digital Humanities.
Hockey 2000 Susan Hockey. Electronic texts in the Humanities. Oxford: Oxford University Press, 2000.
Holm 2015 Poul Holm, Arne Jarrick, and Dominic Scott. Humanities World Report 2015. New York: Palgrave Macmillan, 2014.
Howarth 2004 David Howarth. “Is Law a Humanity (or is it more like Engineering)?” Arts & Humanities in Higher Education 3, no. 1 (2004): 9-28.
Jones 2014 Steve E. Jones. The emergence of the digital humanities. New York & London: Routledge, 2014.
Kirschenbaum 2013 Matthew Kirschenbaum. “The .txtual Condition: Digital Humanities, Born-Digital Archives, and the Future Literary.” Digital Humanities Quarterly, 7, no. 1 (2013). http://www.digitalhumanities.org/dhq/vol/7/1/000151/000151.html
Laue 2004 Andrea Laue. “How the computer works.” In A Companion to Digital Humanities. Edited by Susan Schreibman, Ray Siemens, and John Unsworth. Oxford: Blackwell, 2004, pp. 145–160.
Liu 2011 Alan Liu. “The state of the digital humanities: A report and a critique.” Arts & Humanities in Higher Education 11, no. 1-2 (2011): 8-41.
Masanès 2006 Julien Masanès. Web Archiving, ed. Berlin: Springer, 2006.
Mayer-Schönberger 2013 Viktor Mayer-Schönberger and Kenneth Cukier. Big Data: A revolution that will transform how we live, work, and think. Houghton Mifflin Harcourt Publishing Company, New York, 2013.
McCarty 2005 Willard McCarty. Humanities computing. New York: Palgrave Macmillan, 2005.
MedieKultur 2014 MedieKultur. Journal of media and communication research 57 (2014), special issue: Digital Humanities: Now and Beyond
Nussbaum 2010 Martha C. Nussbaum. Not For Profit: Why Democracy Needs the Humanities. Princeton: Princeton University Press, 2010.
Olmos-Peñuela 2014 Julia Olmos-Peñuela, Paul Benneworth, and Elena Castro-Martínez. “Are sciences essential and humanities elective? Disentangling competing claims for humanities’ research public value.” Arts & Humanities in Higher Education OnlineFirst, May (2014).
Parker 2007 Jan Parker. “Future Priorities of the Humanities in Europe: What Have the Humanities to Offer? Report of a round table conference held to draft a manifesto for the European Commissioner and working papers for the EC Working Party on Future Priorities for Humanities Research.” Arts & Humanities in Higher Education 6, no. 1 (2007): 123-127.
Pascoe 2002 Robert Pascoe. “An Australian Perspective on the Humanities.” Arts & Humanities in Higher Education 2, no. 1 (2002): 7-22.
Schneider and Foot 2004 Steven M. Schneider, and Kirsten A. Foot. “The Web as an Object of Study.” New Media Society 6, no. 1 (2004): 114–122.
Screibman Susan Schreibman, Ray Siemens, and John Unsworth. A Companion to Digital Humanities, eds. Oxford: Blackwell, 2004.
Svensson 2010 Patrik Svensson. “The Landscape of Digital Humanities.” Digital Humanities Quarterly, 4, no. 1 (2010). http://digitalhumanities.org/dhq/vol/4/1/000080/000080.html
Svensson 2011 Patrik Svensson. “The digital humanities as a humanities project.” Arts & Humanities in Higher Education 11, no. 1-2 (2011): 42-60.
Svensson 2012a Patrik Svensson. “Envisioning the Digital Humanities.” Digital Humanities Quarterly, 6, no. 1 (2012). http://www.digitalhumanities.org/dhq/vol/6/1/000112/000112.html
Svensson 2012b Patrik Svensson. “Beyond the Big Tent.” In Debates in the Digital Humanities. Edited by Matthew K. Gold. Minneapolis/London: University of Minnesota Press, 2012, pp. 36–49.
Terras 2012 Melissa Terras. “Digitization and digital resources in the humanities.” In Digital Humanities in practice. Edited by Claire Warwick, Melissa Terras, and Julianne Nyhan. London: UCL/Facet Publishing, 2012, pp. 47–70.
Thaller 2012 Manfred Thaller. “Controversies around the Digital Humanities: An agenda.” Historical Social Research 37, no. 3 (2012): 7-23.
Thomas 2010 Arthur Thomas, Eric T. Meyer, Meghan Dougherty, Charles van den Heuvel, Christine Madsen, and Sally Wyatt. Researcher Engagement with Web Archives: Challenges and Opportunities for Investment. London: JISC, 2010.
Warwick 2012 Claire Warwick, Melissa Terras, and Julianne Nyhan. Digital Humanities in practice, eds. London: UCL/Facet Publishing, 2012.