اینترنت آرشیو به یک تریلیون صفحه وب رسید؛ ناجی تاریخ دیجیتال در برابر نابودی؟

- ناپایداری ذاتی اینترنت با نمونههایی مانند حذف ۵۰ میلیون قطعه موسیقی در MySpace در ۲۰۱۹ نشان داده شده.
- محدودیت دسترسی رسانههای بزرگی مانند گاردین و نیویورکتایمز، آینده آرشیو را با چالش مواجه کرده.
اینترنت آرشیو، بزرگترین کتابخانه دیجیتال جهان، اعلام کرده که به رکورد ذخیره یک تریلیون صفحه وب دست یافته است. این نقطه عطف در شرایطی اهمیت دارد که محتواهای دیجیتال به سرعت ناپدید میشوند و بخشهایی از تاریخ آنلاین از بین میروند. هدف این پروژه که از سال ۱۹۹۶ فعالیت خود را آغاز کرده، ایجاد یک «ثبت دائمی تحول اینترنت» است.
مأموریت و گستره فعالیت
اینترنت آرشیو مأموریت خود را با استفاده از خزندههای وب، مشارکت داوطلبان و آرشیو انواع محتوا از متون چاپی تا موسیقی و فایلهای صوتی پیش میبرد. ماهیت ناپایدار اینترنت و وابستگی محتواها به نگهداری، خطر نابودی را همواره به همراه دارد. نمونه بارز این ناپایداری، حذف بیش از ۵۰ میلیون قطعه موسیقی و آثار ۱۴ میلیون هنرمند در پی یک خطای فنی در MySpace در سال ۲۰۱۹ بود.
آمار و حجم عظیم داده
تاکنون بیش از ۸۶۶ میلیارد صفحه وب، ۴۱ میلیون متن و میلیونها فایل چندرسانهای در این پایگاه ذخیره شدهاند. هر روز حدود ۵۰۰ میلیون وبسایت جدید به این مجموعه افزوده میشود. حجم کل دادههای آرشیو شده به حدود ۱۰۰ هزار ترابایت رسیده که معادل حافظه ۵۰ هزار آیفون ردهبالای امروزی است.
چالشهای پیشرو و محدودیتهای جدید
آینده این پروژه حیاتی با چالشهایی مواجه است. رقابت شرکتهای فناوری برای آموزش مدلهای هوش مصنوعی، باعث شده رسانههای بزرگی مانند گاردین، نیویورکتایمز و یاسای تودی، دسترسی اینترنت آرشیو به محتوای جدید خود را محدود کنند. این تصمیمها که با دغدغههای حقوقی و اقتصادی همراه است، خطر ایجاد شکاف در حافظه دیجیتال جمعی بشر را افزایش میدهد.
منبع: Hamshahrionline
تکنولوژی