اینترنت آرشیو به یک تریلیون صفحه وب رسید؛ ناجی تاریخ دیجیتال در برابر نابودی؟

مروری کوتاه بر خبر

  • ناپایداری ذاتی اینترنت با نمونههایی مانند حذف ۵۰ میلیون قطعه موسیقی در MySpace در ۲۰۱۹ نشان داده شده.
  • محدودیت دسترسی رسانههای بزرگی مانند گاردین و نیویورکتایمز، آینده آرشیو را با چالش مواجه کرده.

اینترنت آرشیو، بزرگ‌ترین کتابخانه دیجیتال جهان، اعلام کرده که به رکورد ذخیره یک تریلیون صفحه وب دست یافته است. این نقطه عطف در شرایطی اهمیت دارد که محتواهای دیجیتال به سرعت ناپدید می‌شوند و بخش‌هایی از تاریخ آنلاین از بین می‌روند. هدف این پروژه که از سال ۱۹۹۶ فعالیت خود را آغاز کرده، ایجاد یک «ثبت دائمی تحول اینترنت» است.

مأموریت و گستره فعالیت

اینترنت آرشیو مأموریت خود را با استفاده از خزنده‌های وب، مشارکت داوطلبان و آرشیو انواع محتوا از متون چاپی تا موسیقی و فایل‌های صوتی پیش می‌برد. ماهیت ناپایدار اینترنت و وابستگی محتواها به نگهداری، خطر نابودی را همواره به همراه دارد. نمونه بارز این ناپایداری، حذف بیش از ۵۰ میلیون قطعه موسیقی و آثار ۱۴ میلیون هنرمند در پی یک خطای فنی در MySpace در سال ۲۰۱۹ بود.

آمار و حجم عظیم داده

تاکنون بیش از ۸۶۶ میلیارد صفحه وب، ۴۱ میلیون متن و میلیون‌ها فایل چندرسانه‌ای در این پایگاه ذخیره شده‌اند. هر روز حدود ۵۰۰ میلیون وب‌سایت جدید به این مجموعه افزوده می‌شود. حجم کل داده‌های آرشیو شده به حدود ۱۰۰ هزار ترابایت رسیده که معادل حافظه ۵۰ هزار آیفون رده‌بالای امروزی است.

چالش‌های پیش‌رو و محدودیت‌های جدید

آینده این پروژه حیاتی با چالش‌هایی مواجه است. رقابت شرکت‌های فناوری برای آموزش مدل‌های هوش مصنوعی، باعث شده رسانه‌های بزرگی مانند گاردین، نیویورک‌تایمز و ی‌اس‌ای تودی، دسترسی اینترنت آرشیو به محتوای جدید خود را محدود کنند. این تصمیم‌ها که با دغدغه‌های حقوقی و اقتصادی همراه است، خطر ایجاد شکاف در حافظه دیجیتال جمعی بشر را افزایش می‌دهد.

منبع: Hamshahrionline

تکنولوژی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا
ads