۱۱.۵ میلیون سند افشاشده در رسوایی و افشاگری «اسناد پاناما»، چگونه می‌تواند تحلیل و بررسی شود؟

4

تا حالا به احتمال زیاد خبر داغ این دو روزه را خوانده یا شنیده‌اید:

بزرگ‌ترین افشاگری و رخنه اطلاعات محرمانه در طول تاریخ رخ داده است که منجر به برملا شدن ارتباط ۷۰ رهبر کنونی و سابق جهان در روندهای گریز از پرداخت مالیات و پول‌شویی شده است. در جریان این عملیات، در طی سال‌ها میلیاردها دلار پول وارد حساب‌های «فراساحلی» off-shore شده و  از گزند بازرسی و شمول قوانین روتین مالی، در امان مانده است.

در طی درز اطلاعات «اسناد پاناما»، فعالیت‌های شرکتی موسوم به موساک فونسکا افشا شد. این شرکت به صدها موکل خود که با قدرتمندترین آدم‌های دنیا ارتباط داشتند، کمک کرد که پول‌شویی کنند، از مالیات بگریزند یا تحریم‌ها را دور بزننند.

اسناد توسط شخص ناشناسی در اختیار روزنامه‌نگاران قرار گرفته است، در حال حاضر ۱۰۰ سازمان خبری و ۴۰۰ روزنامه‌نگار به این اسناد دسترسی دارند و جالب است بدانید که تا به حال یک سال از زمان درز اطلاعات و شروع عملیات تحلیل و بررسی آن گذشته است.

اما حجم اسناد واقعا بزرگ است. در واقع ما با ۱۱.۵ میلیون فایل، شامل ۴.۸ میلیون ایمیل، دو میلیون سند PDF و ۳۲۰ هزار فایل متنی سر و کار داریم. به این ترتیب این اسناد درز پیدا کرده، حتی از اسناد افشاشده توسط ویکی‌لیکس یا ادوارد اسنودن هم بیشتر هستند.

2016-04-05_19-13-16

اما هیچ فکر کرده‌اید که این اطلاعات که بالغ ۲.۶ ترابایت هستند، چطور باید بررسی و تحلیل شوند؟

اطلاعات نخست در اختیار نشریه آلمانی زود دویچه زایتونگ Süddeutsche Zeitung قرار گرفت. این نشریه به نوبه خود اطلاعات را به کنسرسیوم بین‌المللی روزنامه‌نگاری تحقیقی ارائه کرد تا به صورت گروهی مورد بررسی قرار گیرد.

این اسناد بازه زمانی بین سال‌های ۱۹۷۷ تا ۲۰۱۵ را در بر می‌گیرند. این اطلاعات نشان می‌دهند که شرکت موساک فونسکا، برای کارهای خود با ۱۴ هزار بانک، شرکت حقوقی، شرکت،  واسطه، بنیاد و اتحادیه اقتصادی، ارتباط داشته است.

برای بررسی و تحلیل اطلاعات، مرحله اول این بود که به کمک نرم‌افزارهای OCR، اسکن اسناد به فایل‌های متنی تبدیل شود تا قابل جستجو شوند. برای این منظور، نشریه زود دویچه زایتونگ و کنسرسیوم بین‌المللی روزنامه‌نگاری تحقیقی از خدمات شرکتی به نام Nuix بهره برد.

به این ترتیب حجم عظیم اطلاعات سامان یافتند، نمایه‌سازی شدند و متادیتای همه آنها استخراج شد. دیتابس نهایی، از لحاظ حجمی ۳۰ درصد فایل‌های خام اولیه بود.

کار دیگر این بود که اطلاعات در سرورهای امن خصوصی، آپلود شوند، طوری که تنها برای روزنامه‌نگاران قابل دسترسی باشند و افرادی در خارج مجموعه به آنها دسترسی پیدا نکنند.

بعد از انجام این کارها می‌شد به سادگی نام شخصیت‌های مشهور را به نرم‌افزارهای و الگوریتم‌های جستجوگر داد، تا وجود آنها را در اسناد بررسی کنند. در ضمن اگر روزنامه‌نگاران به تصادف به نامی در حین بررسی اسناد، برمی‌خوردند، به سرعت می‌توانستند بررسی کنند که همین نام و شخصیت در چه اسناد دیگری، نامش تکرار شده است. مثلا در گام اول نام ۱۳۰ چهره مشهور دنیا و نیز ۶۰۰ نفری که در فهرست تحریم‌های سازمان ملل بودند به نرم‌افزارها داده شدند تا تنها در عرض چند دقیقه وجود همین نام‌های در ۱۱.۵ میلیون سند بررسی شود.

بررسی و تحقیق روی این اسناد ادامه دارد و انچه تا امروز برملا شده، تنها قسمتی از کل پژوهش‌های انجام شده است. برآورد می‌شود که در ماه آینده میلادی یعنی ماه می، فهرست کاملی از شرکت‌های درگیر، ارائه شود.

منبع


   
4 نظرات
  1. ehsan می گوید

    لایک

  2. رامین می گوید

    لطفا از طرز لو رفتن چنین اسنادی هم مطلب بذارید خیلی جالب بود
    ممنون

  3. داشاکل می گوید

    وب سایت شما دیگه شکل همیشگی خودش رو نداره. آشفته و درهم شده.
    امیدوارم یک پزشک برگرده
    با آرزوی سلامتی در سال نو

  4. حسین می گوید

    مثل همیشه، با یک دید جالب موضوعات روز رو بررسی کردید؛ بسیار ممنونم

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.