11.5 میلیون سند افشاشده در رسوایی و افشاگری «اسناد پاناما»، چگونه میتواند تحلیل و بررسی شود؟
تا حالا به احتمال زیاد خبر داغ این دو روزه را خوانده یا شنیدهاید:
بزرگترین افشاگری و رخنه اطلاعات محرمانه در طول تاریخ رخ داده است که منجر به برملا شدن ارتباط 70 رهبر کنونی و سابق جهان در روندهای گریز از پرداخت مالیات و پولشویی شده است. در جریان این عملیات، در طی سالها میلیاردها دلار پول وارد حسابهای «فراساحلی» off-shore شده و از گزند بازرسی و شمول قوانین روتین مالی، در امان مانده است.
در طی درز اطلاعات «اسناد پاناما»، فعالیتهای شرکتی موسوم به موساک فونسکا افشا شد. این شرکت به صدها موکل خود که با قدرتمندترین آدمهای دنیا ارتباط داشتند، کمک کرد که پولشویی کنند، از مالیات بگریزند یا تحریمها را دور بزننند.
اسناد توسط شخص ناشناسی در اختیار روزنامهنگاران قرار گرفته است، در حال حاضر 100 سازمان خبری و 400 روزنامهنگار به این اسناد دسترسی دارند و جالب است بدانید که تا به حال یک سال از زمان درز اطلاعات و شروع عملیات تحلیل و بررسی آن گذشته است.
اما حجم اسناد واقعا بزرگ است. در واقع ما با 11.5 میلیون فایل، شامل 4.8 میلیون ایمیل، دو میلیون سند PDF و 320 هزار فایل متنی سر و کار داریم. به این ترتیب این اسناد درز پیدا کرده، حتی از اسناد افشاشده توسط ویکیلیکس یا ادوارد اسنودن هم بیشتر هستند.
اما هیچ فکر کردهاید که این اطلاعات که بالغ 2.6 ترابایت هستند، چطور باید بررسی و تحلیل شوند؟
اطلاعات نخست در اختیار نشریه آلمانی زود دویچه زایتونگ Süddeutsche Zeitung قرار گرفت. این نشریه به نوبه خود اطلاعات را به کنسرسیوم بینالمللی روزنامهنگاری تحقیقی ارائه کرد تا به صورت گروهی مورد بررسی قرار گیرد.
این اسناد بازه زمانی بین سالهای 1977 تا 2015 را در بر میگیرند. این اطلاعات نشان میدهند که شرکت موساک فونسکا، برای کارهای خود با 14 هزار بانک، شرکت حقوقی، شرکت، واسطه، بنیاد و اتحادیه اقتصادی، ارتباط داشته است.
برای بررسی و تحلیل اطلاعات، مرحله اول این بود که به کمک نرمافزارهای OCR، اسکن اسناد به فایلهای متنی تبدیل شود تا قابل جستجو شوند. برای این منظور، نشریه زود دویچه زایتونگ و کنسرسیوم بینالمللی روزنامهنگاری تحقیقی از خدمات شرکتی به نام Nuix بهره برد.
به این ترتیب حجم عظیم اطلاعات سامان یافتند، نمایهسازی شدند و متادیتای همه آنها استخراج شد. دیتابس نهایی، از لحاظ حجمی 30 درصد فایلهای خام اولیه بود.
کار دیگر این بود که اطلاعات در سرورهای امن خصوصی، آپلود شوند، طوری که تنها برای روزنامهنگاران قابل دسترسی باشند و افرادی در خارج مجموعه به آنها دسترسی پیدا نکنند.
بعد از انجام این کارها میشد به سادگی نام شخصیتهای مشهور را به نرمافزارهای و الگوریتمهای جستجوگر داد، تا وجود آنها را در اسناد بررسی کنند. در ضمن اگر روزنامهنگاران به تصادف به نامی در حین بررسی اسناد، برمیخوردند، به سرعت میتوانستند بررسی کنند که همین نام و شخصیت در چه اسناد دیگری، نامش تکرار شده است. مثلا در گام اول نام 130 چهره مشهور دنیا و نیز 600 نفری که در فهرست تحریمهای سازمان ملل بودند به نرمافزارها داده شدند تا تنها در عرض چند دقیقه وجود همین نامهای در 11.5 میلیون سند بررسی شود.
بررسی و تحقیق روی این اسناد ادامه دارد و انچه تا امروز برملا شده، تنها قسمتی از کل پژوهشهای انجام شده است. برآورد میشود که در ماه آینده میلادی یعنی ماه می، فهرست کاملی از شرکتهای درگیر، ارائه شود.
لایک
لطفا از طرز لو رفتن چنین اسنادی هم مطلب بذارید خیلی جالب بود
ممنون
وب سایت شما دیگه شکل همیشگی خودش رو نداره. آشفته و درهم شده.
امیدوارم یک پزشک برگرده
با آرزوی سلامتی در سال نو
مثل همیشه، با یک دید جالب موضوعات روز رو بررسی کردید؛ بسیار ممنونم