گوگل همه کتابهای جهان را شمرد! همه 129,864,880شان را!

به تازگی یک هنرمند اهل اسلواکی، دست به کار جالبی زده است، وی در سردر موزه هنرهای مدرن بولونا، یک تونل احداث کرده است که دیوارههای آن از هزاران کتاب درست شده است. انبوهی کتابها و انعکاس جلدهای آنها هر کسی را شگفتزده میکند و ممکن است پارهای را هم تشویق به خواندن کتاب کند.
این عکسها را که دیدم، به این فکر افتادم که واقعا انسانها چند کتاب نوشتهاند! دقایقی بعد در کمال تعجب در جای دیگری به پاسخ سؤال خودم رسیدم:
سرویس کتابهای گوگل یا Google Books پروژه جاهطلبانهای است ک قصد دارد همه کتابهای جهان را دیجیتالی کند. وبلاگ رسمی این سرویس گوگل، دیروز در پستی مطلب جالبی را مطرح کرد: آیا واقعا میشود برآوردی از کل کتابهای منتشر شده توسط نوع بشر داشت؟!
نخستین دشواری در راه رسیدن به پاسخ این سؤال این است که ما واقعا چه نوع انتشاراتی را کتاب محسوب کنیم. بنابراین باید تعریف درستی از وازه کتاب داشت. دشواری بعدی این است که آیا باید نسخههای مختلف از یک کتاب، مثلا باید چاپهای مختلف کتاب «هملت» را به صورت جداگانه شمرد یا نه. یا مثلا باید تفاوتی بین چاپ جلدسخت یک کتاب با چاپ معمولی آن ثائل شد یا نه.
کتابها شمارگان متفاوتی دارند، مثلا کتاب فرشتگان و شیاطین دن براون، میلونها جلد چاپ شده شده، در حالی که بعضی از پایاننامههای فقط دو سه جلد دارند. آیا باید کتابهای با شمارگان بسیار محدود را هم در آمار منظور کرد؟
ISBN یا سیستم بینالمللی استاندارد شمارهبندی کتابها، از نیمه دهه 1960 تعریف شد و تا سالهای اولیه دهه هفتاد به صورت گسترده مورد پذیرش قرار نگرفت. به علاوه این سیستم عمدتا منحصر به کتابهای منتشر شده در دنیای غرب باقی ماند. بنابراین بسیاری از کتابهایی که پیش از این تاریخ منتشر شده بودند یا توزیع تجاری نداشتند و یا اصلا در مناطق دیگر دنیا چاپ شده بودند، به وسیله این سیستم نمایه نشدند. مشکل دیگر ISBN وجود نقایصی در ان است. مثلا گوگلیهای متوجه شدند که پارهای از اوقات چندین کتاب یا یک شماره ثبت شدهاند یا این سیستم انتشارتی به غیر از کتاب مثل CD را هم نمایه کرده بود. بنابراین گوگل تکیه بر این سیستم را صلاح ندانست. گوگلیها متوجه شدند که سیستمها فهرستبندی کتابخانههای بزرگ دنیا مثل کتابخانه کنگره آمریکا هم نمیتواند به آنها در شمارش کل کتابهای دنیا کمک کند.
بنابراین گوگل تصمیم گرفت که خودش آستین را بالا بزند و با جمع کردن فراداده یا متادیتاهای کتاب از کتابخانههای مختلف، کاتالوگهای کتاب و توزیعکنندگان تجاری کتاب، اقدام کند. محاسبه اول، یک میلیارد جلد کتاب بود، اما با آنالیزهای چندباره و حذف کتابهای که بیش از یک بار منظور شده بودند و استفاده از یک الگوریتم، نهایتا گوگل به عدد 210 میلیون جلد رسید. با حذف کردن شمارش میکروفیلمها، استاد صوتی، ویدئوها، نقشهها و همچنین اشتباهات شمارهبندی سریال کتابها، نهایتا گوگل به عدد 129,864,880 رسید.
سلام
به نظر نمی آید این عدد ۱۲۹,۸۶۴,۸۸۰ درست باشد. خیلی بیشتر از این باید باشد.
البته شاید هم درست باشد، ما ندانیم!
بسیار عالی بود اما یک سوال این کتابها همه به زبان انگلیسی بودند یا فارسی هم توشون هست؟
وااااااااااااااای… چقدر نخونده و ندونسته هامون زیاده
سلام
دکتر یه متنی بفرست در مورد ساخت اکونت جدید در گوگل اخه خیلی گیر میده تازگی ها شماره تلفنت و میخواد تازه وقتی بهش میدی میگه این سیستم توی ایران فعال نیست یه راهنمایی بکن
ممنون
وایییییییییییییییییییییییییییییی خیلی باحال بود مرسی
جالب بود
من گمون کنم چیزی حدود 1000 جلد کتاب رو خونده باشم ( منم خیلی از کتاب ها رو از فهرست خونده هام حذف کردم ! ) در نهایت چیزی نمونده همه کتابها رو تموم کنم فقط صد وبیست و نه میلیون و هشتصد و شصت و سه هزار و هشتصد و هشتاد تای دیگه مونده که اگر از نظر زبان نوشته ها مشکلی نداشته باشم و بتونم بطور متوسط روزی یک کتاب رو کامل بخونم فقط حدود 356000 سال دیگه زمان لازم دارم !
جالب بود . من فکر میکردیم خیلی بیشتر از این تعداد کتاب داشته باشیم. یعنی کل میراث مکتوب بشری همین یه ذره است؟
interesting,thx
کار خیلی جالبیه. تشویق خوبی میشه واسه کتابخونی.
مخصوصاً این ایده کتابخوانی الکترونیکی.
من خودم که یکی از همین افرادم که شاید اینجوری کتابخوندنم 10 برابر بشه!!!
با اجازهی صاحب وبلاگ به صالح : برای اکانت گوگل یه جیمیل درست کن : وقتی میخوای درست کنی یه آدرس ایمیل برای چک کردنش بده حل میشه
میکنه به عبارتی برای هر 100 نفر دو تا کتاب نوشته شده، فکر کنم رشد جمعیت از تالیف کتاب سریع تر باشه(؟) اگر نسبت رو ثابت بگیریم، میکنه به عبارتی 4000 تالیف کتاب در روز. خب؛ یه سره صب تا شب بخونی برای هر کتاب بیست ثانیه در روز وقت داری …
جالب بود،ممنونم
تعداد کتابها دقیقا سه میلیاردو خورده ای هستش فک کنم. یا چهار میلیارد نمیدونم دقیقا
این تعداد اندک، فقط آنهایی است که به چاپ رسیده و مشخص شده است.
mc mc khili jaleb bod