بررسی آماری واژه‌های پنج میلیون کتاب با محصول جدید گوگل

22

به تازگی آزمایشگاه گوگل با همکاری دو جامعه‌شناس، محصول جالبی بیرون داده است.

گوگل، 5.2 میلیون کتاب را دیجیتالی کرده است. این تعداد کتاب 500 میلیارد کلمه دارند. کتاب‌های دیجیتالی شده بین سال‌های 1500 تا 2008 نوشته شده‌اند.

محصول جدید گوگل مشخص می‌کند که در هر سال، چه میزان از یک کلمه مشخص استفاده شده است! به این ترتیب معلوم می‌شود که در یک بازه زمانی چندقرنی فرکانس استفاده از یک کلمه چقدر فرق کرده است و از این طریق، روزنه‌ای برای بررسی فرهنگ و جامعه باز می‌شود.

من در نخستین آزمایش، کلمه war را در دو قرن اخیر، جستجو کردم:

مشخص است که در سال‌های دور و بر جنگ‌های جهانی اول و دوم، فرکانس استفاده از این کلمه بیشتر شده است.

حالا، تست دیگری می‌کنیم و مردان و زنان را در کتاب‌های جستجو می‌کنیم:

این جستجو هم جالب است و نشان می‌دهد که قبل از دهه 70 میلادی، میزان استفاده از کلمه «زنان» به شکل معناداری کمتر از «مردان» بود.

حالا بیایید، «ایران» را جستجو کنیم:

تفسیر این نمودار، بسیار دشوارتر است. پیداست که فرکانس استفاده از واژه ایران بعد از انقلاب و جنگ ایران و عراق و در سال‌های اخیر به دلایل سیاسی باید بیشتر شده باشد. ولی در این لحظه نمی‌توانم ابراز نظر کنم که چرا در سال‌های دور و بر 1800 یا 1750، در نمودار قله‌هایی ظاهر شده است.

دست آخر «کامپیوتر» را جستجو می‌کنیم:

معلوم می‌شود که از 1945 به بعد، سر و کله این کلمه پیدا شده است، از سال 1977، شتاب استفاده از آن تند شده است، از سال 2000 به بعد هم، احتمالا به خاطر رواج کلمات هم‌ارزی مثل لپ‌تاپ، میزان استفاده از آن کمتر شده است.

شما هم اگر چیز جالبی برای جستجو به نظرتان رسید و نمودار جالبی پیدا کردید، در قسمت کامنت وبلاگ آن را به اشتراک بگذارید.


اگر خواننده جدید سایت «یک پزشک»  هستید!
شما در حال خواندن سایت یک پزشک (یک پزشک دات کام) به نشانی اینترنتی www.1pezeshk.com هستید. سایتی با 18 سال سابقه که برخلاف اسمش سرشار از مطالب متنوع است!
ما را رها نکنید. بسیار ممنون می‌شویم اگر:
- سایت یک پزشک رو در مرورگر خود بوک‌مارک کنید.
-مشترک فید یا RSS یک پزشک شوید.
- شبکه‌های اجتماعی ما را دنبال کنید: صفحه تلگرام - صفحه اینستاگرام ما
- برای سفارش تبلیغات ایمیل alirezamajidi در جی میل یا تلگرام تماس بگیرید.
و دیگر مطالب ما را بخوانید. مثلا:

کلاژهای کاغذی زیبای مینیمال از شخصیت‌های سینمایی مشهور

اینکه بتوانی به صورت خلاصه و مختصر و مفید با هنر خودت، مفهومی را برسانی، هر بسیار جالبی است. حالا تصور کنید که با برش چند کاغذ رنگی و کنار هم نهادت انها، یغنی کلاژ کاغذی بشود، شخصیت‌های مهم سینمایی را بازسازی کرد.این کاری است که مارگارت…

اولم، یکی از عجیب‌ترین جانداران روی زمین – شبیه جنین نارس یا موجودات سری فیلم‌های بیگانگان

جانداری به نام Proteus anguinus که همچنین به عنوان اولم olm شناخته می‌شود، گونه‌ای سمندر است که بومی آب‌های زیرزمینی آلپ در جنوب شرقی اروپا است. این جاندار از معدود مهره‌داران غارنشین است و به دلیل شکل سر و دست‌ها  رنگ سفید مایل به صورتی و…

باز هم نمونه‌هایی از معماری بد که آنقدر جلب توجه کرده‌اند که شهره اینترنت شده‌اند!

طراحی بد داریم تا طراحی بد. شاید پشت برخی از اینها اصلا طراحی‌ای هم در کار نبوده و همه چیز بداهه پیش رفته است یا حاصل اخنتلاف مهندس طراح داخلی و خارجی و کارفرمایی بوده که فکر می‌کرده همه چیز را می‌داند یا شاید هم دستور کارفرمایی بوده که…

مهم نیست این تابستان چقدر گرم است، برهنه نخوابید! مشکلات سلامتی بی‌لباس خوابیدن

بر اساس تحقیقات یک شرکت فروش تشک آنلاین به نام Casper حدود ۲۸.۵ درصد از آمریکایی‌های گفته‌اند که هر شب، هفتگی، ماهانه یا هر چند وقت یکبار برهنه می‌خوابند. اما ۷۱.۵ درصد دیگر گفتند که همیشه با لباس می‌خوابند.واضح است که برهنه خوابیدن…

اگر قرار بود ابرقهرمان‌ها، لباس‌های قرن نوزدهمی می‌پوشیدند

ما عادت کرده‌ایم ابرقهرمان‌ها را در لباس‌های امروز ببینیم و فیلم‌های زیادی هم که بر مبنای کامیک‌بوک‌ها ساخته شده، این تصور را در ذهن ما تشدید کرده‌اند.اما اگر قرار بود همین ابرقهرمان‌ها لباس‌های قرن نوزذهمی می‌پوشیدند، چه می‌شد؟…

چرا هنگامی که می‌خواهند عکسی از ما بگیرند، ناخودآگاه سرمان را کج می‌کنیم؟

وقتی در فیس بوک، اینستاگرام یا سایر سایت‌های رسانه اجتماعی پر از عکس هستیم، احتمالاً متوجه یک روند در زبان بدن کاربران خواهیم شد. هنگام عکس گرفتن و مواجهه با دوربین، برخی افراد به طور خودکار سر خود را به یک طرف خم می‌کنند. به نظر می‌رسد که…
آگهی متنی در همه صفحات
دکتر فارمو / کلینیک زیبایی دکتر محمد خادمی /جراح تیروئید / پزشکا /تعمیر فن کویل / سریال ایرانی کول دانلود / مجتمع فنی تهران / دانلود فیلم دوبله فارسی /خرید دوچرخه برقی /خرید دستگاه تصفیه آب /موتور فن کویل / شیشه اتومبیل / نرم افزار حسابداری / خرید سیلوسایبین / هوش مصنوعی / مقاله بازار / شیشه اتومبیل / قیمت ایمپلنت دندان با بیمه /سپتیک تانک /بهترین دکتر لیپوماتیک در تهران /بهترین جراح بینی در تهران / آموزش تزریق ژل و بوتاکس / دوره های زیبایی برای مامایی / آموزش مزوتراپی، PRP و PRF /کاشت مو /قیمت روکش دندان /خدمات پرداخت ارزی نوین پرداخت / درمان طب / تجهیزات پزشکی / دانلود آهنگ /داروخانه اینترنتی آرتان /اشتراك دايت /فروشگاه لوازم بهداشتی /داروخانه تینا /لیفت صورت در تهران /فروش‌ دوربین مداربسته هایک ویژن /سرور مجازی ایران /مرکز خدمات پزشکی و پرستاری در منزل درمان نو / ثبت برند /حمل بار دریایی از چین /سایت نوید /پزشک زنان سعادت آباد /کلاه کاسکت / لمینت متحرک دندان /فروشگاه اینترنتی زنبیل /ساعت تبلیغاتی /تجهیزات پزشکی /چاپ لیوان /خرید از آمازون /بهترین سریال های ایرانی /کاشت مو /قیمت ساک پارچه ای /دانلود نرم افزار /
22 نظرات
  1. بابک می گوید

    من Galilei رو سرچ کردم دیدم بین سال های 1600 تا 1650 یکدفه خیلی از اسمش استفاده شده به خاطر همون قضیه گرد بودن زمین که بین همین سال ها مطرح کرده بعدش earth رو سرچ کردم یه رابطه معناداری بینشون پیدا شد.جالب بود

  2. امین می گوید

    این عبارتو هم سرچ کنید.
    persian gulf,arabian gulf

    1. امین می گوید

      البته در کامنت قبل به حروف کوچک اول توجه نکردم
      اینو هم امتحان کنید
      Persian gulf,Arabian gulf

  3. هامون می گوید

    islam جالبه… بعد از انقلاب یهو میره بالا

  4. امیر گنو می گوید

    چقدر جالب بود

  5. گنو پی سی می گوید

    دستتتون درد نکنه

  6. زيرپوش می گوید

    سلام
    یک پزشک جان اول یک سوال داشتم
    این with smoothing of به چه دردی میخوره تو این نموداره؟
    من کامل متوجه نشدم اگر توضیح بدی خیلی ممنون میشم
    بعد اینکه واژه پرشین گلف و عربین گلف رو سرچ کنید متوجه جعلی بودن اسم دوم می شوید

  7. وحید می گوید

    واژه ایران رو با حروف بزرگ ( Iran) جستجو کنید، نتیجه بهتری بدست میاد.

  8. senaps می گوید

    همینجوری به ذهنم خورد که افراد رو جست و جو کنم…
    درباره ی هیتلر بعد از 1750 تا 1800 هیچ کتابی نوشته نشده!این دوران چه خبر بوده؟!!
    درباره ی خمینی هم جست و جو کردم…
    البته درباره ی چیزهای دیگه ای هم میشه جست و جو کرد! مثلا درباره ی گریت سایرس یا کوروش کبیر،یا مثلا سعدی و حافظ!!
    ببخشید برای لحظات اول،چیز خیلی تاریخیی به ذهنم نرسید!!

  9. رضا می گوید

    فاربیدن بود برای ما! شما از وی پی ان استفاده می کنید؟!

  10. پيوست می گوید

    و البته گوگل ایران رو جزو “forbidden country” حساب می‌کنه و اجازه‌ی استفاده از این سرویس رو با آی‌پی ایرانی نمی‌ده.

  11. بنيامين می گوید

    کلمه ی aids رو ببینید، از سال 1950 هم بوده !

    1. علیرضا مجیدی می گوید

      احتمالا جمع aid بوده ولی خطاهای نرم افزار OCR هم مطرح هست.

  12. حمید می گوید

    واژه اینترنت(internet) در سال های 1910 ؟؟؟؟

  13. یاشار می گوید

    اگر در مورد ایران جستجو می کنید توجه داشته باشید که قبل از سال 1935 کشورهای خارجی برای ایران اغلب کلمه پرشیا Persian را استفاده می کردند در این زمان رضا خان کلمه ایران را مورد توجه قرار داد و به صورت رسمی به دیگر کشورها اعلام شد که از کلمه ایران Iran به جای Persia استفاده کنند
    اگر به جای ایران کلمه شرق یا آسیا ( یا حتی کلمه غرب که در تقابل و یا قیاس با شرق همواره ذکر می گردیده ) را نیز جستجو کنیم به همان جهش حدود 1800 می رسیم این جهش شاید مربوط شود به ایجاد دانشکده های شرق شناسی در دانشگاه های اروپا به عبارت بهتر توجه غرب به شرق که بعدها با سفر شرق شناسانی مانند ادوارد براون و ترجمه ادبیات ایران به زبان های اروپایی ادامه یافت.

  14. حمید می گوید

    http://ngrams.googlelabs.com/chart?content=internet&corpus=0&smoothing=3&year_start=1500&year_end=2008

    واژه اینترنت در سالهای 1600 – 1650 مورد استفاده قرار گرفته ؟:دی
    و حتی در بازه زمانی قرن هفدهم و همچنین در سالهای اولیه قرن نوزدهم.

    نقل محافل بسیاری از سایتهای اینترنتی شده الان :))

  15. heller می گوید

    کلمه حقوق بشر هم نتیجه جالبی داشت که از اوایل 1990 به 2000 اوج می گیره و 200 به اوج می رسه اما جالب بود که برای سالهای بعد از اون چیزی رو نشون نمی ده!

  16. نوید می گوید

    برام جالب نبود

  17. بهزاد می گوید

    سلام دکتر جان
    تو این سایت پادکسیتی نوشته با نرم افزار اندروید استفاده کردین ، می شه بگین از چه گوشی اندرویدی استفاده می کنید ؟

    1. علیرضا مجیدی می گوید

      گلکسی اس

  18. ایثار می گوید

    اینکه داده های خام را در دسترس همه قرار داده واقعا عالیه. در آینده چیزهای فوق العاده ای ازش بیرون خواهد آمد.
    ای کاش در جستجوی اخبار هم چنین امکانی فراهم می شد مثلا newspaperarchive.com که از سال 1700میلادی آرشیو روزنامه ها را دارد این امکان را که خیلی پیچیده هم نیست درست می کرد!
    یک سری به newspaperarchive.com یا highbeam.com بزنید آن هم جالبه.

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.