گوگل محتوای انبوه ماشینی تولید شده به قصد SEO و به وسیله هوش مصنوعی را دوست ندارد، اما واقعیت دقیقا چیست؟
بازاریابان محتوا و کارشناسان SEO در مورد اظهارات جان مولر از گوگل در مورد محتوای تولید شده توسط هوش مصنوعی و اینکه از اصطلاح “هرزنامه” در مورد آنها استفاده کرده، سر و صدا به پا کردهاند. او این کار را در حین پاسخ دادن به یک سوال در خلال همایشی در مرکزی جستجوی گوگل در اول آوریل انجام داد (البته محتوای این همایش هیچ ربطی به این تاریخ خاص نداشت).
پاسخ مولر تکان دهنده نیستt به خصوص با توجه به اینکه گوگل در سالهای اخیر بارها به این سوال پاسخ داده. علاوه بر این، محتوای تولید شده به خودکار، طبق دستورالعملهای وبمستری، چیزی است که باید از آن پرهیز کرد.
با این حال، محتوای تولید شده توسط هوش مصنوعی موضوعی محبوب برای بحث در رسانههای اجتماعی، انجمنها و فورومهای تخصصی است. به خصوص در سالهای اخیر که این فناوری پیشرفت کرده.
سوال این بود: واکنش گوگل به وب سایتهایی که محتوای نوشته شده با هوش مصنوعی را منتشر میکنند، چگونه است؟ آیا گوگل میتواند تفاوت بین محتوای نوشته شده توسط هوش مصنوعی یا انسان را تشخیص دهد؟
مولر البته از اظهار نظر بیان قطعی خودداری کرد، اما گفت که در نهایت فرقی نمیکند که محتوا توسط انسان نوشته شده باشد یا ربات. گوگل در هر صورت، میتواند تشخیص دهد که آیا محتوای تولید شده، کیفیت بالا دارد یا بیکیفیت یا هرزنامه است. ضمن اینکه در برخی موارد، به احتمال زیاد نتایج صفحه یک گوگل با محتوای تولید شده توسط روباتها پر میشود.
به صورت خندهداری مثلا در صفحه اول گوگل در مورد موضوع همین مقاله جستجو کنید، به مقالهای برمیخورید که در رتبه دو است و به صورت چالشی ، عنوان مقاله این است:
آیا میتوانید بگویید که این مطلب را یک انسان نوشته یا ماشین؟!
گوگل در مورد محتوای تولید شده به طور خودکار میگوید:
محتوای تولید شده خودکار، محتوایی است که به صورت برنامهریزی شده تولید شده. در مواردی که هدف آن دستکاری رتبهبندی جستجو و عدم کمک به کاربران باشد، ممکن است گوگل اقداماتی را در مورد چنین محتوایی انجام دهد. برخی از موارد (و نه همه آنها) در اینجا فهرست شدهاند:
– متنی که برای خواننده انسانی معنی ندارد اما ممکن است حاوی کلمات کلیدی جستجو باشد.
– متن ترجمه شده توسط یک ابزار خودکار بدون بازبینی یا نظارت انسانی قبل از انتشار.
– متن تولید شده از طریق فرآیندهای خودکار، مانند زنجیره مارکوف.
– متن تولید شده با استفاده از تکنیکهای مترادفسازی یک متن از قبل موجود یا مبهمسازی خودکار.
– متن تولید شده از بازنشر فیدهای Atom/RSS یا نتایج جستجو
-ترکیب محتوا از صفحات مختلف وب بدون افزودن ارزش کافی به آن
آیا این گایدلاین جدی است؟
از نقطه نظر عملی نمیشود گفت که این موارد کاملا توسط گوگل رعایت میشوند. جالب است که قسمت قابل توجهی از محتوای تولیدشده توسط کاربران از همین تکنیکها استفاده میکند.
شاید در وب فارسی این مطلب بیشتر به چشم بخورد. مثال عرض میکنم:
1- مثلا وقتی که نام یک فیلم را جستجو میکنید، به جای اینکه سایتهایی که مقالهای در مورد فیلم نوشتهاند، اندکس شوند، بیش از 90 درصد نتایج جستجو، سایتهای دانلود را به شما نشان میدهد. کسی که به دنبال خواندن مقاله نقد و تحیل و معرفی است، پس مجبور میشود که عباراتی مانند نقد و تحلیل و خلاصه داستان را اضافه کند.
البته در همینجا هم اگر سایتی یک مقاله مشروح باکیفیت در مورد فیلمی نوشته شده باشد، باز هم بخت رتبهبندی خوب آن وجود دارد. اما جالب است که گوگل دست کم به زبان فارسی، گرایش اندکس سایتهای دانلود را دارد. البته محتمل است که سایتهای دانلود از تکنیکهای SEO خوب یا روشهایی مانند لینکگیری زیاد استفاده میکنند و سرمایهگذاری زیادی برای این کار میکنند
2- نتایج غیرمرتبط هم غوغا میکنند. مثلا شما جستجو میکنید تا کتابی دانلود کنید. خوشبختانه این سالها خیلی موارد گوگل ترجیح میدهد صفحه خرید و دانلود کتاب را در سایتهایی قانونی مانند فیدیبو و طاقچه را برایتان در رتبه بالا نمایش بدهد. اما هنوز هم سایتهایی هستند که تیتر کاذب دانلود فلان کتاب را دارند و در متن اصلی و قسمت دانلود، هیچ چیز مرتبطی مشاهده نمیشود.
3-گوگل مطلب طولانی را دوست دارد. اما آیا همیشه مطلب طولانی کیفیت خوبی دارد؟!
یکی از بحرانهای اندکس مطالب به زبان فارسی در قسمت پزشکی مشاهده میشود. سایتهایی هستند که با تکنیکهای SEO مانند آماده کردن مقاله خیلی طولانی و عنوانهای میانمتنی، گوی سبقت را از مقالهی مختصر ؛ اما مفید و معتبر میربایند.
4- فعلا البته ربات خیلی هوشمند به فارسی برای مترادف کردن و ترکیب مقالات از قبل موجود نداریم، اما محتواساز و کپی رایتهای انسانی بسیار زیادی در این حیطه فعالیت میکنند.
5- یک تبصره که همینجا باید اشاره کنم که ترکیب مقالات در صورت داشتن ارزش افزوده هم برای کاربر انسانی ارزشمند است و هم برای گوگل. فرض کنید برای مطلبی کسی با هوشمندی خلاصه 4 مقاله به زبان فارسی و ترجمه 2 مقاله با انگلیسی را با رعایت SEO با هم ترکیب کند. این دیگر در بند تولید خودکار مطلب قرار نمیگیرد و این دست مقالات خیلی خوب اندکس میشوند.
6- گرچه ممکن است مقالات بیارزش هم خیلی موارد رتبههای بالا را کسب کنند، اما معمولا اگر مقالهای با کیفیت خوب برای کاربر انسانی تولید شده باشد و دستور العمل های SEO هم در آن خوب رعایت شده باشد، علیرغم همه نقصها شانس رتبهبندی خوبی دارد.
البته از ان سو ممکن است شما مقاله خیلی خوبی تولید کنید، اما از صفحه 3 به آن سو رتبهبندی شود! باید قبول کنید که نمیشود همیشه به هدف زد و عوامل متنوع مثل اعتبار خود سایت و لینکهای ارجاعی و نکات ریزی هم هستند که روی رتبهبندی تاثیر میگذارند.
اما از مطلب اصلی دور نشویم. ما نمیخواهیم مشکلات تولید محتوا و بازار آن یا SEO را در این مقاله بررسی کنیم. فقط میخواهیم ببینیم که تولید رباتیک مقاله از نظر گوگل چگونه است.
اظهارات قبلی قبلی گوگل در مورد استفاده از هوش مصنوعی برای تولید محتوا
2022: از مولر در مورد ابزارهای تولید محتوا با هوش مصنوعی مانند جاسپر سؤال شد و در توییتی پاسخ داد: «این ابزارهای تولید محتوا از زمان شروع وب وجود داشتهاند. مردم برای انجام این کار از انواع ابزارها و ترفندها استفاده کردهاند. تا آنجا که من میتوانم بگویم، اکثر سایتها در ایجاد محتوای با کیفیت بالا مشکل دارند، آنها در ایجاد محتوای باکیفیت پایین مشکلی ندارند.
2021: مولر گفت که گوگل احتمالاً بیشتر روی کیفیت محتوا تمرکز خواهد کرد تا نحوه تولید آن. به این معنا که اساساً گوگل ممکن است با رتبهبندی محتوایی که توسط ماشین نوشته میشود هم مشکلی نداشته باشد و ملاک تنها کیفیت مطلب است.
2020: در بحث در مورد عملکرد ضعیف GPT-3 (ترانسفورماتور از پیش آموزشدیده 3 که میتواند متنی شبیه انسان تولید کند و محتوایی را ترجمه کند)، گری الیز Gary Illyes از گوگل گفت که گوگل نمیخواهد محتوای ترجمه شده ماشینی اندکس شود. او مثال جالبی در توییتر مطرح کرد که ترجمه با کیفیت پایین خودکار در آن درج شده بود.
(اما خب مسلم است که ترجمه ماشینی هم اگر کیفیت خوب داشته باشد، نه قابل تشخیص است و نه گوگل حساسیتی روی آن میتواند داشته باشد.)
2019: از مولر پرسیده شد که آیا ترجمه خودکار محتوا میتواند به اندکس نشدن مطلب شود. به طور خلاصه، او گفت نه، اما اگر محتوا ضعیف باشد، احتمالاً رتبه خوبی نخواهد داشت.
2017: از ایلیز پرسیده شد که آیا ابزارهایی که با استفاده از دادهها، محتوای قابل خواندن برای انسان تولید میکنند، «محتوای تولید شده به صورت خودکار» در نظر گرفته میشوند یا خیر. ایلیز پاسخ داد که گوگل به این موضوع فکر میکند اما در آن زمان چیزی برای گفتن نداشت.
2010: مولر گفت که استفاده از ابزارهای ترجمه خودکار (مانند مترجم گوگل) برای ایجاد محتوا، در برخی موارد، میتواند به عنوان «ایجاد محتوای تولید شده خودکار، که برخلاف دستورالعملهای وب مستری است»، تلقی شود.
یک موضع کنایهآمیز؟
گوگل خود را اولین شرکت هوش مصنوعی میداند. گوگل از صدها مدل یادگیری ماشینی در محصولات مختلف خود استفاده مانند موتور جستجو، تبلیغات، یوتیوب، جیمیل استفاده میکند.
پس چرا باید در مورد محتوای تولید شده توسط هوش مصنوعی تامل داشته باشد؟
خب، همه چیز به کیفیت مطلب یا حداقل تفسیر الگوریتمهای گوگل از مفهوم کیفیت برمی گردد.
پس ما با چیز متناقضی روبرو نستیم. گوگل در مورد پاداش دادن به محتوای با کیفیت، تا حالا تغییر روندی نداشته. بهروزرسانی پاندا یکی از تلاشهای بزرگ گوگل برای زدودن آشفتهبازار کاسبکارهایی بود که با استفاده از نتایج جستجوی گوگل، محتواهای تصنعی برای رتبه گرفتن میساختند.
خطرات محتوای تولید شده توسط هوش مصنوعی در مقابل فواید آن
خطر شماره یک: گوگل صفحه/سایت شما را بیارزش تشخیص بدهد و رتبه کلی مطالب آن پایین بیاید یا مطالب از قبل اندکس شده آن، حذف شود. بعد از آن باید کلی انرژی صرف کنید تا به جایگاه اولیه برگردید.
خطر دوم: کپیبرداری از کارهای دیگران هستید که از قبل به صورت آنلاین وجود دارد، همیشه دارای ریسک است.
زیر نظر گرفتن رفتار رقبا یا نتایج جستجو، چیز بدی نیست و یکی از راهبردهای هر سایتی باید این هم باشد. اما مشکل این است که این یک مدل «رهبری» در وب نیست. منظورم این است که اگر میخواهید سایت پیشرو باشید، باید مطالب یکتای با کیفیت بالا تولید کنید، نه اینکه همیشه به سایتهای دیگر نگاه کنید تا ببینید چه تولید کردهاند و بعد مقالاتی همسو تولید کنید یا با تغییر ظاهری ادبیات مقالات سایتهای رقیب، مطالبی برای رتبه گرفتن تولید کنید.
خطر سوم: کیفیت روند خودکار معمولا پایین است
آنچه شما از هوش مصنوعی میگیرید، همیشه نیاز به ویرایش زیاد دارد. رباتهای هنوز کنایهها را درک نمیکنند، گاهی اشتباه مضحک میکنند و اعتبار شما را از بین میبرند. شما میتوانید روندهای خودکار را در برخی حوزهها مد نظر داشته باشید، اما در کنارش به نویسندههای و ویرایشگرهای متن خوب هم نیاز خواهید داشت و نمیتوانید بدون هزینه کردن برای آنها، از عهده کار برآییید.
سود شماره 1: نوشتن زمان بر است
تولید محتوای درجه یک به زمان خیلی زیادی نیاز دارد. با هوش مصنوعی میتواند این زمان را کاهش داد.
چند سال پیش آسوشیتدپرس به دلیل استفاده از روزنامه نگاران روباتی در خبرها و تحلیلهایی که جنبه آماری سنگین داشتند، توجه زیادی را به خود جلب کرد و توانست 20 درصد در وقت نویسندگان خود صرفهجویی داشته باشد.
سود دوم: محتوای خوب ارزان نیست
به عنوان صاحب یک سایت یا کسی که میخواهد محصولات خود را با تکیه بر رتبه خوب در گوگل بفروشد، شما باید نویسندههایی و تیمی داشته باشید که سه چیز داشته باشند: 1- خوش قلم باشند و ادبیات خوبی داشته باشند و گرامز کلی را رعایت کنند و مقدمههای عالی بنویسند. 2- تکنیکهای SEO را رعایت کنند. 3- در مورد چیزی که مینویسند که متخصص باشند یا دست کم قبلا در آن حوزه زیاد قلم زده باشند.
چنین نویسندهها یا تیمی، هزینه زیادی هم میخواهد و بسیاری از سایتها از عهده پرداخت کسری از حق الزحمه چنین تیم تخصصی برنمیآیند.
سود سوم: محتوای تولید شده خودکار یا با هوش مصنوعی برای ایده گرفتن خوب است
بلوک یا وقفه نویسندگی بدترین چیزی است که یک نویسنده و ژورنالیست آنلاین میتواند با آن مواجه شود. نویسندگی بیشتر وقتها ریتمی سینوسی دارد. شما بعضی روزها سرشار از انرژی و ایده هستید و بعضی روزها هر چقدر زور میزنید، هیچ چیز نمیتوانید بنویسید.
اما محتوای تولیدشده توسط هوض مصنوعی میتواند کاتالیزوری برای شما باشد، تلنگری به شما بزند و شما را از برهوت ایده به طوفان فکری هدایت کند!
چرا اصلا اینقدر در این مورد نوشتم؟!
روشهای SEO و تولیدمحتوا یک دانش و تجربه و مهارت بسیار گسترده هستند. هیچ پاسخ واحدی باری انواع مشکلات و سناریوهای پیش آمده وجود ندارد. شما همیشه باید برآورد کنید که یک کار برای شما سود بیشتری دارد یا زیان بیشتر.
هوش مصنوعی در آینده میتواند به شما کمک بیشتری برای تولید محتوا کند. هوش مصنوعی میتواند زمین مورد نیاز برای احداث یک بنا را برای شما آماده کند. اما بقیه کار و آنچه باعث تمایز و برندینگ شما میشود، به خلاقیت نیروی انسانی بستگی دارد.
نوشتن برای انسان، هنوز هم باید توسط انسانها صورت بگیرد. با روندهای خودکار و نوشتن مطالب دم دستی شاید بشود برای برخی کلمات کلید رتبههای خوبی گرفت. اصلا شاید بشود با این کار سایت را به هیت و بازدیدکننده درخشانی رساند. اما در یک گام فراتر، همیشه کاربران از نویسندگان و سایتهایی یاد میکنند که از احساس و نیاز و حال و هوای موضوعی به صورت هوشمندانه مینویسند.
یک سری روندهای زمانبر و انرژیگیر به صاطلاح مکانیکی را میشود به ابزارهای موجود یا آنهایی که بعدا در خدمت ما درخواهند آمد، سپرد، اما برخی روندهای هم دستکم در آینده نزدیک و میانمدت، همچنان از عهده انسان برخواهند آمد.
یاد فیلم بلید رانر 2049 و کاراکتر دکتر آنا استلین میافتم که متخصص یکتای تولید خاطره در مغزهای موجودات شبیهسازی شده بود. این کار خاطرهسازی و تولید رؤیا چیزی بود که تنها از عهده او برمیآمد.