گوگل محتوای انبوه ماشینی تولید شده به قصد SEO و به وسیله هوش مصنوعی را دوست ندارد، اما واقعیت دقیقا چیست؟

0

بازاریابان محتوا و کارشناسان SEO در مورد اظهارات جان مولر از گوگل در مورد محتوای تولید شده توسط هوش مصنوعی و اینکه از اصطلاح “هرزنامه” در مورد آنها استفاده کرده، سر و صدا به پا کرده‌اند. او این کار را در حین پاسخ دادن به یک سوال در خلال همایشی در مرکزی جستجوی گوگل در اول‌ آوریل انجام داد (البته محتوای این همایش هیچ ربطی به این تاریخ خاص نداشت).

پاسخ مولر تکان دهنده نیستt به خصوص با توجه به اینکه گوگل در سال‌های اخیر بار‌ها به این سوال پاسخ داده. علاوه بر این، محتوای تولید شده به خودکار، طبق دستورالعمل‌های وبمستری، چیزی است که باید از آن پرهیز کرد.

با این حال، محتوای تولید شده توسط هوش مصنوعی موضوعی محبوب برای بحث در رسانه‌های اجتماعی، انجمن‌ها و فوروم‌های تخصصی است. به خصوص در سال‌های اخیر که این فناوری پیشرفت کرده.

سوال این بود: واکنش گوگل به وب سایت‌هایی که محتوای نوشته شده با هوش مصنوعی را منتشر می‌کنند، چگونه است؟ آیا گوگل می‌تواند تفاوت بین محتوای نوشته شده توسط هوش مصنوعی یا انسان را تشخیص دهد؟

مولر البته از اظهار نظر بیان قطعی خودداری کرد، اما گفت که در نهایت فرقی نمی‌کند که محتوا توسط انسان نوشته شده باشد یا ربات. گوگل در هر صورت، می‌تواند تشخیص دهد که آیا محتوای تولید شده، کیفیت بالا دارد یا بی‌کیفیت یا هرزنامه است. ضمن اینکه در برخی موارد، به احتمال زیاد نتایج صفحه یک گوگل با محتوای تولید شده توسط روبات‌ها پر می‌شود.

به صورت خنده‌داری مثلا در صفحه اول گوگل در مورد موضوع همین مقاله جستجو کنید، به مقاله‌ای برمی‌خورید که در رتبه دو است و به صورت چالشی ، عنوان مقاله این است:

آیا می‌توانید بگویید که این مطلب را یک انسان نوشته یا ماشین؟!

گوگل در مورد محتوای تولید شده به طور خودکار می‌گوید:

محتوای تولید شده خودکار، محتوایی است که به صورت برنامه‌ریزی شده تولید شده. در مواردی که هدف آن دستکاری رتبه‌بندی جستجو و عدم کمک به کاربران باشد، ممکن است گوگل اقداماتی را در مورد چنین محتوایی انجام دهد. برخی از موارد (و نه همه آنها) در اینجا فهرست شده‌اند:

– متنی که برای خواننده انسانی معنی ندارد اما ممکن است حاوی کلمات کلیدی جستجو باشد.

– متن ترجمه شده توسط یک ابزار خودکار بدون بازبینی یا نظارت انسانی قبل از انتشار.

– متن تولید شده از طریق فرآیند‌های خودکار، مانند زنجیره مارکوف.

– متن تولید شده با استفاده از تکنیک‌های مترادف‌سازی یک متن از قبل موجود یا مبهم‌سازی خودکار.

– متن تولید شده از بازنشر فید‌های Atom/RSS یا نتایج جستجو

-ترکیب محتوا از صفحات مختلف وب بدون افزودن ارزش کافی به آن


آیا این گایدلاین جدی است؟

از نقطه نظر عملی نمی‌شود گفت که این موارد کاملا توسط گوگل رعایت می‌شوند. جالب است که قسمت قابل توجهی از محتوای تولیدشده توسط کاربران از همین تکنیک‌ها استفاده می‌کند.

شاید در وب فارسی این مطلب بیشتر به چشم بخورد. مثال عرض می‌کنم:

۱- مثلا وقتی که نام یک فیلم را جستجو می‌کنید، به جای اینکه سایت‌هایی که مقاله‌ای در مورد فیلم نوشته‌اند، اندکس شوند، بیش از ۹۰ درصد نتایج جستجو، سایت‌های دانلود را به شما نشان می‌دهد. کسی که به دنبال خواندن مقاله نقد و تحیل و معرفی است، پس مجبور می‌شود که عباراتی مانند نقد و تحلیل و خلاصه داستان را اضافه کند.

البته در همینجا هم اگر سایتی یک مقاله مشروح باکیفیت در مورد فیلمی نوشته شده باشد، باز هم بخت رتبه‌بندی خوب آن وجود دارد. اما جالب است که گوگل دست کم به زبان فارسی، گرایش اندکس سایت‌های دانلود را دارد. البته محتمل است که سایت‌های دانلود از تکنیک‌های SEO خوب یا روش‌هایی مانند لینک‌گیری زیاد استفاده می‌کنند و سرمایه‌گذاری زیادی برای این کار میکنند

۲- نتایج غیرمرتبط هم غوغا می‌کنند. مثلا شما جستجو می‌کنید تا کتابی دانلود کنید. خوشبختانه این سال‌ها خیلی موارد گوگل ترجیح می‌دهد صفحه خرید و دانلود کتاب را در سایت‌هایی قانونی مانند فیدیبو و طاقچه را برایتان در رتبه بالا نمایش بدهد. اما هنوز هم سایت‌هایی هستند که تیتر کاذب دانلود فلان کتاب را دارند و در متن اصلی و قسمت دانلود، هیچ چیز مرتبطی مشاهده نمی‌شود.

۳-گوگل مطلب طولانی را دوست دارد. اما آیا همیشه مطلب طولانی کیفیت خوبی دارد؟!

یکی از بحران‌های اندکس مطالب به زبان فارسی در قسمت پزشکی مشاهده می‌شود. سایت‌هایی هستند که با تکنیک‌های SEO مانند آماده کردن مقاله خیلی طولانی و عنوان‌های میان‌متنی، گوی سبقت را از مقاله‌ی مختصر ؛ اما مفید و معتبر می‌ربایند.

۴- فعلا البته ربات خیلی هوشمند به فارسی برای مترادف کردن و ترکیب مقالات از قبل موجود نداریم، اما محتواساز و کپی رایت‌های انسانی بسیار زیادی در این حیطه فعالیت می‌کنند.

۵- یک تبصره که همینجا باید اشاره کنم که ترکیب مقالات در صورت داشتن ارزش افزوده هم برای کاربر انسانی ارزشمند است و هم برای گوگل. فرض کنید برای مطلبی کسی با هوشمندی خلاصه ۴ مقاله به زبان فارسی و ترجمه ۲ مقاله با انگلیسی را با رعایت SEO با هم ترکیب کند. این دیگر در بند تولید خودکار مطلب قرار نمی‌گیرد و این دست مقالات خیلی خوب اندکس می‌شوند.

۶- گرچه ممکن است مقالات بی‌ارزش هم خیلی موارد رتبه‌های بالا را کسب کنند، اما معمولا اگر مقاله‌ای با کیفیت خوب برای کاربر انسانی تولید شده باشد و دستور العمل های SEO هم در آن خوب رعایت شده باشد، علیرغم همه نقص‌ها شانس رتبه‌بندی خوبی دارد.

البته از ان سو ممکن است شما مقاله خیلی خوبی تولید کنید، اما از صفحه ۳ به آن سو رتبه‌بندی شود! باید قبول کنید که نمی‌شود همیشه به هدف زد و عوامل متنوع مثل اعتبار خود سایت و لینک‌های ارجاعی و نکات ریزی هم هستند که روی رتبه‌بندی تاثیر می‌گذارند.


اما از مطلب اصلی دور نشویم. ما نمی‌خواهیم مشکلات تولید محتوا و بازار آن یا SEO را در این مقاله بررسی کنیم. فقط می‌خواهیم ببینیم که تولید رباتیک مقاله از نظر گوگل چگونه است.

اظهارات قبلی قبلی گوگل در مورد استفاده از هوش مصنوعی برای تولید محتوا

۲۰۲۲: از مولر در مورد ابزار‌های تولید محتوا با هوش مصنوعی مانند جاسپر سؤال شد و در توییتی پاسخ داد: «این ابزارهای تولید محتوا از زمان شروع وب وجود داشته‌اند. مردم برای انجام این کار از انواع ابزار‌ها و ترفند‌ها استفاده کرده‌اند. تا آنجا که من می‌توانم بگویم، اکثر سایت‌ها در ایجاد محتوای با کیفیت بالا مشکل دارند، آنها در ایجاد محتوای باکیفیت پایین مشکلی ندارند.

۲۰۲۱: مولر گفت که گوگل احتمالاً بیشتر روی کیفیت محتوا تمرکز خواهد کرد تا نحوه تولید آن. به این معنا که اساساً گوگل ممکن است با رتبه‌بندی محتوایی که توسط ماشین نوشته می‌شود هم مشکلی نداشته باشد و ملاک تنها کیفیت مطلب است.

۲۰۲۰: در بحث در مورد عملکرد ضعیف GPT-3 (ترانسفورماتور از پیش آموزش‌دیده ۳ که می‌تواند متنی شبیه انسان تولید کند و محتوایی را ترجمه کند)، گری الیز Gary Illyes از گوگل گفت که گوگل نمی‌خواهد محتوای ترجمه شده ماشینی اندکس شود. او مثال جالبی در توییتر مطرح کرد که ترجمه با کیفیت پایین خودکار در آن درج شده بود.

(اما خب مسلم است که ترجمه ماشینی هم اگر کیفیت خوب داشته باشد، نه قابل تشخیص است و نه گوگل حساسیتی روی آن می‌تواند داشته باشد.)

۲۰۱۹: از مولر پرسیده شد که آیا ترجمه خودکار محتوا می‌تواند به اندکس نشدن مطلب شود. به طور خلاصه، او گفت نه، اما اگر محتوا ضعیف باشد، احتمالاً رتبه خوبی نخواهد داشت.

۲۰۱۷: از ایلیز پرسیده شد که آیا ابزار‌هایی که با استفاده از داده‌ها، محتوای قابل خواندن برای انسان تولید می‌کنند، «محتوای تولید شده به صورت خودکار» در نظر گرفته می‌شوند یا خیر. ایلیز پاسخ داد که گوگل به این موضوع فکر می‌کند اما در آن زمان چیزی برای گفتن نداشت.

۲۰۱۰: مولر گفت که استفاده از ابزار‌های ترجمه خودکار (مانند مترجم گوگل) برای ایجاد محتوا، در برخی موارد، می‌تواند به عنوان «ایجاد محتوای تولید شده خودکار، که برخلاف دستورالعمل‌های وب مستری است»،  تلقی شود.

یک موضع کنایه‌آمیز؟

گوگل خود را اولین شرکت هوش مصنوعی می‌داند. گوگل از صد‌ها مدل یادگیری ماشینی در محصولات مختلف خود استفاده مانند موتور جستجو، تبلیغات، یوتیوب، جی‌میل استفاده می‌کند.

پس چرا باید در مورد محتوای تولید شده توسط هوش مصنوعی تامل داشته باشد؟

خب، همه چیز به کیفیت مطلب یا حداقل تفسیر الگوریتم‌های گوگل از مفهوم کیفیت برمی گردد.

پس ما با چیز متناقضی روبرو نستیم. گوگل در مورد پاداش دادن به محتوای با کیفیت، تا حالا تغییر روندی نداشته. به‌روزرسانی پاندا یکی از تلاش‌های بزرگ گوگل برای زدودن آشفته‌بازار کاسب‌کارهایی بود که با استفاده از نتایج جستجوی گوگل، محتواهای تصنعی برای رتبه گرفتن می‌ساختند.

خطرات محتوای تولید شده توسط هوش مصنوعی در مقابل فواید آن

خطر شماره یک: گوگل صفحه/سایت شما را بی‌ارزش تشخیص بدهد و رتبه کلی مطالب آن پایین بیاید یا مطالب از قبل اندکس شده آن، حذف شود. بعد از آن باید کلی انرژی صرف کنید تا به جایگاه اولیه برگردید.

خطر دوم: کپی‌برداری از کار‌های دیگران هستید که از قبل به صورت آنلاین وجود دارد، همیشه دارای ریسک است.

زیر نظر گرفتن رفتار رقبا یا نتایج جستجو، چیز بدی نیست و یکی از راهبردهای هر سایتی باید این هم باشد. اما مشکل این است که این یک مدل «رهبری» در وب نیست. منظورم این است که اگر می‌خواهید سایت پیش‌رو باشید، باید مطالب یکتای با کیفیت بالا تولید کنید، نه اینکه همیشه به سایتهای دیگر نگاه کنید تا ببینید چه تولید کرده‌اند و بعد مقالاتی همسو تولید کنید یا با تغییر ظاهری ادبیات مقالات سایتهای رقیب، مطالبی برای رتبه گرفتن تولید کنید.

خطر سوم: کیفیت روند خودکار معمولا پایین است

آنچه شما از هوش مصنوعی می‌گیرید، همیشه نیاز به ویرایش زیاد دارد. ربات‌های هنوز کنایه‌ها را درک نمی‌کنند، گاهی اشتباه مضحک می‌کنند و اعتبار شما را از بین می‌برند. شما می‌توانید روندهای خودکار را در برخی حوزه‌ها مد نظر داشته باشید، اما در کنارش به نویسنده‌های و ویرایشگرهای متن خوب هم نیاز خواهید داشت و نمی‌توانید بدون هزینه کردن برای آنها، از عهده کار برآییید.

سود شماره ۱: نوشتن زمان بر است

تولید محتوای درجه یک به زمان خیلی زیادی نیاز دارد. با هوش مصنوعی می‌تواند این زمان را کاهش داد.

چند سال پیش آسوشیتدپرس به دلیل استفاده از روزنامه نگاران روباتی در خبرها و تحلیل‌هایی که جنبه آماری سنگین داشتند، توجه زیادی را به خود جلب کرد و توانست ۲۰ درصد در وقت نویسندگان خود صرفه‌جویی داشته باشد.

سود دوم: محتوای خوب ارزان نیست

به عنوان صاحب یک سایت یا کسی که می‌خواهد محصولات خود را با تکیه بر رتبه خوب در گوگل بفروشد، شما باید نویسنده‌هایی و تیمی داشته باشید که سه چیز داشته باشند: ۱- خوش قلم باشند و ادبیات خوبی داشته باشند و گرامز کلی را رعایت کنند و مقدمه‌های عالی بنویسند. ۲- تکنیک‌های SEO را رعایت کنند. ۳- در مورد چیزی که می‌نویسند که متخصص باشند یا دست کم قبلا در آن حوزه زیاد قلم زده باشند.

چنین نویسنده‌ها یا تیمی، هزینه زیادی هم می‌خواهد و بسیاری از سایت‌ها از عهده پرداخت کسری از حق الزحمه چنین تیم تخصصی برنمی‌آیند.

سود سوم: محتوای تولید شده خودکار یا با هوش مصنوعی برای ایده گرفتن خوب است

بلوک یا وقفه نویسندگی بدترین چیزی است که یک نویسنده و ژورنالیست آنلاین می‌تواند با آن مواجه شود. نویسندگی بیشتر وقت‌ها ریتمی سینوسی دارد. شما بعضی روزها سرشار از انرژی و ایده هستید و بعضی روزها هر چقدر زور می‌زنید، هیچ چیز نمی‌توانید بنویسید.

اما محتوای تولیدشده توسط هوض مصنوعی می‌تواند کاتالیزوری برای شما باشد، تلنگری به شما بزند و شما را از برهوت ایده به طوفان فکری هدایت کند!

چرا اصلا اینقدر در این مورد نوشتم؟!

روش‌های SEO و تولیدمحتوا یک دانش و تجربه و مهارت بسیار گسترده هستند. هیچ پاسخ واحدی باری انواع مشکلات و سناریوهای پیش آمده وجود ندارد. شما همیشه باید برآورد کنید که یک کار برای شما سود بیشتری دارد یا زیان بیشتر.

هوش مصنوعی در آینده می‌تواند به شما کمک بیشتری برای تولید محتوا کند. هوش مصنوعی می‌تواند زمین مورد نیاز برای احداث یک بنا را برای شما آماده کند. اما بقیه کار و آنچه باعث تمایز و برندینگ شما می‌شود، به خلاقیت نیروی انسانی بستگی دارد.

نوشتن برای انسان، هنوز هم باید توسط انسان‌ها صورت بگیرد. با روندهای خودکار و نوشتن مطالب دم دستی شاید بشود برای برخی کلمات کلید رتبه‌های خوبی گرفت. اصلا شاید بشود با این کار سایت را به هیت و بازدیدکننده درخشانی رساند. اما در یک گام فراتر، همیشه کاربران از نویسندگان و سایت‌هایی یاد می‌کنند که از احساس و نیاز و حال و هوای موضوعی به صورت هوشمندانه می‌نویسند.

یک سری روندهای زمان‌بر و انرژی‌گیر به صاطلاح مکانیکی را می‌شود به ابزارهای موجود یا آنهایی که بعدا در خدمت ما درخواهند آمد، سپرد، اما برخی روندهای هم دست‌کم در آینده نزدیک و میان‌مدت، همچنان از عهده انسان برخواهند آمد.

یاد فیلم بلید رانر ۲۰۴۹  و کاراکتر دکتر آنا استلین می‌افتم که متخصص یکتای تولید خاطره در مغزهای موجودات شبیه‌سازی شده بود. این کار خاطره‌سازی و تولید رؤیا چیزی بود که تنها از عهده او برمی‌آمد.

منبع

 

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.