Google-BERT-الگویتم

الگوریتم BERT یا بروزرسانی Google BERT

اکتبر 2019 زمانی بود که الگوریتم BERT به عنوان بزرگترین الگوریتم عمده (Major Algorithm) پس از پیاده سازی الگوریتم RankBrain و پیش از Core Web Vitals توسط Google معرفی شد. این الگوریتم توسط Jacob Devlin از تیم طراحان الگوریتم گوگل و همکارانش در 2018 نوشته شد. هدف از طراحی و پیاده سازی این الگوریتم، درک بهتر جستجوی کاربر (Search Queries) و ارائه پاسخ بهتر در SERP عنوان شده. Google بیان میکند که کنجکاوی کاربران بی حد و مرز بوده و 15% از جستجوهای انجام شده از طریق موتورهای جستجو، عباراتی جدید هستند. با این وصف، ارائه مرتبط ترین پاسخ به کاربر چالشی برای Google بوده که توسط یک الگوریتم میباست بهبود پیدا میکرد. به واسطه این الگوریتم، معنی هر کلمه نه به صورت مجزا بلکه در ارتباط با سایر کلمات موجود در یک عبارت و در مقایسه با سایر جمله ها پیشبینی و تشخیص داده میشود.

BERT مخفف Bidirectional Encoder Representations from Transformers به معنی “نمایشگرهای رمزگذار دو طرفه از ترانسفورماتورها” میباشد. هنگام پیاده سازی، میزان تاثیر این الگوریتم روی رتبه بندی نتایج در SERP حدود 10% بیان شد. اما خیلی ها بر این باورند که این عدد بسیار بیشتر از تخمین Google بوده. پس با احتساب حدود 56.5 میلیارد صفحه فهرست شده (Indexed Pages) توسط Google، راجع به الگوریتمی صحبت میکنیم که حداقل 5.6 میلیارد صفحه را تحت تاثیر قرار داده.

BERT که یک الگوریتم تحلیل زبان طبیعی (NLP) بر پایۀ هوش مصنوعی یا AI و تکنیک های Machine Learning مبتنی بر شبکه های عصبی (Neural Network-Based Techniques) میباشد. و به عنوان یک الگوریتم متن باز یا Open-Source در اختیار عموم قرار گرفته و قابل استفاده و پیاده سازی توسط عوام است.

استفاده از TPUها در الگوریتم BERT

پیاده سازی BERT نیاز به تقویت سخت افزار برای پشتیبانی پردازش های مورد نیاز توسط BERT را نیز داشت. Google با استفاده از Tensor Processing Unit ابری یا Cloud TPUs بر این مشکل فائق آمده. TPU ها “مدارهای ادغام شده برای برنامه ای خاص” یا همان ASIC ها هستند که توسط Google برای شتابدهی به پردازش Machine Learning یا ML سفارشی سازی شده اند. میتوان از آنها برای پیاده سازی فریموورک برنامه ای خاص استفاده کرد. TPU ابری Google این اجازه را به کاربران میدهد تا از طریق پلتفرم های مختلفی مانند Compute Engine، AI Platform و Google Kubernetes Engine قادر به دسترسی و پیاده سازی سرویسهای ML و AI خود باشند.

مکانیزم الگوریتم BERT

همانطور که در بالا اشاره شد، الگوریتم BERT از درک رابطۀ معنایی میان کلمات در یک عبارت یا یک جمله و ارتباط معنایی بین عبارات و جملات بهره میبرد. در مدل وانیل یا Vanilla Form این الگوریتم، ترانسفورمرها 2 عملکرد مستقل دارند. یک رمزنگار یا Encoder که متن ورودی را دریافت کرده، خوانده و رمزنگاری میکند و یک Decoder یا رمزگشا که شروع به گمانه زنی برای ورودی ها میکند.

البته Rani Horev در مقاله منتشر شدۀ خود در Towards Data Science این عملکرد دو سویه یا Bidirectional را به چالش میکشد. او توضیح میدهد که Encoding دو سویه به معنای خواندن متن از چپ به راست و سپس از راست به چپ است. در صورتی که BERT اقدام به گمانه زنی تمام کلمات یک جمله به صورت یکجا نموده. پس بهتر است از کلمه Non-Directional یا بی سویه برای نامگذاری آن استفاده میشد.

تکنیک MLM یا Masked Language Modeling در الگوریتم BERT

پردازش و پیش بینی معنای کلمات و عبارات مرتبط در این مدل سازی برای درک زبان توسط ماشین، بر اساس ماسک کردن تعدادی از کلمات در جمله است. به این معنی که 15% از یک پشته ورودی هنگام رمزنگاری یا Encode شدن، توسط توکن به اصطلاح ماسک زده میشوند. به نوعی برچسب میخورند. سپس الگوریتم سعی به درک کلمات ماسک شده و ارتباط معنایی آنها باهم و بعد با سایر کلمات در پشتۀ لغات میکند.

البته استفاده از توکن Masked بر طبق برخی منابع مانند Analytics Vidhya، تنها در 80% مواقع صورت میگیرد. در 10% مواقع لغت مذکور با لغت دیگری به صورت رندوم جا به جا میشود. و نهایتا در 10% باقیمانده، لغت بدون تغییر توسط Encoder خوانده میشود.

با این اوصاف، میتوان گفت درک ارتباط معنایی بین لغات در یک جمله در الگوریتم BERT توسط تکنیک MLM در Machine Learning صورت میگیرد.

تکنیک NSP یا گمانه زنی جمله بعدی در Google BERT

آیا صرفا درک لغات و معنی آنها در یک جمله از متن برای نمایش مرتبط ترین جواب جستجو کفایت میکند؟ پس ارتباط معنای بین جملات در کل متن چطور؟ این قسمت در الگوریتم BERT توسط NSP تحلیل و پیاده سازی میشود.

در تکنیک Next Sentence Prediction یا NSP، برای آموزش دادن ماشین یا Machine Learning در الگوریتم BERT، دو جمله متوالی به انکودر تغذیه میشوند. سپس الگوریتم سعی به درک این میکند که آیا جمله ثانویه، جمله ای متعاقب و مرتبط با متن جمله اول و موضوع متن هست یا نه. در زیر دو تکه از متنی را داریم:

  1. علی به مغازه رفت. او یک جفت کفش ورزشی خرید.
  2. پارکینگ خالی بود. علی یک وعده غذا درست کرد.

در تکه اول از متن، جمله دوم متعاقب جمله اول بوده و BERT قادر به درک این ارتباط معنایی است. اما در تکه دوم از متن، جمله دوم ربطی به جمله اول نداشته و مستقل است. تشخیص این ارتباط معنایی در BERT از طریق NSP صورت میگیرد.

تاثیر الگوریتم BERT بر سئو

شاید بعد از خواندن توضیحات بالا، درک بهتری از عملکرد این الگوریتم داشته باشید. هر چند که این توضیحات تنها اشاره ای جزئی به منطق و علل پیاده سازی این الگوریتم میباشند. با استناد به مقالۀ Dawn Anderson، یکی از متخصصان بنام الگوریتم های جستجو، در Search Engine Journal اشاره شده که 9 تکنیک دیگر در NLP و پیاده سازی الگوریتم BERT دخیل هستند. برای درک عمیق آنها، نیاز به یادگیری Machine Learning و Artificial Intelligence هست که در محتوای این متن نمیگنجد.

این نکته را به خاطر داشته باشید که BERT قابل اعمال هم به جستجوهای تایپی و هم به جستجوهای گفتاری است. این الگوریتم در بدو پیاده سازی فقط به زبان انگلیسی اعمال شد. اما آمار موجود تا ژانویه 2020، حاکی از اینست که الگوریتم mBERT یا Multilingual BERT به بیش از 104 زبان مرسوم در دنیا اعمال شده.

توصیه های 2021 ارتقاء سئو برای الگوریتم BERT

شاید این نکتات را برای سئو سایت و بهینه سازی برای الگوریتم BERT کمتر جایی ببینید. این نکات کلیدهایی طلایی در سئو نوین محسوب میشوند. اما Still SEO آنها را با شما به اشتراک خواهد گذاشت:

1- محتوای خود را بومی سازی کنید:

بومی سازی محتوا به این معناست که صرفا تولید محتوا را بر اساس تکنیک های مرسوم و روشهای رایج انجام ندهید. بلکه آنرا برای جغرافیای مناسب و بازار هدف خاصی تولید کنید. بعضا اگر فیلم بردار و یا عکاس در زمینه ای خاص هستید، از تولید محتوا برای تمامی زمینه های عکاسی بپرهیزید. منابع و توجه خود را روی زمینه ای که در آن تخصص دارید معطوف کنید. و در عین حال به این فکر کنید که بازار هدف شما به دنبال چه اطلاعات و توضیحاتی از محصول شما هست؟ بهترین نحو برای پاسخ دادن به سئوالات احتمالی او در محتوای شما چیست؟

2- استفاده از کلمات کلیدی دم دراز یا Long-Tail Keywords

اگر توصیه اول را مبنی بر بومی سازی محتوای رعایت کنید، به طور خودکار تمرکز شما از کلیدواژه های کوتاه به سمت کلید واژه های بلند متمرکز خواهد شد. در مثال فیلم بردار که در بالا اشاره شد، فرضا اگر تخصص شما تولید تیزرهای تبلیغاتی و تجاری با استفاده از پهپاد است. پس بهتر است از عبارت “با پهپاد” در کلمه کلیدی مورد نظر در محتوای خود استفاده کنید. از این طریق، شما اقدام به تولید کلیدواژه ای بلندتر، خاص تر و مرتبط تر با نیاز جستجوگر کرده اید.

3- افزودن ارزش به کاربر را مبنای تولید محتوا قرار دهید

پیدایش الگوریتم های موتور جستجوگر Google مانند الگوریتم BERT با هدف این است که ترافیک را به سمت اشخاص، شرکت ها و سازمان هایی هدایت کند که به فکر افزودن ارزش به بازدیدکننده صفحات وب هستند. نه صرفا جذب ترافیک برای دیده شدن بی هدف. تا زمانی که به فکر تبادل دانش، ارائه خدمتی نوین در جهت راحت کردن زندگی برای جستجوگر، و یا محصولی با ویژگی های مورد نظر کاربر هستید و محتوایی که تولید میکنید به این فاکتورها اشاره دارد، نگران پیاده سازی الگوریتم های جدید توسط Google نباشید. کلاه سفید بر سر گذاشتن در سئو، از ابتدایی ترین اصولی است که Still SEO بر آن تاکید دارد. آنچه شما در طولانی مدت با کلاه سفید به دست خواهید آورد، بسیار پایدارتر از دستاوردهای لحظه ای و دفن شدن صفحات وبسایتتان در SERP از طریق تکنیک های کلاه سیاه خواهد بود.

4- پرهیز از ارائه محتوای فله ای و بی کیفیت

 شاید بتوان با استناد به منابعی مانند Seo Hacker یا Radd Interactive گفت که بهترین تکنیکی که میتوان برای بهتر دیده شدن در سایۀ الگوریتم BERT اتخاذ کرد، پرهیز از ارائه محتوای بی کیفیت و فله ایست. از تولید محتوا توسط افراد غیر متخصص به شدت پرهیز کنید. این روزها شاهد ظهور اشخاص و شرکت های فراوانی در زمینه تولید انواع محتوا هستیم که با هزینه ای کم اقدام به تولید محتوا میکنند. متنی که توسط فردی غیر متخصص در زمینه ای خاص نوشته شود، قطعا وزن نخواهد داشت. و قطعا پاسخگوی نیاز جستجوگر نخواهد بود. نه تنها Google بلکه تمام دنیا گرایش به سمت تخصص و کار حرفه ای دارند. آنچه شما به عنوان محتوا از شخصی غیر متخصص در زمینه موضوع محتوای خود دریافت خواهید کرد، چیزی بیشتر از انباشته ای از جملات کلیشه ای به همراه چند کلید واژه بر اساس تکنیک های منسوخ سئو نخواهد بود.

5- نگارش و دستور زبان صحیح در محتوا

BERT به دنبال رابطۀ معنایی میان کلمات و جملات میگردد. اگر محتوای شما گرامر و املای صحیح نداشته باشد، قابل درک برای انسان نخواهد بود. چه برسد به ماشینی که سعی بر درک زبان طبیعی بر اساس کد و الگوریتم دارد. شانس اینکه محتوای شما توسط الگوریتم BERT بهتر تحلیل شود، با نگارش محتوایی بدون غلط های املایی و یا غلط های گرامری افزایش پیدا میکند.

6-ساختار درست در Featured Snippet ها را فراموش نکنید

Pandu Nayak یکی از معاونان Google در بخش جستجو صریحا اظهار کرده که هم Featured Snippet ها و هم رنک صفحات توسط الگوریتم BERT دستخوش تحولات خواهند شد. اگر Rich Snippet های شما به درستی تنظیم نشده اند و یا ساختار مناسبی ندارند، سعی بر اصلاح ایرادات آنها کنید. این الگوریتم بر روی آنها نیز اعمال میشود.

7- مانیتورینگ و به روزرسانی

در نهایت، ردیابی تغییرات و تحولات اعمال شده روی امتیاز صفحات بر اساس الگوریتم BERT کار ساده ای نخواهد بود. سعی بر مانیتور کردن تغییرات در امتیازبندی صفحات بر اساس کلید واژه های خاص در گذر زمان داشته باشید. و اگر صفحه یا کلید واژه ای در حال نذول ترافیک و رنک است، اقدام به اصلاح آن بر اساس نکات بالا، و البته در نظر گرفتن سایر الگوریتم های Google داشته باشید.

همراه Still SEO باشید تا از جزئیات سایر الگوریتم های عمده Google، عملکرد آنها و راهکارهای همسویی با آنها مطلع شوید.

 

:سایر منابع

 

https://cloud.google.com/tpu/docs/

https://www.jigsawacademy.com/blogs/cloud-computing/cloud-tpu

https://www.analyticsvidhya.com/blog/2019/09/demystifying-bert-groundbreaking-nlp-framework/

https://www.machinecurve.com/index.php/question/what-is-the-next-sentence-prediction-nsp-language-objective/

https://blog.google/products/search/search-language-understanding-bert/

https://mapmeld.medium.com/a-whole-world-of-bert-f20d6bd47b2f

https://www.searchenginejournal.com/google-bert-update/332161/#close

https://raddinteractive.com/what-is-googles-bert-update-what-it-means-for-seo/

https://seo-hacker.com/google-bert-seo/

https://www.brightedge.com/blog/google-bert-algorithm-update-what-is-it

https://www.cmswire.com/digital-marketing/how-google-bert-will-impact-seo-and-marketing/

 
Summary
الگوریتم BERT
Article Name
الگوریتم BERT
Description
📌 الگوریتم BERT بر اساس NLP و تحت شبکه TPUs بر 104 زبان مرسوم در دنیا اعمال شده و روی سئوی بالغ بر 5.6 میلیارد صفحه وب تاثیر گذاشته
Author
Publisher Name
Still SEO Institute
Publisher Logo

اشتراک گذاری:

Share on facebook
Share on google
Share on twitter
Share on email
Share on linkedin
Share on whatsapp
Share on telegram
Share on reddit
Share on skype

دیدگاه‌ خود را بنویسید

Your email address will not be published.

رنگ کلاه در سئو
مبانی سئو

رنگ کلاه در سئو

رنگ کلاه در سئو و همچنین دیگر مقوله های سایبری را شاید بتوان استعاره ای از استراتژی و مرزبندی اخلاق حرفه ای یک فرد مشرف

 
متن کامل >
تکنیک سئو 2021
آموزش پیشرفته

6 تکنیک سئو در 2021

همانطور که در گذر زمان موتورهای جستجو الگوریتم های خود را به روز رسانی میکنند، تکنیک های کسب رتبه بالاتر در SERP یا Search Engine

 
متن کامل >
سئو چیست
مبانی سئو

سئو چیست

در جواب این سوال که تعریف سئو چیست و متخصص سئو کیست، کلمه سئو که برگرفته از مخفف SEO است معادل Search Engine Optimization بوده

 
متن کامل >