گوگل با قابلیت متن باز خود ۱۰درصد از جستجوها را بهبود می بخشد

گوگل در حال حاضر تغییراتی را در الگوریتم جستجوی هسته ای خود ارائه داده است که  می تواند رتبه بندی نتایج را برای هر یک از ده پرس و جو تغییر دهد.این تغیرات مبتنی بر تکنیک های پردازش زبان طبیعی (NLP) است.

google

کسینوس-گوگل در حال حاضر تغییراتی را در الگوریتم جستجوی هسته ای خود ارائه داده است که  می تواند رتبه بندی نتایج را برای هر یک از ده پرس و جو تغییر دهد.این تغیرات مبتنی بر تکنیک های پردازش زبان طبیعی (NLP) است، که توسط محققان گوگل ساخته شده و در طی ۱۰ ماه گذشته یکی از قابلیت های موتورهای جستجو شده است.

در واقع ، گوگل ادعا می کند که با درک بهتر چگونگی ارتباط کلمات با یکدیگر در یک جمله ، نتایج را بهبود می بخشد.گوگل برای اثبات این ادعای خود در روز های گذشته در یک جلسه توجیهی در مقابل خبرنگاران به بحث پرداخت و الگوریتم آن ها توانست معنی این عبارت را تجزیه کند: “آیا می توانید برای کسی داروخانه پیدا کنید؟”

طبق الگوریتم قدیمی جستجوی گوگل ، این جمله را طبق گفته های پاندو نایاک  از “کلمات”برای جست جو استفاده می کند، بنابراین به کلمات مهم ، دارو و داروخانه نگاه می کند  و نتایج محلی را به سادگی بازگرداند. این الگوریتم جدید قادر به درک متن واژه های جمله است، برای مثال  کلمه ی “برای کسی” برای درک این سوال بود که آیا می توانید نسخه شخص دیگری را انتخاب کنید ؟- از این آزمایش نتایج خوبی را به دست آوردند.

 

این الگوریتم tweaked مبتنی بر BERT است،که کل کلمات در یک جمله را ضروری میداند،انجام این کار به آن اجازه می دهد تا درک کند که کلمه ی “برای کسی” نباید دور ریخته شود ، بلکه برای معنای جمله ضروری هستند.

 BERT  دقیقا چه کاری انجلم می دهد؟

روشی که BERT تشخیص می دهد که باید به آن کلمات توجه کند ، با توجه به یک بازی تایتانیک  Mad Libs است.گوگل جملات  را به دست می آورد و به طور تصادفی ۱۵ درصد کلمات را حذف می کند ، سپس BERT وظیفه ی این را دارد تا تعین کند که این کلمات چ چیزی باید باشند.با گذشت زمان ، این نوع آموزش در ساختن یک الگوی NLP(درک)  مؤثر است،یعنی معنای دقیق کلمات را درک میکند.

یک مثال دیگری که گوگل برای درک بهتر این موضوع آورده است : “parking on a hill with no curb(پارک کردن روی تپه بدون هیچ محدودیتی)” است.کلمه ی “هیچ (no)” برای این جستجو بسیار ضروری است،که قبل از اجرای الگوریتم BERT در جستجوی الگوریتم های دیگر  گوگل این کلمه  را از دست داده است.

exmple

در حال حاضر گوگل این تغیرات الگوریتم را برای چند روز گذشته اعمال کرده است و الگوریتم ها برای ۱۰ درصد جست جو های زبان انگلیسی آمریکا تاثیر گذاشته است،که بعد ها قرار است به زبان کشور های دیگر بپردازد.

تمام این تغیرات از طریق یک سری آزمایش ها امتحان میشود تااطمینان حاصل شود که این کار واقعا جستجوهارا بهبود میبخشند.یکی از این آزمایش ها استفاده از یک کادر مجرب داوری خود شرکت گوگل است که الگوریتم  های این شرکت را با رتبه بندی نتایج جستجو،نتایج را بهبود میبخشد.

آیا تمام پرس و جو ها تحت تاثیر BERT  است؟

هر پرس و جو تحت تأثیر BERT نیست،بلکه یک ابزار جدید است که برای رتبه بندی نتایج جستجو از آن استفاده میشود.این که چگونه این همه کار و الگوریتم را گوگل چگونه اجرا میکند خود یه راز بزرگ است که برای کسی آشکار نیست شاید گوگل به این خاطر این را راز نگه داشته و آشکار نکرده تا اسپم ها اخلالی را در کار گوگل ایجاد نکنند.اما دلیل دیگری که بسیار مرموز است وباعث میشود این الگوریتم ها غیرمنتظره به نظر برسند این است ک:وقتی کامپیوتر تصمیم میگیرد از یک تکنیک بخصوص زبان ماشینی انتخاب کند نمیتوان دانست که چرا این تکنیک را انتخاب کرده است.

به اصطلاح این یک “جعبه سیاه”است  ،در یادگیری زبان ماشین زیرا اگر نتایج اشتباه باشد،تشخیص دلیل آن بسیار دشوار است.

این شرکت همچنان میگوید طبق پیش بینی ناشران بزرگ ،تغیراتی را که در الگوریتم ها به وجود آورده ایم، نمیتوانند پیش بینی کنند که در جا ترافیک داده ی زیادی وجود دارد.این را هم در نظر بگیرید که هر وقت گوگل حرف از تغیر الگوریتم های خود زده کل وب را تحت تاثیر قرار داده و چه سایت هایی که در این تغیرات به رتبه یک گوگل آمده اند و چه سایت هایی که با این تغیرات کلا از بین رفتند.

همه کسانی که از طریق وب کسب درآمد میکنند باید به این تغیرات توجه داشته باشند تا کیفیت مطالب خود را بهبود ببخشند.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *