موتور جستجوی گوگل چگونه کار می کند



موتور جستجوی گوگل چگونه کار می کند


یادبگیرید که، گوگل چطور یک وب سایت را پیدا می کند، صفحات سایت را پیمایش می کند، و چطور صفحات وب سایت را برای نمایش در نتایج جستجو انتخاب می کند

زمانی که شما پای کامپیوتر نشته اید و در گوگل جستجو می کنید، به سرعت یک لیست از نتایج جستجو در میان کل وب به شما ارائه می شود.گوگل چگونه صفحات مرتبط با جستجوی شما را پیدا می کند، و تصمیم می گیرد که کدام را در صفحه اول گوگل نمایش دهد؟

در ساده ترین حالت، شما ممکن است فکر کنید جستجوی وب مانند جستجوی یک کتاب بسیار بزرگ  با یک فهرست بسیار دقیق هستید که جای هر چیزی را به شما می گوید. زمانی که شما یک جستجو در گوگل انجام می دهید، برنامه های ما برای تصمیم گیری در مورد مرتبط ترین نتایج برای ارائه در صفحه اول گوگل فهرست مان را چک می کنند.

سه مولفه در آماده سازی نتایج جستجو شما کلیدی هستند:

  1. پیمایش(Crawling): آیا گوگل در مورد وب سایت شما چیزی می داند؟ آیا می تواند آن را پیدا کند؟
  2. فهرست بندی(Indexing): آیا گوگل می تواند وب سایت شما را در فهرست خود قرار دهد؟
  3. ارائه(Serving): آیا وب سایت شامل محتوا خوب و قابل استفاده و مرتبط با جستجوی کاربران است؟

پیمایش(Crawling)

پیمایش فرآیندی است که بوسیله آن ربات گوگل صفحات جدید و بروز را برای اضافه شدن به فهرست کشف می کند. ما(گوگل) از مجموعه عظیمی از کامپیوترها برای واکشی(یا پیمایش Crawl) میلیاردها صفحه وب استفاده می کنیم. برنامه ای که عمل واکشی را انجام می دهد ربات گوگل نام دارد(همچنین robot،bot یا spider نیز گفته می شود). ربات گوگل از یک فرآیند الگوریتمی استفاده می کند: برنامه کامپیوتری تصمیم می گیرید که کدام سایت را پیمایش کند، با چه فاصله زمانی، و چه تعداد صفحه از هر سایت واکشی کند.

فرآیند پیمایش گوگل توسط لیستی از آدرس های اینترنتی(URL) آغاز می شود، که حاصل فرآیند پیمایش قبلی است، و بوسیله نقشه سایت که توسط مدیر وب سایت ارائه شده است تکمیل می شود. زمانی که ربات گوگل در حال مشاهده هر صفحه از وب سایت است لینک های هر صفحه را تشخیص داده و آنها را برای پیمایش به لیست اضافه می کند. وب سایت های جدید، وب سایت ها تغییر یافته، و لینک های غیرفعال برای بروز رسانی فهرست گوگل مورد توجه هستند.

گوگل هیچ هزینه ای را برای پیمایش بیشتر و مداوم قبول نمی کند، و ما(گوگل) عمل جستجو را از کسب و کارمان جدا نگه می داریم.

 

فهرست بندی(Indexing)

فرآیند ربات گوگل هر صفحه ای را که پیمایش می کند در فهرست عظیمی از کلمات مرتبط قرار می دهد، و همچنین موقعیت آنها در هر صفحه. در ادامه، ما اطلاعاتی را که شامل تگ ها در محتوا و ویژگی ها(Attribute) هستند پردازش می کنیم، مانند تگ های Title و ویژگی های ALT. ربات گوگل توان پردازش زیادی دارد، اما همه نوع محتوا نه.برای مثال ما نمی توانیم محتوا یک فایل رسانه ای (عکس و فیلم) و یا صفحات متغییر را پردازش کنیم.

 

ارائه(Serving)

زمان که یک کاربر جستجو می کند، ماشین های ما(گوگل) در میان فهرست به دنبال صفحات مرتبط جستجو می کنند و نتیجه ای را که از نظر ما بسیار مرتبط است را به کاربر می دهد. مرتبط بودن با استفاده از 200 فاکتور تصمیم گیری می شود، یکی از آنها پیج رنک(Page Rank) برای صفحه مورد نظر است. پیج رنک بستگی به تعداد لینک های ورودی به آن صفحه دارد. به زبان ساده، هر لینک از دیگر سایت ها به صفحات سایت شما به پیج رنک وب سایت شما اضافه می کند. همه لینک ها یکسان نیستند: گوگل برای تشخیص لینک های هرز و دیگر اعمال که نتیجه منفی روی نتایج جستجو دارند به سختی کار می کند تا کاربرانش تجربه بهتری داشته باشند. بهترین لینک ها آنانند که با محتوا صفحه شما مرتبط هستند.

برای رنک گرفتن وب سایت تان در نتایج جستجو، این مهم است که گوگل می تواند وب سایت تان را به درستی پیمایش و فهرست کند. راهنمای مدیران وب سایت ما(گوگل) تجربیات بسیار خوبی را مطرح کرده است، که کمک می کند اشتباهات رایج را انجام ندهید و پیج رنک سایت تان را افزایش دهید.

ویژگی های آیا منظور شما این بود؟ و پر کردن خودکار گوگل عبارت مرتبط را به کاربران نمایش می دهند که باعث صرفه جویی در زمان آنها می شود، غلط های املایی رایج و جستجوی های محبوب. مانند نتایج جستجوی ما در google.com ،کلمات کلیدی مورد استفاده در این ویژگی ها به صورت اتوماتیک توسط خزنده مان و الگوریتم های جستجو تولید می شود. فقط زمانی که احساس کنیم در زمان کاربر صرفه جویی می شود این پیش بینی ها را ارائه می دهیم. در صورتی که پیج رنک یک سایت برای یک کلمه کیدی خوب است، به خاطر آن است که ما با الگوریتم ها یی به این نتیجه رسیده ایم که محتوا آن صفحه با جستجوی کاربر ارتباط بیشتری دارد

 

منبع:وب سایت رسمی گوگل


+نوشته شده در ساعت توسط مدیر