موتور جستجوی گوگل محبوب ترین جستجوگر در جهان است. در مقاله پیش رو به چگونگی سامان دهی اطلاعات توسط گوگل می پردازیم. در واقع قبل از اینکه شما جستجویی انجام بدهید، خزندگان وب اطلاعات را از صدها میلیارد صفحه وب جمع آوری و در فهرست جستجو سامان دهی می کنند.
اصول جستجو
فرآیند خزیدن با لیستی از اطلاعات قبلی و نقشه های سایتی که قبلاً توسط صاحبان وب سایت به دست آمده بود، آغاز می شود. زمانی که خزنده های گوگل این وب سایت ها را بازدید می کنند، از لینک هایی که در این سایت ها موجود است برای پیدا کردن صفحات دیگر استفاده می کنند. این نرم افزار توجه ویژه ای به سایت های جدید، تغییرات در سایت های موجود و لینک های مُرده دارد. برنامه های کامپیوتری تعیین می کنند که چه سایت هایی باید پایش شوند، اینکار باید چند بار انجام شود و از هر سایت چند صفحه گرفته شود.
گوگل میزفرمان جستجو (Search Console) را به صاحبان سایت پیشنهاد می کند تا انتخاب های متعددی را در مورد پایش سایت در اختیارشان قرار دهد: صاحبان وب سایت می توانند دستورالعمل های متعددی را تعریف کنند. دستورالعمل هایی از قبیل چگونگی پردازش صفحات سایتشان، درخواست بررسی دوباره سایت یا خودداری از بررسی سایت؛ که همه این ها با استفاده از فایلی به نام robots.txt انجام می شود. گوگل هیچ وقت پولی جهت بررسی مکرر و بیشتر یک سایت قبول نمی کند. در واقع ابزارهای مشابه برای همه وب سایت ها مورد استفاده قرار می گیرد تا ارائه بهترین نتایج برای کاربران تضمین شود.
یافتن اطلاعات بر پایه خزیدن
وب مانند کتابخانه ای در حال رشد با میلیاردها کتاب است و هیچ سیستم بایگانی مرکزی ندارد. گوگل برای پیدا کردن صفحات وب در دسترس عموم از نرم افزاری که تحت عنوان خزنده وب شناخته می شود، استفاده می کند. خزنده ها به صفحات وب نگاه می کنند و لینک های موجود در آن صفحات را دنبال می کنند، دقیقاً مثل زمانی که شما محتوای وب را دنبال می کنید. آن ها از این لینک به لینک دیگر می روند و اطلاعات مربوط به آن صفحات را به سرورهای گوگل برمی گردانند.
سامان دهی اطلاعات با فهرست بندی
هنگامی که خزنده ها یک صفحه وب را پیدا می کنند، سیستم های ما محتوای آن صفحه را اجرا می کنند، درست مثل کاری که مرورگرها انجام می دهند. گوگل سیگنال های کلیدی را یادداشت می کند- از کلمات کلیدی گرفته تا به روز بودن وب سایت – و همه ی آن ها را در فهرست جستجو ردیابی می کند.
فهرست جستجوی گوگل حاوی صدها میلیارد صفحه وب است و اندازه آن بیش از ۱۰۰٫۰۰۰٫۰۰۰ گیگابایت است. این دقیقاً مثل فهرست یک کتاب است (با ثبت هر کلمه ای که در هر صفحه وب فهرست شده ای، دیده می شود). زمانی که یک صفحه وب فهرست بندی می شود، گوگل همه ی کلماتی که در آن وجود دارد را نیز فهرست بندی می کند.
با استفاده از نمودار دانش، موتور جستجوی گوگل همواره در حال تلاش برای عبور از تطبیق صرف کلمات کلیدی است تا مردم، مکان ها و چیزهایی که برای آن ها مهم است را بهتر بشناسد. برای این کار، گوگل نه تنها اطلاعات صفحات وب، بلکه انواع دیگر اطلاعات را نیز سامان دهی می کند. امروزه جستجوگر گوگل می تواند به شما در جستجوی متنی از میلیون ها کتاب موجود در کتابخانه های اصلی، یافتن زمان سفرها از آژانس های حمل و نقل محلی شما کمک کند یا به شما در جستجوی داده ها از منابع عمومی مانند بانک جهانی یاری رساند.
منبع: Google