۳-۴-۲-۲ -۱-۲ -۱ رتبهبندی
با توجه به پرسوجو، ابرجستجوگرها آن را به چند موتورهای جستجو میفرستد، صفحات وب بازیابی شده را رتبه بندی می نماید و آنها را در یک لیست واحد ادغام می نماید. پس از ادغام، مرتبطترین صفحات بازیابی شده باید در بالا باشند. دو روش استفاده شده برای اجرای چنین وظیفه رتبهبندی وجود دارد. اولی فرض می کند که نمرات اولیه توسط هر یک از موتورهای جستجو به صفحات بازیابی اختصاص داده شناخته می شود. هیچ اطلاعاتی در مورد این نمرات از پیش فرض نمیشود[۲,۵۲].
مقیاس استفاده شده در اندازه گیری شباهت در چند موتور جستجو ممکن است متفاوت باشد. بنابراین، نرمال سازی برای رسیدن به یک اقدام مشترک از مقایسه مورد نیاز است. علاوه بر این، قابلیت اطمینان هر موتور جستجو باید در الگوریتم رتبهبندی از طریق یک عامل وزن گنجانیده شود این عامل به طور جداگانه در هر جستجو محاسبه میشود. موتورهای جستجو که صفحات وب بیشتری باز می گردانند باید وزن بالاتر را دریافت کند. این به خاطر این ادراک است که تعداد صفحات وب بازیابی شده مرتبط، متناسب با تعداد کل صفحات وب بازیابی شده به صورت مربوط برای تمام موتورهای جستجو بهرهبرداری شده توسط ابرجستجوگرها است.
از سوی دیگر، امتیازات در موتورهای جستجوی مختلف سازگار و قابل مقایسه نیستند حتی زمانی که نرمال سازی شوند. به عنوان مثال، همان سند، نمره های مختلف را در موتورهای جستجو مختلف دریافت می کند و نتیجه میگیرد که این نمره به جمع آوری سند استفاده شده توسط یک موتور جستجو بستگی دارد. علاوه بر این،مقایسه حتی در میان موتورهای با بهره گرفتن از همان الگوریتم رتبهبندی عملی نیست و ادعا میکند که موتورهای جستجو باید عناصر آماری با نتایج را ارائه کنند[۵۲].
الگوریتم های رتبهبندی وجود دارد که به طور کامل نمرات تعیین شده توسط موتورهای جستجو به صفحات وب بازیابی شده را نادیده میگیرد:
-
- بیز-فیوز: از تئوری احتمال برای محاسبه احتمال یک نتیجه مربوط به پرسوجو استفاده میکند، در حالی که بردا ترکیبی بر اساس رای گیری دموکراتیک است. دومی معتقد است که هر موتور جستجو رای را در نتایج آن را بازمی گرداند، که ارائه دهنده N رای در نتیجه اول، N-1 در دومی، و غیره است. ابرجستجوگرها آرا برای صفحات وب بازیابی شده را از تمام موتورهای جستجو جمع آوری می نمایند و رتبهبندی به طور دموکراتیک با جمع کردن رای تعیین میشود[۵۲].
-
- بردا ترکیبی وزن دار: الگوریتم اتخاذ شده توسط Captain nemo جایگزین Borda ترکیبی وزن دار می شود. در این الگوریتم، موتورهای جستجو به طور یکسان در نظر گرفته نمی شوند، بلکه رای آنها با وزن های وابسته به قابلیت اطمینان هر موتور جستجو در نظر گرفته می شود. این وزن ها توسط کاربران در پروفایل آنها تنظیم می شود. بنابراین، رای هایی که در نتیجه i از موتور جستجو دریافت می کند در فرمول(۳-۷) نشان داده شدهاست که عبارت از[۵۲]:
Eq.(3-7)
که در آن wj وزن موتور جستجوی j است و تعداد نتایج ارائه شده توسط موتور جستجوی k است. صفحات بازیابی شده که در بیش از یک موتور جستجو به نظر میرسد، مجموع رای آنها را دریافت خواهد کرد.
مثال. یک کاربر مدل بازیابی شخصی سازی جدول ۳-۲ را تعریف نموده است.
جدول ۳-۲ مدل بازیابی شخصی[۵۲]
Timeout | Weight | Results | Search Engine |
۶ | ۷ | ۲۰ | SE1 |
۸ | ۱۰ | ۳۰ | SE2 |
۴ | ۵ | ۱۰ | SE3 |
کاربر یک پرسوجو را اجرا می نماید ونتایج را به ترتیب از سه موتور جستجو مشخص شده می گیرد. با توجه به وزن بردا ترکیبی، موتورهای جستجو آرا را به نتایج می دهند. اولین نتیجه از هر موتور جستجو ۵ رای را دریافت می کند، زمانی که بیشترین تعداد نتایج برگردانده شدهاست. جدول ۳-۳ رای دریافت شده توسط موتورهای جستجو را نشان میدهد[۵۲].
جدول ۳-۳ نتایج آرا توسط موتورهای جستجو[۵۲]