توسعه ی تکنیک های وب کاوی به منظور شخصی سازی اطلاعات در موتورهای ...

ارسال شده در 3 آبان 1400 توسط فاطمه کرمانی در بدون موضوع

۳-۴-۲-۲ -۱-۲ -۱ رتبه‌بندی
با توجه به پرس‌و‌جو، ابرجستجوگرها آن را به چند موتورهای جستجو می‌فرستد، صفحات وب بازیابی شده را رتبه بندی می نماید و آن‌ها را در یک لیست واحد ادغام می نماید. پس از ادغام، مرتبط‌ترین صفحات بازیابی شده باید در بالا باشند. دو روش استفاده شده برای اجرای چنین وظیفه رتبه‌بندی وجود دارد. اولی فرض می کند که نمرات اولیه توسط هر یک از موتورهای جستجو به صفحات بازیابی اختصاص داده شناخته می شود. هیچ اطلاعاتی در مورد این نمرات از پیش فرض نمی‌شود[۲,۵۲].

مقیاس استفاده شده در اندازه گیری شباهت در چند موتور جستجو ممکن است متفاوت باشد. بنابراین، نرمال سازی برای رسیدن به یک اقدام مشترک از مقایسه مورد نیاز است. علاوه بر این، قابلیت اطمینان هر موتور جستجو باید در الگوریتم رتبه‌بندی از طریق یک عامل وزن گنجانیده شود این عامل به طور جداگانه در هر جستجو محاسبه می‌شود. موتورهای جستجو که صفحات وب بیشتری باز می گردانند باید وزن بالاتر را دریافت کند. این به خاطر این ادراک است که تعداد صفحات وب بازیابی شده مرتبط، متناسب با تعداد کل صفحات وب بازیابی شده به صورت مربوط برای تمام موتورهای جستجو بهره‌برداری شده توسط ابرجستجوگرها است.
از سوی دیگر، امتیازات در موتورهای جستجوی مختلف سازگار و قابل مقایسه نیستند حتی زمانی که نرمال سازی شوند. به عنوان مثال، همان سند، نمره های مختلف را در موتورهای جستجو مختلف دریافت می کند و نتیجه می‌گیرد که این نمره به جمع آوری سند استفاده شده توسط یک موتور جستجو بستگی دارد. علاوه بر این،مقایسه حتی در میان موتورهای با بهره گرفتن از همان الگوریتم رتبه‌بندی عملی نیست و ادعا می‌کند که موتورهای جستجو باید عناصر آماری با نتایج را ارائه کنند[۵۲].
الگوریتم های رتبه‌بندی وجود دارد که به طور کامل نمرات تعیین شده توسط موتورهای جستجو به صفحات وب بازیابی شده را نادیده می‌گیرد:

- بیز-فیوز: از تئوری احتمال برای محاسبه احتمال یک نتیجه مربوط به پرس‌و‌جو استفاده می‌کند، در حالی که بردا ترکیبی بر اساس رای گیری دموکراتیک است. دومی معتقد است که هر موتور جستجو رای را در نتایج آن را بازمی گرداند، که ارائه دهنده N رای در نتیجه اول، N-1 در دومی، و غیره است. ابرجستجوگرها آرا برای صفحات وب بازیابی شده را از تمام موتورهای جستجو جمع آوری می نمایند و رتبه‌بندی به طور دموکراتیک با جمع کردن رای تعیین می‌شود[۵۲].

- بردا ترکیبی وزن دار: الگوریتم اتخاذ شده توسط Captain nemo جایگزین Borda ترکیبی وزن دار می شود. در این الگوریتم، موتورهای جستجو به طور یکسان در نظر گرفته نمی شوند، بلکه رای آن‌ها با وزن های وابسته به قابلیت اطمینان هر موتور جستجو در نظر گرفته می شود. این وزن ها توسط کاربران در پروفایل آن‌ها تنظیم می شود. بنابراین، رای هایی که در نتیجه i از موتور جستجو دریافت می کند در فرمول(۳-۷) نشان داده شده‌است که عبارت از[۵۲]:

Eq.(3-7)

که در آن wj وزن موتور جستجوی j است و تعداد نتایج ارائه شده توسط موتور جستجوی k است. صفحات بازیابی شده که در بیش از یک موتور جستجو به نظر می‌رسد، مجموع رای آن‌ها را دریافت خواهد کرد.

مثال. یک کاربر مدل بازیابی شخصی سازی جدول ۳-۲ را تعریف نموده است.
جدول ۳-۲ مدل بازیابی شخصی[۵۲]

Timeout	Weight	Results	Search Engine
۶	۷	۲۰	SE1
۸	۱۰	۳۰	SE2
۴	۵	۱۰	SE3

کاربر یک پرس‌و‌جو را اجرا می نماید ونتایج را به ترتیب از سه موتور جستجو مشخص شده می گیرد. با توجه به وزن بردا ترکیبی، موتورهای جستجو آرا را به نتایج می دهند. اولین نتیجه از هر موتور جستجو ۵ رای را دریافت می کند، زمانی که بیشترین تعداد نتایج برگردانده شده‌است. جدول ۳-۳ رای دریافت شده توسط موتورهای جستجو را نشان می‌دهد[۵۲].
جدول ۳-۳ نتایج آرا توسط موتورهای جستجو[۵۲]

مجله علمی: آموزش ها - راه‌کارها - ترفندها و تکنیک‌های کاربردی

آخرین مطالب

مجله علمی: آموزش ها - راه‌کارها - ترفندها و تکنیک‌های کاربردی

جستجو

موضوعات

فیدهای XML