|
Article on other languages:
|
جویشگر[۱] یا موتور جستجو (به انگلیسی: Search Engine)، در فرهنگ رایانه، به طور عمومی به برنامهای گفته میشود که کلمات کلیدی را در یک سند یا بانک اطلاعاتی جستجو میکند. در اینترنت به برنامهای گفته میشود که کلمات کلیدی موجود در فایلها و سندهای وب جهانی، گروههای خبری، منوهای گوفر و آرشیوهای FTP را جستجو میکند. برخی از جویشگرها برای تنها یک وبگاه(پایگاه وب) اینترنت به کار برده میشوند و در اصل جویشگری اختصاصی آن وبگاه هستند و تنها محتویات همان وبگاه را جستجو میکنند. برخی دیگر نیز ممکن است با استفاده از SPIDERها محتویات وبگاههای زیادی را پیمایش کرده و چکیدهای از آن را در یک پایگاه اطلاعاتی به شکل شاخصگذاریشده نگهداری میکنند. کاربران سپس میتوانند با جستجو کردن در این پایگاه داده به پایگاه وبی که اطلاعات موردنظر آنها را در خود دارد پی ببرند.
انواع جویشگرها در اینترنتجویشگرها به دو دسته کلی تقسيم میشوند. جویشگرهای پيمايشی (خودکار) و فهرستهای تکميلدستی (غیر خودکار). هر کدام از آنها برای تکميل فهرست خود از روشهای متفاوتی استفاده میکنند البته لازم به ذكر است كه گونهاي جديد از جویشگرها تحت عنوان "ابرجویشگر" (Meta Search Engines) نيز وجود دارد كه در ادامه به توضيح هر يك از اين موارد خواهيم پرداخت : جویشگرهای پيمايشیجویشگرهای پيمايشی (Crawler-Based Search Engines) مانند گوگل فهرست خود را بصورت خودکار تشکيل میدهند. آنها وب را پيمايش کرده، اطلاعاتی را ذخیره میکنند، سپس کاربران از میان این اطلاعات ذخیره شده، آنچه را که میخواهند جستجو میکنند. اگر شما در صفحه وب خود تغييراتی را اعمال نماييد، جویشگرهای پيمايشی آنها را به طور خودکار میيابند و سپس اين تغييرات در فهرستها اعمال خواهد شد. عنوان، متن و ديگر عناصر صفحه، همگی در این فهرست قرار خواهند گرفت.وجه مشخصه این گروه از جویشگرها وجود نرم افزار موسوم به SPIDER در آنهاست. این شبه نرمافزار کوچک بصورت خودکار به کاوش در شبکه جهانی پرداخته و از پایگاههای وب یادداشتبرداری و فهرستبرداری میکند سپس این اطلاعات را برای تجزیه و تحلیل و طبقهبندی به بانک اطلاعاتی جویشگر تحویل میدهد. فهرستهای دستنویس شدهفهرستهای دستنویسشده يا (Human-Powered Directories) مانند فهرست بازی (Open Directory) مانند Dmoz وابسته به کاربرانی است که آن را تکميل میکنند. شما صفحه مورد نظر را به همراه توضيحی كوتاه در فهرست ثبت میکنيد يا اين کار توسط ويراستارهايی که برای آن فهرست در نظر گرفته شده، انجام میشود. عمل جستجو در اين حالت تنها بر روی توضيحات ثبت شده صورت میگيرد و در صورت تغيير روی صفحه وب، روی فهرست تغييری به وجود نخواهد آورد. چيزهايی که برای بهبود يک فهرستبندی در يک جویشگر مفيد هستند، تأثيری بر بهبود فهرستبندی يک دايرکتوری ندارند. تنها استثناء اين است که يک سايت خوب با پايگاه دادهای با محتوای خوب شانس بيشتری نسبت به يک سايت با پايگاه داده ضعيف دارد. البته در مورد جویشگرهای مشهور مانند گوگل و یاهو، یک مولفه دیگر هم برای بهبود فهرستبندی وجود دارد که کمک مالی (یا به اصطلاح اسپانسر) است، یعنی وبگاههایی که مایل به بهبود مکان وبگاه خود در فهرست بندی هستند، میتوانند با پرداخت پول به این جویشگرها به هدف خویش برسند. جویشگرهای ترکيبی با نتايج مختلفبه موتورهايی گفته میشود که هر دو حالت را در کنار هم نمايش میدهند. غالباً، يک جویشگر ترکيبی در صورت نمايش نتيجه جستجو از هر يک از دستههای فوق، نتايج حاصل از دسته ديگر را هم مورد توجه قرار میدهد. مثلاً جویشگر ام.اس.ان (MSN) بيشتر نتايج حاصل از فهرستهای تکميلدستی را نشان میدهد اما در کنار آن نيم نگاهی هم به نتايج حاصل از جستجوی پيمايشی دارد. 1 ابرجویشگرهااين گونه جديد از جویشگرها كه قدمت چندانی نيز ندارند، بصورت همزمان از چندین جویشگر برای کاوش در شبکه برای کلید واژه مورد نظر استفاده میکنند. بدين معنی كه اين جویشگر عبارت مورد نظر شما را در چندين جویشگر ِ دیگر جستجو کرده و نتايج آنها را با هم تركيب كرده و يك نتيجه كلی به شما ارائه میدهد. بهعنوان مثال جویشگر داگ پايل [۱] از نتايج حاصل از موتورهای Google - Yahoo - MSN و ASK استفاده كرده و نتيجه حاصله را به شما ارائه میدهد.لازم به ذکر است که روش و یا راهکار مشخص و یکسانی برای ترکیب نتایج حاصله از موتورهای پایه - موتورهایی که به عنوان جویشگر استفاده میشوند مانند Yahoo که یک موتور پایه برای dogpile میباشد - وجود ندارد.اما dogpile قابلیت جستجو به همه زبانها را نداردو ظاهرا فقط کلمات انگلیسی را پیدا می کند بررسی يک جویشگر پيمايشیجویشگرهای پيمايشی شامل سه عنصر اصلی هستند. اولی در اصطلاح عنکبوت (Spider) است که پيمايشگر (Crawler) هم ناميده میشود. پيمايشگر همين که به يک صفحه میرسد، آن را میخواند و سپس پيوندهای آن به صفحات ديگر را دنبال مینمايد. اين چيزیست که برای يک سايت پيمايششده (Crawled) اتفاق افتاده است. پيمايشگر با يک روال منظم، مثلاً يک يا دو بار در ماه به سايت مراجعه میکند تا تغييرات موجود در آن را بيابد. هر چيزی که پيمايشگر بيابد به عنصر دوم يک جویشگر يعنی فهرست انتقال پيدا میکند. فهرست اغلب به کاتالوگی بزرگ اطلاق میشود که شامل ليستی از آنچه است که پيمايشگر يافته است. مانند کتاب عظيمی که فهرستی را از آنچه پيمايشگرها از صفحات وب يافتهاند، شامل شده است. هرگاه سايتی دچار تغيير شود، اين فهرست نيز به روز خواهد شد. از زمانی که تغييری در صفحهای از سايت ايجاد شده تا هنگامی که آن تغيير در فهرست جویشگر ثبت شود مدت زمانی طول خواهد کشيد. پس ممکن است که يک سايت پيمايششده باشد اما فهرستشده نباشد. تا زمانی که اين فهرستبندی برای آن تغيير ثبت نشده باشد، نمیتوان انتظار داشت که در نتايج جستجو آن تغيير را ببينيم. نرمافزار جویشگر، سومين عنصر يک جویشگر است و به برنامهای اطلاق میشود که به صورت هوشمندانهای دادههای موجود در فهرست را دستهبندی کرده و آنها را بر اساس اهميت طبقهبندی میکند تا نتيجه جستجو با کلمههای درخواست شده هر چه بيشتر منطبق و مربوط باشد. رتبهبندی صفحات وب توسط جویشگرهاوقتی شما از جویشگرهای پيمايشی چيزی را برای جستجو درخواست مینماييد، تقريباً بلافاصله اين جستجو از ميان ميليونها صفحه صورت گرفته و مرتب میشود بطوريکه مربوطترين آنها نسبت به موضوع مورد درخواست شما رتبه بالاتری را احراز نمايد. البته بايد در نظر داشته باشيد که جویشگرها همواره نتايج درستی را به شما ارائه نخواهند داد و مسلماً صفحات نامربوطی را هم در نتيجه جستجو دريافت میکنيد و گاهی اوقات مجبور هستيد که جستجوی دقيقتری را برای آنچه میخواهيد انجام دهيد اما جویشگرها کار حيرتانگيز ديگری نيز انجام میدهند. فرض کنيد که شما به يک کتابدار مراجعه میکنيد و از وی درباره «سفر» کتابی میخواهيد. او برای اين که جواب درستی به شما بدهد و کتاب مفيدی را به شما ارائه نمايد با پرسيدن سؤالاتی از شما و با استفاده از تجارب خود کتاب مورد نظرتان را به شما تحويل خواهد داد. جویشگرها همچنين توانايی ندارند اما به نوعی آنها را شبيهسازی میکنند. پس جویشگرهای پيمايشی چگونه به پاسخ مورد نظرتان از ميان ميليونها صفحه وب میرسند؟ آنها يک مجموعه از قوانين را دارند که الگوريتم ناميده میشود. الگوريتمهای مورد نظر برای هر جویشگری خاص و تقريباً سری هستند اما به هر حال از قوانين زير پيروی میکنند: مکان و بسامديکی از قوانين اصلی در الگوريتمهای رتبهبندی موقعيت و بسامد (تعداد تکرار) واژههایی است که در صفحه مورد استفاده قرار گرفتهاند که بطور خلاصه روش مکان-بسامد (Location/Frequency Methode) ناميده میشود. کتابدار مذکور را به خاطر میآورِد؟ لازم است که او کتابهای در رابطه با واژه «سفر» را طبق درخواست شما بيابد. او در وحله اول احساس میکند که شما به دنبال کتابهايی هستيد که در نامشان کلمه «سفر» را شامل شوند. جویشگرها هم دقيقاً همان کار را انجام میدهند. آنها هم صفحاتی را برايتان فهرست میکنند که در برچسب عنوان (Title) موجود در کد زبان نشانهگذاری اَبَرمتنی (زنگام) (HTML) حاوی واژه «سفر» باشند. جویشگرها همچنين به دنبال واژه مورد نظر در بالای صفحات و يا در آغاز بندها (پاراگرافها) هستند. آنها فرض میکنند که صفحاتی که حاوی آن واژه در بالای خود و يا در آغاز بندها و عناوين باشند به نتيجه مورد نظر شما مربوطتر هستند. بسامد عامل بزرگ و مهم ديگری است که جویشگرها از طريق آن صفحات مربوط را شناسايی مینمايند. جویشگرها صفحات را تجزيه کرده و با توجه به تکرار واژهای در صفحه متوجه میشوند که آن واژه نسبت به ديگر واژهها اهميت بيشتری در آن صفحه دارد و آن صفحه را در درجه بالاتری نسبت به صفحات ديگر قرار میدهند. چگونگی کارکرد دقيق جویشگرها درباره روشهايی از قبيل مکان-تکرار فاش نمیشود و هر جویشگري روش ویژهٔ خود را دنبال میکند. به همين دليل است که وقتی شما واژههای همانندی را در موتورهای متفاوت جستجو میکنيد، به نتايج متفاوتی میرسيد. الگوریتمهای اولیه جویشگرهای معتبر و بزرگ همچنان محرمانه نگهداری می شوند. برخی جویشگرها نسبت به برخی ديگر صفحات بيشتری را فهرست کردهاند. نتيجه اين خواهد شد که هيچ جویشگري نتيجه جستجوی مشترکی با موتور ديگر نخواهد داشت و شما نتايج متفاوتی را از آنها دريافت میکنيد. جویشگرها همچنين ممکن است که برخي از صفحات را از فهرست خود حذف کنند البته به شرطی که آن صفحات با هرزنامه (Spam) شدن سعی در گول زدن جویشگرها داشته باشند. فرستادن هرزنامه (Spamming) روشی است که برخی از صفحات برای احراز رتبه بالاتر در جویشگرها در پيش میگيرند و آن به اين صورت است که با تکرار بيش از حد واژهها و یا بزرگ نوشتن یا بسیار ریز نوشتن متنها بطور عمدی كوشش در بر هم زدن تعادل و در نتيجه فريب جویشگرها دارند. آنها سعی دارند که با افزايش عامل تکرار، در رتبه بالاتری قرار بگيرند. البته آنگونه که گفته شد تعداد تکرارها اگر از حد و اندازه خاصی فراتر رود نتیجه معکوس میدهد. جویشگرها راههای متنوعی برای جلوگيری از فرستادن هرزنامه دارند و در اين راه از گزارشهای کاربران خود نيز بهره میبرند. امروزه بهینهسازی سایتهای اینترنت برای جویشگرها یکی از مهمترین روشهای جلب بازدیدکننده به سایت است. عوامل خارج از صفحهجویشگرهای گردشی اکنون تجربه فراوانی در رابطه با وبدارهايی دارند که صفحات خود را برای کسب رتبه بهتر مرتباً بازنويسی میکنند. بعضی از وبدارها (وبمسترها)ی خبره حتی ممکن است به سمت روشهايی مانند مهندسی معکوس برای کشف چگونگی روشهای مکان-تکرار بروند. به همين دليل، تمامی جویشگرهای معروف از روشهای امتيازبندی «خارج از صفحه» استفاده میکنند. عوامل خارج از صفحه عواملی هستند که از تيررس وبدارها خارجند و آنها نمیتوانند در آن دخالت کنند و مسأله مهم در آن تحليل ارتباطات و پيوندهاست. به وسيله تجزيه صفحات، جویشگرها پيوندها را بررسی کرده و از محبوبيت آنها میفهمند که آن صفحات مهم بوده و شايسته ترفيع رتبه هستند. به علاوه تکنيکهای پيشرفته به گونهای است که از ايجاد پيوندهای مصنوعی توسط وبدارها برای فريب جویشگرها جلوگيری مینمايد. علاوه بر آن جویشگرها بررسی میکنند که کدام صفحه توسط يک کاربر که واژهای را جستجو کرده انتخاب میشود و سپس با توجه به تعداد انتخابها، رتبه صفحه مورد نظر را تعيين کرده و مقام آن را در نتيجه جستجو جابهجا مینمايند. سرفصل هاي بهينه سازي
پانویسمنابع |
This article is from Wikipedia. All text is available under the terms of the GNU Free Documentation License.
Mercedes Car
This site monitored by SitePinger.net