انواع موتور جستجو
1 - موتورهاي عمومي كه در كليه پايگاهها فارغ از نوع آن جستجو مي كنند. موتورهاي عمومي معروف عبارتند از: altavista.com, google.com, go.com, hotbot.com .
2 - موتورهاي تخصصي در يك رشته خاص مانند اخبار "news.com"، تجارت "deja.com"، شركتها "yellow pages.com"،افراد "whowhere.com"، مقالات و انتشارات "infojump.com"
3 - موتورهاي تخصصي در خدمات اينترنت مانند گروههاي خبري و مباحثه "deja.com"، بهترين پايگاه "magellan.com".
4 - موتورهاي كلان ; اين موتورها عبارت مورد جستجو را همزمان به چند موتورجستجو داده و پاسخها را اولويت بندي كرده و با ذكر نام موتور جستجو نمايش مي دهند.مانند mamma.com,savvysearch.com
5 - نقطه شروع ; اينگونه سايتها موتورهاي جستجو را برحسب موضوعات مختلف معرفي مي كنند. درصورتي كه موتورهاي تخصصي و عمومي را نمي شناسيد از اين پايگاهها شروع كنيد. مانند allonesearch.com
6 - موتور اختصاصي پايگاهها; بعضي از پايگاههاي بزرگ مانند مايكروسافت ، جنرال الكتريك ،... از داخل پايگاه خود موتور جستجو دارند. جديدا مي توان از موتورهاي جستجو عمومي مانند hotbot,altavista,... در يك پايگاه جهت جستجو در آن استفاده كرد.
تقسيم بندي ديگري كه از موتور جستجو مي توان كرد، موتورهاي جستجوگر، و دوم موتورهايي است كه پايگاهها را دسته بندي موضوعي كرده اند و به آنها web directoryگفته مي شود. معروفترين آنها webcrawear,yahooاست . درحال حاضر اكثر موتورهاي جستجو دسته بندي موضوعي نيز دارند و در هر دسته و يا زيرشاخه هاي بعدي مي توان جستجو كرد.
نحوه كار موتورهاي جستجو
در اين مقاله فقط نحوه كار موتورهاي عمومي بررسي مي شود. موتورهاي عمومي ازبرنامه هايي معروف به crawler,robot و يا spiderبراي يافتن و مرور صفحات وب استفاده مي كنند. نحوه كار اين برنامه ها بدين صورت است كه با يافتن يك صفحه كلمات مورداستفاده در آن را شناسايي كرده و به جداول فهرست بانك اطلاعاتي خود اضافه مي كنند درواقع موتورها صفحات وب را در بانك اطلاعاتي نگهداري نمي كنند بلكه دربانك اطلاعاتي فهرستي از كلمات وآدرس صفحات مشمول اين كلمات مي باشد.
كار ديگر اين برنامه ها اين است كه به صفحات فهرست شده قبلي مراجعه كرده ودرصورت به روز شدن صفحات ، مجددا آنها را فهرست بندي مي كنند. ممكن است پايگاه موردنظرموجودنبوده وياآدرس آن عوض شده باشد.
عوامل مهم در فهرست كردن يك صفحه وب ، تعداد وقوع كلمه در صفحه ، محل قرارگيري آن ، نوع فايلهاي مورداستفاده در صفحه ، درجه اهميت كلمه در صفحه با توجه به كليد واژه هاي تعيين شده توسط مالك صفحه و توضيحات آمده در بخش دستورات meta در شناسنامه صفحه مي باشد.
موتورهاي جستجو باتوجه به حجم بانك اطلاعاتي و برنامه هايشان به پايگاههاي جديد مراجعه مي كنند ولي مطمئنا تمام پايگاههاي وب را شامل نمي شوند. بزرگترين موتور جستجوي عمومي حدود 500 ميليون صفحه وب را شامل مي شود. درصورتي كه مي خواهيد پايگاه وب شما به بانك اطلاعاتي يك موتور جستجو اضافه شود پايگاه وب خود را به آن موتور جستجو معرفي كنيد در صفحات وب ، در بخش دستورات شناسنامه اي صفحه ، كليد واژه هاي موردنظر خود را معرفي كنيد. موتورهاي جستجوعمومي به دو روش كلمات را فهرست بندي مي كنند.
1- keyword indexing اغلب موتورهاي جستجو براساس كلمات فهرست بندي مي كنند.درواقع درجستجوكلمات هم معني راتشخيص نمي دهند.
concept based indexing - 2براساس مفهوم كلمه فهرست بندي مي كنند. بدين ترتيب كه اگر شما به دنبال كلمه y2kبگرديد، صفحاتي كه كلمات 2000 year problem نيز در نتايج مي آيد.
معروفترين موتوري كه براساس مفهوم جستجو مي كند excite.com مي باشد.
نكته ديگري كه در فهرست بندي بايد بدانيد اين است كه هر موتور چه بخشهايي ازيك صفحه را فهرست مي كند. براي مثال ممكن است فقط hyperlink,heading, titleها ويا چند خط اول صفحه را فهرست كند. در برخي از موتورهاي جستجو مانند opentextمي توان تعيين كرد كه كلمه مورد جستجو در كجاي صفحه باشد. براي مثال در...,heading,title نكته ديگر كلمات معروف به stop word هستند مانندweb,and,or,the,is,an,a و... بعضي از موتورها اين كلمات را درنظر نمي گيرند.
عوامل مهم در انتخاب موتور جستجو
عوامل زيردرانتخاب موتورجستجومهم هستند:
حجم بانك اطلاعاتي موتور جستجو و تعداد صفحات مرور شده توسط آن
به روز بودن بانك اطلاعاتي
تعداد صفحات مرورشده در روز
سرعت برگرداندن نتايج جستجو
تعداد سرويس دهنده هاي آن در شبكه اينترنت جهت كاهش ترافيك و افزايش سرعت
نحوه نمايش نتايج جستجو و كنترل آن توسط كاربر
نحوه اولويت بندي نتايج حاصله و ارتباط آنها با يكديگر و كنترل آن توسط كاربر
راحتي استفاده
صفحات معرفي شده به آن طي چند روز در فهرست قرار مي گيرند
پشتيباني ,imagemap,frameامنيت در پايگاهها
قابليت جستجو در نتايج
پشتيباني stop words
حساس به حروف بزرگ و كوچك
پشتيباني عبارت
عدم محدوديت درتعدادحروف عبارت جستجو
دسته بندي موضوعي وامكان جستجودرهردسته
جستجو در خدمات اينترنت شامل وب ، گروههاي خبري و مباحثه ،...
پشتيباني عملگرهاي جستجو
پشتيباني زبانهاي مختلف وتبديل زبانهابه يكديگر
جستجو براساس تاريخ
ارائه امكانات بهتر از جمله ارسال نتايج به آدرس پست الكترونيك ، ارائه تبليغات "banner" مرتبط با عبارت .
جستجو براساس نوع فايل مانند تصوير
جستجو در مكان خاصي از صفحه وب
جستجو در دستورات "tag" صفحه وب
ارائه كليد واژه ها و نتايج مشابه
عملگرهاي جستجو
عملگر REQUIRED TERM "+" وقتي اين عملگر در كنار يك كلمه مي آيد به معني اين است كه كلمه موردنظر حتما در صفحه باشد.
عملگر PROHIBITED TERM"-" با گذاشتن اين عملگر كنار كلمه ، صفحاتي آورده مي شود كه كلمه موردنظر در آن نباشد، در مثال language-english +تمام صفحاتي آورده مي شود كه كلمه language در آن باشد ولي زبان english در آنها نباشد.
عملگر PROXIMITY كلمات موردنظر در كنار هم و يا نزديك هم باشند. با عملگرnear/n دو كلمه به تعداد n كلمه نزديك يكديگر باشند. با عملگر followed byمابين دوكلمه ، دوكلمه دقيقا در كنار هم و با ترتيب قيدشده بيايند. موتور جستجوي webcrawler قويترين موتور در زمينه PROXIMITY است .
عملگرWILDCARD"* ويا$" با اين عملگر براي مثال radio* تمام صفحاتي كه كلمه radio و مشتقات آن را داشته باشد مي آورد. مثل كلمه radiology، باتوجه به موتور،تعداد حروف آورده شده بعداز كلمه متفاوت خواهدبود.
عملگر منطقي BOOLEAN شامل
AND NOT, OR, AND با استفاده از ANDمابين دوكلمه صفحاتي كه هم كلمه اول وهم كلمه دوم را شامل شود مي آورد. با استفاده ORمابين دوكلمه ، صفحاتي كه يا كلمه اول و يا كلمه دوم را شامل شود مي آورد.
بااستفاده AND NOT مابين دوكلمه ، صفحاتي آورده مي شود كه شامل كلمه اول باشد و حتي شامل كلمه دوم نباشد. بجاي عبارت AND NOT,OR,AND مي توان ازنشانه هاي آن استفاده كرد:
& به جاي AND، ا به جاي OR و ! به جاي NOT
گروهبندي منطقي با استفاده از پرانتز () مثل : iran and "tourism or hotel"
استفاده از quotation mark براي مشخص كردن عبارت . " search engine" دقيقا دوكلمه به صورت يك عبارت در صفحه باشد. مي توان براي مشخص كردن عبارت ازعلامت |;بين كلمات استفاده كرد.
بسياري از موتورهاي جستجو در دو حالت ساده و پيشرفته "advanced" جستجومي كنند. معمولا درحالت پيشرفته ، عملگرهاي منطقي و PROXIMITY قابل استفاده مي باشد.
چگونه جستجوي بهتري انجام دهيم
بخاطر داشته باشيد كليد جستجوي موفق در اين است كه شما باهوش تر از كامپيوترهستيد.
ابتدا ببينيدكه به دنبال چه موضوعي هستيد باتوجه به انواع موتور جستجو كه درابتداي مقاله ذكر شد، موتور خود را انتخاب كنيد. قبل از جستجو لازم است با مراجعه به برنامه helpهر موتور دستورالعمل هاي آن را مطالعه كنيد تا حداكثراستفاده ازآن رابكنيد.عملگرهاي گفته شده دربالا معمولا دراكثرموتورهاقابل استفاده هستند.
علاوه بر نكات قيدشده در مقاله رعايت نكات ذيل كمك بسياري در انجام جستجوي بهتر دارد:
1 - از حروف بزرگ براي جستجو اسامي خاص ، شركتها و محصولات استفاده كنيد. درانگليسي بسياري از كلمات عام و خاص هستند مثلORACLE كه به معني الهام غيبي است ولي به صورت خاص ORACLE يك RDBMSاست .
2 - بعضي از كلمات از ساير كلمات مشتق شده است كوچكترين آن مجموعه را بدهيد.
3 - از كلمات مفرد استفاده كنيد جمع آن نيز در نتايج خواهدآمد.
4 - اگر تلفظ صحيح يك كلمه را نمي دانيد چند تلفظ را با هم بدهيد مثل : dostoyevski dostoevski dostoevsky
5 - از عبارت استفاده كنيد " best search engine "
6 - چند مترادف كلمه را باهم بدهيد.
secure security privacy safe
7 - مي توان درجه بندي نتايج را كنترل كرد و يا مي توان به يك كلمه در يك عبارت وزن بيشتري دادبراي مثال shopping shopping shopping mall
8 - از كلمات عمومي مثل كتاب car استفاده نكنيد بلكه با استفاده از عبارت ، دقيقا دريك زمينه ســــوال كنيـد بــــراي مثــــال اگر مي خواهيد ماشين بخريد نام ماشين و
شهر موردنظر خود را وارد كنيد
"toyota dealership" and texas
9 - بسياري از موتورهاي جستجو در كنار نتايج حاصله similar sites دارند كه امكان دسترسي به نتايج بهتر را مي دهند.
10 - تاريخ صفحات را مشخص كنيد.
11 - نوع زبان را مشخص كنيد.
در انتها پايگاههايي هستند كه مي توان از طريق آنها استراتژي جستجو را تعريف كرد.باتوجه به عوامل مهم ازنظر شما، موتور جستجوي مناسب را معرفي مي كند. نمونه آن noodlequest.com است .
منبع:imi.ir
1 - موتورهاي عمومي كه در كليه پايگاهها فارغ از نوع آن جستجو مي كنند. موتورهاي عمومي معروف عبارتند از: altavista.com, google.com, go.com, hotbot.com .
2 - موتورهاي تخصصي در يك رشته خاص مانند اخبار "news.com"، تجارت "deja.com"، شركتها "yellow pages.com"،افراد "whowhere.com"، مقالات و انتشارات "infojump.com"
3 - موتورهاي تخصصي در خدمات اينترنت مانند گروههاي خبري و مباحثه "deja.com"، بهترين پايگاه "magellan.com".
4 - موتورهاي كلان ; اين موتورها عبارت مورد جستجو را همزمان به چند موتورجستجو داده و پاسخها را اولويت بندي كرده و با ذكر نام موتور جستجو نمايش مي دهند.مانند mamma.com,savvysearch.com
5 - نقطه شروع ; اينگونه سايتها موتورهاي جستجو را برحسب موضوعات مختلف معرفي مي كنند. درصورتي كه موتورهاي تخصصي و عمومي را نمي شناسيد از اين پايگاهها شروع كنيد. مانند allonesearch.com
6 - موتور اختصاصي پايگاهها; بعضي از پايگاههاي بزرگ مانند مايكروسافت ، جنرال الكتريك ،... از داخل پايگاه خود موتور جستجو دارند. جديدا مي توان از موتورهاي جستجو عمومي مانند hotbot,altavista,... در يك پايگاه جهت جستجو در آن استفاده كرد.
تقسيم بندي ديگري كه از موتور جستجو مي توان كرد، موتورهاي جستجوگر، و دوم موتورهايي است كه پايگاهها را دسته بندي موضوعي كرده اند و به آنها web directoryگفته مي شود. معروفترين آنها webcrawear,yahooاست . درحال حاضر اكثر موتورهاي جستجو دسته بندي موضوعي نيز دارند و در هر دسته و يا زيرشاخه هاي بعدي مي توان جستجو كرد.
نحوه كار موتورهاي جستجو
در اين مقاله فقط نحوه كار موتورهاي عمومي بررسي مي شود. موتورهاي عمومي ازبرنامه هايي معروف به crawler,robot و يا spiderبراي يافتن و مرور صفحات وب استفاده مي كنند. نحوه كار اين برنامه ها بدين صورت است كه با يافتن يك صفحه كلمات مورداستفاده در آن را شناسايي كرده و به جداول فهرست بانك اطلاعاتي خود اضافه مي كنند درواقع موتورها صفحات وب را در بانك اطلاعاتي نگهداري نمي كنند بلكه دربانك اطلاعاتي فهرستي از كلمات وآدرس صفحات مشمول اين كلمات مي باشد.
كار ديگر اين برنامه ها اين است كه به صفحات فهرست شده قبلي مراجعه كرده ودرصورت به روز شدن صفحات ، مجددا آنها را فهرست بندي مي كنند. ممكن است پايگاه موردنظرموجودنبوده وياآدرس آن عوض شده باشد.
عوامل مهم در فهرست كردن يك صفحه وب ، تعداد وقوع كلمه در صفحه ، محل قرارگيري آن ، نوع فايلهاي مورداستفاده در صفحه ، درجه اهميت كلمه در صفحه با توجه به كليد واژه هاي تعيين شده توسط مالك صفحه و توضيحات آمده در بخش دستورات meta در شناسنامه صفحه مي باشد.
موتورهاي جستجو باتوجه به حجم بانك اطلاعاتي و برنامه هايشان به پايگاههاي جديد مراجعه مي كنند ولي مطمئنا تمام پايگاههاي وب را شامل نمي شوند. بزرگترين موتور جستجوي عمومي حدود 500 ميليون صفحه وب را شامل مي شود. درصورتي كه مي خواهيد پايگاه وب شما به بانك اطلاعاتي يك موتور جستجو اضافه شود پايگاه وب خود را به آن موتور جستجو معرفي كنيد در صفحات وب ، در بخش دستورات شناسنامه اي صفحه ، كليد واژه هاي موردنظر خود را معرفي كنيد. موتورهاي جستجوعمومي به دو روش كلمات را فهرست بندي مي كنند.
1- keyword indexing اغلب موتورهاي جستجو براساس كلمات فهرست بندي مي كنند.درواقع درجستجوكلمات هم معني راتشخيص نمي دهند.
concept based indexing - 2براساس مفهوم كلمه فهرست بندي مي كنند. بدين ترتيب كه اگر شما به دنبال كلمه y2kبگرديد، صفحاتي كه كلمات 2000 year problem نيز در نتايج مي آيد.
معروفترين موتوري كه براساس مفهوم جستجو مي كند excite.com مي باشد.
نكته ديگري كه در فهرست بندي بايد بدانيد اين است كه هر موتور چه بخشهايي ازيك صفحه را فهرست مي كند. براي مثال ممكن است فقط hyperlink,heading, titleها ويا چند خط اول صفحه را فهرست كند. در برخي از موتورهاي جستجو مانند opentextمي توان تعيين كرد كه كلمه مورد جستجو در كجاي صفحه باشد. براي مثال در...,heading,title نكته ديگر كلمات معروف به stop word هستند مانندweb,and,or,the,is,an,a و... بعضي از موتورها اين كلمات را درنظر نمي گيرند.
عوامل مهم در انتخاب موتور جستجو
عوامل زيردرانتخاب موتورجستجومهم هستند:
حجم بانك اطلاعاتي موتور جستجو و تعداد صفحات مرور شده توسط آن
به روز بودن بانك اطلاعاتي
تعداد صفحات مرورشده در روز
سرعت برگرداندن نتايج جستجو
تعداد سرويس دهنده هاي آن در شبكه اينترنت جهت كاهش ترافيك و افزايش سرعت
نحوه نمايش نتايج جستجو و كنترل آن توسط كاربر
نحوه اولويت بندي نتايج حاصله و ارتباط آنها با يكديگر و كنترل آن توسط كاربر
راحتي استفاده
صفحات معرفي شده به آن طي چند روز در فهرست قرار مي گيرند
پشتيباني ,imagemap,frameامنيت در پايگاهها
قابليت جستجو در نتايج
پشتيباني stop words
حساس به حروف بزرگ و كوچك
پشتيباني عبارت
عدم محدوديت درتعدادحروف عبارت جستجو
دسته بندي موضوعي وامكان جستجودرهردسته
جستجو در خدمات اينترنت شامل وب ، گروههاي خبري و مباحثه ،...
پشتيباني عملگرهاي جستجو
پشتيباني زبانهاي مختلف وتبديل زبانهابه يكديگر
جستجو براساس تاريخ
ارائه امكانات بهتر از جمله ارسال نتايج به آدرس پست الكترونيك ، ارائه تبليغات "banner" مرتبط با عبارت .
جستجو براساس نوع فايل مانند تصوير
جستجو در مكان خاصي از صفحه وب
جستجو در دستورات "tag" صفحه وب
ارائه كليد واژه ها و نتايج مشابه
عملگرهاي جستجو
عملگر REQUIRED TERM "+" وقتي اين عملگر در كنار يك كلمه مي آيد به معني اين است كه كلمه موردنظر حتما در صفحه باشد.
عملگر PROHIBITED TERM"-" با گذاشتن اين عملگر كنار كلمه ، صفحاتي آورده مي شود كه كلمه موردنظر در آن نباشد، در مثال language-english +تمام صفحاتي آورده مي شود كه كلمه language در آن باشد ولي زبان english در آنها نباشد.
عملگر PROXIMITY كلمات موردنظر در كنار هم و يا نزديك هم باشند. با عملگرnear/n دو كلمه به تعداد n كلمه نزديك يكديگر باشند. با عملگر followed byمابين دوكلمه ، دوكلمه دقيقا در كنار هم و با ترتيب قيدشده بيايند. موتور جستجوي webcrawler قويترين موتور در زمينه PROXIMITY است .
عملگرWILDCARD"* ويا$" با اين عملگر براي مثال radio* تمام صفحاتي كه كلمه radio و مشتقات آن را داشته باشد مي آورد. مثل كلمه radiology، باتوجه به موتور،تعداد حروف آورده شده بعداز كلمه متفاوت خواهدبود.
عملگر منطقي BOOLEAN شامل
AND NOT, OR, AND با استفاده از ANDمابين دوكلمه صفحاتي كه هم كلمه اول وهم كلمه دوم را شامل شود مي آورد. با استفاده ORمابين دوكلمه ، صفحاتي كه يا كلمه اول و يا كلمه دوم را شامل شود مي آورد.
بااستفاده AND NOT مابين دوكلمه ، صفحاتي آورده مي شود كه شامل كلمه اول باشد و حتي شامل كلمه دوم نباشد. بجاي عبارت AND NOT,OR,AND مي توان ازنشانه هاي آن استفاده كرد:
& به جاي AND، ا به جاي OR و ! به جاي NOT
گروهبندي منطقي با استفاده از پرانتز () مثل : iran and "tourism or hotel"
استفاده از quotation mark براي مشخص كردن عبارت . " search engine" دقيقا دوكلمه به صورت يك عبارت در صفحه باشد. مي توان براي مشخص كردن عبارت ازعلامت |;بين كلمات استفاده كرد.
بسياري از موتورهاي جستجو در دو حالت ساده و پيشرفته "advanced" جستجومي كنند. معمولا درحالت پيشرفته ، عملگرهاي منطقي و PROXIMITY قابل استفاده مي باشد.
چگونه جستجوي بهتري انجام دهيم
بخاطر داشته باشيد كليد جستجوي موفق در اين است كه شما باهوش تر از كامپيوترهستيد.
ابتدا ببينيدكه به دنبال چه موضوعي هستيد باتوجه به انواع موتور جستجو كه درابتداي مقاله ذكر شد، موتور خود را انتخاب كنيد. قبل از جستجو لازم است با مراجعه به برنامه helpهر موتور دستورالعمل هاي آن را مطالعه كنيد تا حداكثراستفاده ازآن رابكنيد.عملگرهاي گفته شده دربالا معمولا دراكثرموتورهاقابل استفاده هستند.
علاوه بر نكات قيدشده در مقاله رعايت نكات ذيل كمك بسياري در انجام جستجوي بهتر دارد:
1 - از حروف بزرگ براي جستجو اسامي خاص ، شركتها و محصولات استفاده كنيد. درانگليسي بسياري از كلمات عام و خاص هستند مثلORACLE كه به معني الهام غيبي است ولي به صورت خاص ORACLE يك RDBMSاست .
2 - بعضي از كلمات از ساير كلمات مشتق شده است كوچكترين آن مجموعه را بدهيد.
3 - از كلمات مفرد استفاده كنيد جمع آن نيز در نتايج خواهدآمد.
4 - اگر تلفظ صحيح يك كلمه را نمي دانيد چند تلفظ را با هم بدهيد مثل : dostoyevski dostoevski dostoevsky
5 - از عبارت استفاده كنيد " best search engine "
6 - چند مترادف كلمه را باهم بدهيد.
secure security privacy safe
7 - مي توان درجه بندي نتايج را كنترل كرد و يا مي توان به يك كلمه در يك عبارت وزن بيشتري دادبراي مثال shopping shopping shopping mall
8 - از كلمات عمومي مثل كتاب car استفاده نكنيد بلكه با استفاده از عبارت ، دقيقا دريك زمينه ســــوال كنيـد بــــراي مثــــال اگر مي خواهيد ماشين بخريد نام ماشين و
شهر موردنظر خود را وارد كنيد
"toyota dealership" and texas
9 - بسياري از موتورهاي جستجو در كنار نتايج حاصله similar sites دارند كه امكان دسترسي به نتايج بهتر را مي دهند.
10 - تاريخ صفحات را مشخص كنيد.
11 - نوع زبان را مشخص كنيد.
در انتها پايگاههايي هستند كه مي توان از طريق آنها استراتژي جستجو را تعريف كرد.باتوجه به عوامل مهم ازنظر شما، موتور جستجوي مناسب را معرفي مي كند. نمونه آن noodlequest.com است .
منبع:imi.ir