ربات ها و بهینه سازی سایت برای موتورهای جستجو

با اینکه فایل robots.txt نقش مهمی در رتبه دهی موتورهای جستجو دارد اما اکثر سایتها فاقد آن هستند. اگر سایت شما فایل robots.txt ندارد، با خواندن این مقاله ساخت آن برایتان آسان خواهد بود، حتی اگر سایت شما فایل robots.txt داشته باشد خواندن این مقاله به شما کمک خواهد کرد تا فایلتان خطایی نداشته باشد.

موتورهای جستجو از دو طریق به سایت ها سرکشی می‌کنند، یا شما از طریق صفحه ای مشخص آنرا به موتور جستجو معرفی کرده اید و یا موتورهای جستجو از طریق سایتهای دیگر و دنبال کردن لینکها به سایت شما رسیده اند. اولین کاری که ربات بعد از شناسایی سایت شما انجام می دهد اینست که به دنبال فایلی با نام robots.txt در ریشه سایت شما می‌گردد. این فایل، ربات جستجوگر را برای سرکشی و یا عدم سرکشی صفحه یا صفحاتی از سایت راهنمایی می‌کند. این فایل بخش مهمی از سایت شما می باشد که نقشی مانند سیستم کنترل کننده ترافیک در یک شهر را دارد. همچنین این فایل نقش مهمی در جلوگیری از اسپم دارد، بطوری که دسترسی رباتهای مخرب را به محتوای سایت محدود می سازد تا امکان کپی برداری از کدهای سایت، اسناد وعکسهای شخصی شما به حداقل برسد. این راهنما همچنین از مصرف بیهوده پهنای باند جلوگیری می کند.

فایل robots.txt یک فایل ساده متنی بدون هیچ قالب خاصی است، البته باید توجه داشته باشید که نام فایل همگی با حروف کوچک ذخیره شده باشند.

robots.txt Sample

در تصویر بالا شکل ساده ای از فایل robots.txt را مشاهده می‌کنید که در آن User-agent نام ربات جستجوگر را مشخص می‌کند و علامت *  به مفهوم تمامی رباتها می باشد که عموما از آن استفاده می شود، هر چند شما می توانید نام رباتهای مورد نظرتان را بنویسید. Disallow تنها در یک سطر، مجوز دسترسی رباتها به تمام قسمتهای سایت می باشد. اگر می خواهید ربات دسترسی به هیچکدام از بخشهای سایت نداشته باشد کافیست یک اسلش(/) در مقابل Disallow اضافه کنید. برای روشن شدن مطلب در ادامه چند مثال آورده شده است.

دسترسی کامل به تمام قسمتهای سایت برای تمامی رباتها

robots.txt Sample

عدم دسترسی به قسمتهای مختلف سایت برای تمامی رباتها

robots.txt Sample

عدم دسترسی به بخشهای مشخصی از سایت برای تمامی رباتها

robots.txt Sample
عدم دسترسی به قسمتهای مختلف سایت برای ربات مشخص شده

robots.txt Sample

برای عدم دسترسی به یک صفحه از سایت می توانید از عبارت زیر استفاده کنید

robots.txt Sample

برای عدم دسترسی به نوع خاصی از فایلهای موجود در سایت می توانید از عبارت زیر استفاده کنید(مثلا برای فایلهای doc)

robots.txt Sample

همچنین شما می توانید نقشه سایت را در این فایل مشخص کنید

robots.txt sample

نقشه سایت بیش از لیست آدرس ها در فرمت  XML هست. در نقشه سایت می توان اطلاعات مربوط به صفحه ای خاص را مشخص کرد، مانند تاریخ آخرین تغییر (اگر وب سرور شما تاریخ تغییر محتوای را ذخیره ننماید)، و نیز فرکانس آن صفحه. همچنین نقشه سایت برچسب اولویت صفحه ای را که از نطر شما مهم است برای ربات مشخص می کند. اگرچه بطور کامل مشخص نیست که هر یک از موتورهای جستجو چقدر از این برچسب  برای رتبه دهی استفاده می کنند. این سایت توضیحات کاملی در مورد نقشه سایت و همچنین قالب آن ارائه کرده است.

یکی از مواردی که باید توجه داشته باشید اینست که فایل robots.txt سایتها برای همه قابل دسترسی است؛ پس نباید شاخه ها و صفحات مهم در آن آورده شود، شما می‌توانید برای دسترسی به چنین مواردی رمز عبور تعیین کنید.

شاید از خودتان بپرسید که فایل robots.txt در بهینه سازی چه نقشی دارد!؟ همانطور که می دانید الگوریتم رتبه دهی به سایتها برای کسی مشخص نیست ولی آنچه واضح است محتوا نقش قابل توجهی در آن دارد. شاید شما صفحات کم ارزشی از نظر رتبه دهی داشته باشید، پس بهتر است آنها را از دسترس رباتها خارج کنید تا رتبه سایت را پایین نیاورند.

در مطالب بعدی روشهایی متفاوت  برای بهینه سازی سایت برای موتورهای جستجو اشاره خواهد شد.

لیست کاملی از رباتهای جستجوگر

ابزاری برای بررسی و رفع اشکال robots.txt

فایل راهنمای برخی از سایت های معروف: مایکروسافت، یاهو، گوگل، فیس بوک، توییتر و اپل

Vote on iDevCenter

اگر می خواهید مطالب بعدی مهندیس را از دست ندهید؛ برای دریافت از طریق ایمیل اینجا کلیک کرده و یا مشترک فید مهندیس شوید

زندگي آنلاين

تا حالا شده يه فايل داشته باشين ولي بدليل نداشتن نرم افزارش نتونين ازش استفاده كنين مثلا از يه فايل ورد 2007 با پسوند (docx) بخواين پرينت بگيرين ولي آفيس شما نسخه پايين باشه، يا حتما بارها و بارها براي شما هم اتفاق افتاده كه يه فايل رو دانلود كرده باشين ولي بعد از بازكردن و ديدنش متوجه شدين كه اوني كه مي خواستين نبوده!

Zoho به فكر شما بوده و چنين امكاناتي رو براتون فراهم كرده تا شما معطل نمونين يا فايلهاي مورد نظر خودتون رو دريافت كنين. البته فلسفه وجودي چنين سرويسهايي فقط به موارد بالا ختم نميشه و چنين سرويسهايي به عنوان يك نرم افزار يا SaaS(Software as a Service) روز به روز بيشتر و بيشتر ميشن و سرويسهاي جديدتري ارائه ميشه. كاهش هزينه، سرعت بيشتر در انجام كارها و دسترسي آساتنر از همه جا، مزاياي ديگر اين سرويسها هستند كه درآينده جاي نرم افزارهاي فعلي رو خواهند گرفت.

همونطور كه گفتم Zoho يكي از پيشگامان در ارائه چنين سرويسهايي هست. با Zoho Writer ميتونين فايلهاي متني رو ايجاد يا ويرايش كنين، با Zoho Mail ميتونين ميلهاتون رو چك كنين، با Zoho Show مينونين اسلايدهاي مورد نطرتون رو بسازين، با Zoho Sheet ميتونين اسناد اكسل رو ويرايش كنين. همچنين با Zoho Viewer ميتونين فايل مورد نظر رو از روي سيستم خودتون و يا با لينك دادن از روي وب باز كنين و اگه خواستين ذخيره كنين و يا حتي پرينت بگيرين! اينا يه چندتا نمونه از سرويسهاي Zoho بودن، بايد خودتون به سايتش مراجعه كنين و ساير امكاناتش رو ببينين.

از ديگر سرويسهاي كاربردي ميشه به Ghost اشاره كرد كه يه كامپيوتر مجازي براي كاربرانش ارائه ميده كه ميتونين مثل سيستم خودتون ازش استفاده كنين يا حتي روش برنامه نصب كنين. فضاي ذخيره سازي به حجم 15 گيگابايت و ايميل هم در اختيارتون قرار داده ميشه .

از ويرايشگرهاي آنلاين تصاوير هم ميشه به Pixlr و Splashup اشاره كرد كه اولي مثل يه فتوشاپ آنلاين هست!

از ديگر سرويسهاي نسل جديد وب ميشه به Mathway براي حل مسائل رياضي اشاره كرد كه تا الان بيش از 20 ميليون مسئله رو حل كرده!!

فيس بوك و توييتر هم از محبوبترين سرويسهاي اجتماعي هستن.

سرويسهاي بالا يه وجه اشتراك مهمي دارن كه بزرگترين مزيتشون (البته نه براي ما ايرانيا) هست و اون هم رايگان بودنشونه كه ديگه نيازي به پرداخت هزينه براي نرم افزارهاي مختلف نييست. البته براي استفاده بهتر از چنين سرويسهايي نياز به اينترنت پرسرعت خواهيد داشت.