حذف محتوای تکراری در طراحی وب سایت
محتواي تکراري چيست؟
محتواي تکراري، محتواييست که در بيش از يک مکان در اينترنت ظاهر مشود. اين «يک مکان»، به عنوان صفحهاي با آدرس وب سايت (URL) منحصر به فرد تعريف ميشود. بنابراين، اگر همان محتوا در بيش از يک آدرس وب ظاهر شود، محتواي تکراري داريد. اگرچه از نظر فني به عنوان مجازات (Penalty) شناخته نميشود، اما محتواي تکراري گاهي اوقات ميتواند بر رتبهبندي موتورهاي جستوجو تأثير گذارد. به گفتهي گوگل، وقتي چندين محتواي «به وضوح مشابهي» در بيش از يک مکان در اينترنت وجود داشته باشد، تصميمگيري در مورد اينکه کدام نسخه بيشتر براي يک جستوجوي معين مناسب است، براي موتورهاي جستوجو دشوار است.
چرا محتواي تکراري مهم است؟
براي موتورهاي جستجو
- محتواي تکراري براي موتورهاي جستوجو ميتواند به سه شکل اصلي مسالهساز باشد:
- نميدانند کدام نسخه(ها) را بايد در فهرست خود قرار دهند يا حذف کنند.
- •نميدانند که معيارهاي پيوند (trust, authority, anchor text, link equity, …) را به يک صفحه هدايت کنند يا آن را بين چندين نسخهي جداگانه نگه دارند.
- نميدانند کدام نسخه(ها) را براي نتايج جستار رتبهبندي کنند.
براي صاحبان سايت
هنگامي که محتواي تکراري وجود دارد، مالکان سايتها ميتوانند از تنزل در رتبهبندي و از دست دادن ترافيک آسيب ببينند. اين تلفات اغلب ناشي از دو مشکل اصلي است:
- براي ارائهي بهترين تجربهي جستوجو، موتورهاي جستوجو به ندرت چندين نسخه از يک محتوا را نشان ميدهند و بنابراين مجبور ميشوند انتخاب کنند که کدام نسخه به احتمال زياد بهترين نتيجه است. اين امر «مشاهدهپذيري (Visibility)» هر يک از موارد تکراري را کاهش ميدهد.
- ممکن است در درازمدت نرخ «برابري پيوند (Link Equity)» را کاهش دهد؛ زيرا وبسايتهاي ديگر نيز بايد بين موارد تکراري يکي را انتخاب کنند. به جاي همهي پيوندهاي ورودي که به يک قطعه از محتوا اشاره ميکنند، به چندين قطعه پيوند داده ميشوند و Link Equity را در بين موارد تکراري پخش ميکنند. از آنجا که لينکهاي ورودي يکي از عوامل رتبهبندي هستند، اين امر ميتواند بر مشاهدهپذيري جستوجوي يک محتوا تأثير بگذارد.
نتيجهي نهايي: بخشي از محتوا به هيچ وجه در نتايج جستوجو مشاهدهپذير نيست.
محتواي تکراري چگونه ايجاد ميشود؟
در بيشتر موارد، مالکين وبسايتها عمدا محتواي تکراري ايجاد نميکنند. اما، اين بدان معنا نيست که آنها به وجود نخواهند آمد. در واقع بر اساس برخي برآوردها، تا 29? محتواي وب در واقع محتواي تکراري است!
بياييد به برخي از رايجترين روشهايي که محتواي تکراري به طور ناخواسته ايجاد ميشود، نگاهي بيندازيم:
1- نسخههاي مختتلف URL
پارامترهاي URL، مانند رديابي کليک و برخي کدهاي تجزيه و تحليل، ميتوانند مشکلات محتواي تکراري ايجاد کنند. اين ميتواند مشکلي باشد که نه تنها توسط خود پارامترها، بلکه به ترتيب نمايش آن پارامترها در خود URL ايجاد ميشود.
براي نمونه، URL زير:
www.widgets.com/blue-widgets?c...
محتواي تکراري URL زيرين است:
www.widgets.com/blue-widgets?c...&cat=3%22%20class=%22redactor-autoparser object%22%3Ewww.widgets.com/blue-widgets%20is%20a%20duplicate%20of%20www.widgets.com/blue-widgets?cat=3&color=blue
Session IDها همچنين از خالقان محتواي تکراري رايج هستند. اين امر زماني رخ ميدهد که به هر کاربري که از وبسايت بازديد ميکند، Session ID متفاوتي اختصاص داده شده که در URL ذخيره شده است.
اگر چندين نسخه از صفحههاي وبسايت ايندکس شود، نسخههاي مخصوص پرينت هم ميتوانند باعث ايجاد محتواي تکراري شوند.
درسي که اينجا وجود دارد اين است که در صورت امکان، در بيشتر مواقع عدم استفاده از پارامترهاي URL يا نسخههاي جايگزين URLها ميتواند مفيد واقع شود. اطلاعات مورد نظر ميتواند از طريق اسکريپتها منتقل شود.
2- صفحههاي با و بدون HTTPS يا با و بدون WWW
اگر سايت شما داراي نسخههاي جداگانه در«www.site.com» و «site.com» (با و بدون پيشوند «www» است و محتواي يکساني در هر دو نسخه وجود دارد، به طور موثر هر يک از آنها را به محتواي تکرار تبديل کردهايد.
همين امر در مورد سايتهايي که نسخهها را در http:// و https:// نگهداري ميکنند صدق ميکند. اگر هر دو نسخه يک صفحه زنده و براي موتورهاي جستوجو قابل مشاهده باشد، ممکن است با مشکل محتواي تکراري مواجه شويد.
3. محتواي بريده يا کپي شده
محتوا نه تنها شامل پستهاي بلاگ يا محتواي سرمقالهها، بلکه صفحات اطلاعات محصول هم هست. بازنشر مجدد محتواي بلاگ شما در سايتهاي خود ممکن است منبع آشناتري از محتواي تکراري باشد، اما يک مشکل رايج براي سايتهاي تجارت الکترونيک نيز وجود دارد: اطلاعات محصول. اگر بسياري از وبسايتهاي مختلف اقلام يکساني را بفروشند و همهي آنها از توضيحات سازنده آن موارد استفاده کنند، محتواي يکسان در چندين مکان در سراسر وب ظاهر ميشود.
نحوهي رفع مشکلات محتواي تکراري
رفع مشکلات محتواي تکراري در يک ايدهي اصلي خلاصه ميشود: تعيين اينکه کدام يک از موارد تکراري «صحيح» است. هر زمان که محتواي يک سايت را ميتوان در چندين آدرس اينترنتي يافت، بايد براي موتورهاي جستوجو کنونيکال شود. بياييد به سه روش اصلي براي انجام اين کار بپردازيم: استفاده از تغيير مسير 301 به URL درست، ويژگي rel=canonical يا استفاده از ابزار مديريت پارامترها در Google Search Console.
تغيير مسير 301
در بسياري از موارد، بهترين راه مبارزه با محتواي تکراري، ايجاد تغيير مسير 301 از صفحه «تکراري» به صفحهي محتواي اصلي است.
وقتي چندين صفحه با قابليت رتبهبندي خوب در يک صفحه ترکيب شوند، نه تنها رقابت با يکديگر را متوقف ميکنند؛ آنها هم چنين به طور کلي پيام محبوبيت و ارتباط بيشتري ايجاد ميکنند. اين امر بر توانايي صفحه «صحيح» براي رتبهبندي خوب تأثير مثبت ميگذارد.
Rel="canonical"
گزينهي ديگر براي برخورد با محتواي تکراري، استفاده از ويژگي rel=canonical است. اين به موتورهاي جستوجو ميگويد که بايد با يک صفحهي خاص، مانند يک کپي از يک نشاني اينترنتي مشخص شده برخورد کرد، و همهي پيوندها، معيارهاي محتوا و «امتيازهاي رتبهبندي» که موتورهاي جستوجو در اين صفحه اعمال ميکنند، بايد در واقع به صفحهاي مشخص اعطا شود.
متارباتهاي Noindex
يکي از متا تگهايي که ميتواند در برخورد با محتواي تکراري بسيار مفيد واقع شود، رباتهاي متا هستند با مقادير "noindex, follow." هستند. اين متا تگها که معمولا «متاي Noindex,Follow» ناميده ميشود و از نظر فني با عنوان «content=”noindex,follow”» شناخته ميشود، ميتواند به سر HTML هر صفحه که بايد از فهرست موتورهاي جستوجو حذف شود، اضافه شود.
021 – 88 74 97 24
021 – 88 74 97 25
021 – 88 74 97 26