眾所周知,內(nèi)容重復(fù)是搜索引擎優(yōu)化中的一大忌,通常情況下轉(zhuǎn)載的文章是很難獲得高權(quán)重,所以站長們往往使用偽原創(chuàng),下面是部分關(guān)于內(nèi)容復(fù)制的信息圖表,相信對各位會有所幫助。
#1 從博客上復(fù)制內(nèi)容:
上圖是主要針對博客這種網(wǎng)站媒體類型的,我們使用wordpress的時(shí)候經(jīng)常將文章毫無保留地展示在首頁,而不是使用輸出摘要(就好像SEMWATCH那樣),根據(jù)Randfish觀察,其實(shí)這樣子是會搜索引擎誤認(rèn)為內(nèi)容重復(fù)。
#2 URL參數(shù)引起的內(nèi)容重復(fù)
究竟URL參數(shù)像Session IDs,Tracking IDs是怎樣引起內(nèi)容重復(fù)的呢?Googlewebmastercentral (需要翻墻) 透露,同一個(gè)產(chǎn)品頁面,如果搜索引擎爬蟲抓取可以通過多種鏈接途徑抓取同一個(gè)產(chǎn)品頁面,那樣會有以下幾種消極的影響:
1.多種URLs會稀釋鏈接的廣泛性。比如上圖的產(chǎn)品頁面,如果有50個(gè)導(dǎo)入鏈接,那有可能分別形成了3種導(dǎo)入U(xiǎn)RL途徑,而不是唯一的某一個(gè)URL,這樣就等于將導(dǎo)入鏈接傳遞的權(quán)重分散到3個(gè)不同的鏈接上。
2.搜索結(jié)果或許會呈現(xiàn)不友好的URL(比如一大串長長 的session ID,tracking ID)。從而在SERP中,降低了用戶對該頁面的清晰了解程度(英文url比如semwatch.org/sem,不僅僅具備搜索引擎友好性,更重要的是用戶體驗(yàn)友好性),不利于品牌的塑造。
#3 搜索引擎對待內(nèi)容重復(fù)的態(tài)度
從Search Engine Land給出上圖可知,一般來說搜索引擎通過4個(gè)步驟來識別內(nèi)容是原創(chuàng)還是復(fù)制:
1.發(fā)現(xiàn)。當(dāng)搜索引擎爬蟲發(fā)現(xiàn)新的內(nèi)容,他會立刻與之前收錄的內(nèi)容進(jìn)行比較確保內(nèi)容的原創(chuàng)性。
2.丟棄。首先,搜索引擎會放棄收錄那些來自鏈接工廠,MFA站點(diǎn)(Made For Adense)和被列入黑名單的IP的頁面
3.解剖。下一步就是分析每個(gè)頁面的 入站鏈接,判斷鏈接的質(zhì)量和源頭。
4.決定。最后就是回顧之前收錄的頁面和相關(guān)鏈接,決定哪一個(gè)頁面才是絕對原創(chuàng)。
江西省上饒市廣信區(qū)三清山中大道588號7棟5號
電話:0793-8313026 7094119
傳真:0793-8313026
手機(jī):18079306668 13576325382 曾
郵箱:174216168@qq.com
QQ:174216168
Copyright © 2008-2019 (srlrcm.cn) 獵人傳媒. All Rights Reserved.
贛ICP備08101270號-1 百度統(tǒng)計(jì)