優(yōu)化過程中網(wǎng)頁和網(wǎng)頁內(nèi)容相關(guān)性要強發(fā)布者:本站 時間:2020-05-17 10:05:48
記住,“蜘蛛”是個抓取“程序”,不是“人工智能”。他不會用人類的判斷邏輯來判斷相關(guān)性,而是一些“邏輯程序”,畢竟蜘蛛程序并不復雜(相對而言)。
明白了上述情況,我來說說我自己對“相關(guān)性”的看法和建設心得,不對之處,還請大家指正。
你的網(wǎng)頁和你網(wǎng)頁中的內(nèi)容相關(guān)性,在蜘蛛程序中的判斷:
假設你的網(wǎng)頁是新的網(wǎng)頁,剛做了不到2天,剛提交,蜘蛛根據(jù)"抓取索引",過來抓取(或通過其他形式的鏈接)。
首先,蜘蛛通過各種連接來到了你的網(wǎng)頁,對于他來說,新的網(wǎng)頁特征就是從網(wǎng)頁代碼中的head部分中的title標簽里的元素來判斷的。
假設蜘蛛來到的你這個網(wǎng)頁,抓取了網(wǎng)頁中的title文字:我的動漫論壇 -新動漫 - 動漫新主張!蜘蛛首先會以抓取title中的文字做為“關(guān)鍵詞”為參考,然后去從網(wǎng)頁代碼中去尋找相關(guān)的“關(guān)鍵詞”。
你可以放心,蜘蛛可以判斷一些JS代碼和頁面中的標簽,他會比較重視正文和div塊中的標題部分的“關(guān)鍵詞”,也就是h1-h4一系列的。這也可以驗證大家說的,為什么h1-h4中的內(nèi)容,會比其他body中的文本內(nèi)容權(quán)重高的原因。然后蜘蛛會把tilte中在正文body部分重復次數(shù)最多的詞,定為 “參考關(guān)鍵詞”(當然了,有個重復限度,搜索引擎會設定并嵌入蜘蛛程序里)。
然后蜘蛛自己也會根據(jù)“參考關(guān)鍵詞”判斷“關(guān)鍵詞擴展”(根據(jù)搜索引擎的相關(guān)類的常用數(shù)據(jù)關(guān)鍵詞和title中關(guān)鍵詞分析對比),綜合以上,確定大體的“關(guān)鍵詞”,做為下一步頁面抓取的參考。
下一步,蜘蛛會計算(這個簡單的數(shù)據(jù)計算功能還是有的)所有關(guān)鍵詞在網(wǎng)頁代碼中出現(xiàn)的數(shù)量,作為基數(shù)。然后計算body標簽中“關(guān)鍵詞”的數(shù)量,作為分子(汗,想不出什么詞了,通俗第一)。然后一除,就得出了你這個頁面的關(guān)鍵詞密度。
密度出來了以后,搜索引擎自己會有個標準判斷(人為設計的參數(shù)),有個等級,?-?是最合理的,?—?是一般的,?—?是最差的,這個標準時刻在變,總之是根據(jù)一段時期的數(shù)據(jù)進行調(diào)整的(就是讓你隔段時間鬧一回心)。
好了,密度的判斷出來后,進行本頁的關(guān)鍵詞差別對比。
以tilte中的關(guān)鍵詞為基礎,綜合了“擴展關(guān)鍵詞”的參考,對比在body部分中抓取的“關(guān)鍵詞”,對比他們每個文字上的差別。(比如搜索引擎定下的關(guān)鍵詞為“動漫”,而body文本中有:動漫論壇,新動漫-等等),差別也分個等級,差別不大的,成為了長尾關(guān)鍵詞,差別大的,就被舍棄做為這個頁面的搜索關(guān)鍵詞,這個和“關(guān)鍵詞密度”判斷方法相同。這樣,頁面長尾詞和搜索關(guān)鍵詞就確定了下來。
當密度和頁面關(guān)鍵詞差別這2項得到了2個結(jié)果后,會有個權(quán)數(shù)加的計算公式(引擎自己定的,也定期根據(jù)數(shù)據(jù)調(diào)整),得出一個對“相關(guān)性”的得分(類似baidu指數(shù)的算法),從而判斷頁面的關(guān)鍵詞,確定頁面內(nèi)容和關(guān)鍵詞的相關(guān)性聯(lián)系程度。
頁面的關(guān)鍵詞和頁面內(nèi)容的相關(guān)性就這么得出來的。
那么,外部鏈接的相關(guān)性怎么判斷?好,下面談談,進入第2部分
外部連接和網(wǎng)頁相關(guān)性的判斷:
選擇我們,優(yōu)質(zhì)服務,不容錯過
1. 優(yōu)秀的網(wǎng)絡資源,強大的網(wǎng)站優(yōu)化技術(shù),穩(wěn)定的網(wǎng)站和速度保證
2. 15年上海網(wǎng)站建設經(jīng)驗,優(yōu)秀的技術(shù)和設計水平,更放心
3. 全程省心服務,不必擔心自己不懂網(wǎng)絡,更省心。
------------------------------------------------------------
24小時聯(lián)系電話:021-58370032