網(wǎng)站被黑現(xiàn)在越來越常見,不僅中國,全世界都一樣。Google官方博客 3 月份的一篇帖子提到,被黑的網(wǎng)站數(shù)目 2016 年比 2015 年增加了32%,而且沒有減緩的趨勢。我本身就是賣服務(wù)器的,每天在后臺看到的掃描端口、撞密碼、利用CMS漏洞注入之類的太多太多了。
為SEO而黑別人網(wǎng)站是其中一個原因,黑進(jìn)別人網(wǎng)站后,可以創(chuàng)建頁面,在現(xiàn)有頁面加內(nèi)容、加鏈接,做轉(zhuǎn)向,做cloaking等等。當(dāng)然,SEO只是比較小的原因,更多的黑客是為了干別的。
其實我是覺得,黑別人網(wǎng)站,不是SEO,連黑帽SEO也不是。雖然我不提倡做黑帽SEO,但對黑帽是充滿敬意的。這里有個前提,黑帽SEO不管怎么作弊、折騰,是在自己的網(wǎng)站折騰,黑進(jìn)別人網(wǎng)站,去折騰別人網(wǎng)站,就跨過底線了。
自己網(wǎng)站被黑了怎么辦?怎樣恢復(fù)呢?可能出現(xiàn)的情況非常多,這里只能簡單舉個例子。
首先,注冊百度站長平臺、Google Search Console是必須的,就算是中文網(wǎng)站,沒什么谷歌流量,也要注冊Google Search Console,Google如果發(fā)現(xiàn)網(wǎng)站被黑,會在Search Console中給站長留言的。
然后,經(jīng)常在百度、Google用site:指令,以及“site:domain+敏感關(guān)鍵詞”看看自己網(wǎng)站有沒有什么不該出現(xiàn)的標(biāo)題和描述。敏感關(guān)鍵詞可以從色情、賭博開始,再往醫(yī)療、法律服務(wù)之類的擴(kuò)展。
舉個例子。現(xiàn)在在百度搜索“托福代考”,第一頁結(jié)果如下圖:
(未來看到這個帖子的讀者請注意,過一陣搜索結(jié)果不一定是這個樣子了。)
看到里面以“托福代考_托福代考_百度_知道“為標(biāo)題的那些獨(dú)立域名網(wǎng)站了吧,一看這架勢就能肯定,都是被黑了。翻到第二頁就更整齊了:
我翻了三四十頁,都是這個樣子,看來風(fēng)頭不小??梢钥吹剑粝碌腝Q號很多是一樣的。沒時間仔細(xì)去研究這些網(wǎng)站之間的關(guān)系,但被黑的網(wǎng)站域名大多是公司名的漢語拼音首字母、沒任何英文意義的字母組合。訪問了其中一些網(wǎng)站,大部分打開都非常慢。
挑了一個域名看著還算順眼的網(wǎng)站打開,看著挺正常的:
貌似沒有問題,但百度快照是被黑的版本:
可以看到,正常頁面模板,正文處加了關(guān)鍵詞。很多被黑的網(wǎng)站顯示的都是這個天津廣播網(wǎng)的頁面。
也許站長已經(jīng)注意到被黑了,所以已經(jīng)清理了代碼?所以訪問網(wǎng)站看到的不是百度快照的內(nèi)容?這些圖都是 5 月 10 號抓的,百度快照是 5 月 7 號,挺新的,這么巧站長在這 3 天清理了網(wǎng)站?為確認(rèn),把我的瀏覽器UA改為百度蜘蛛再看看(也就是瀏覽器模仿成百度蜘蛛訪問網(wǎng)站),結(jié)果是這樣:
所以,黑客做了cloaking,給百度蜘蛛看到的內(nèi)容和真實用戶看到的是不一樣的。也許被黑后一直是這樣做的,這個網(wǎng)站站長根本沒發(fā)現(xiàn),也許站長發(fā)現(xiàn)被黑了,以為已經(jīng)清理了代碼,自己訪問看著沒問題,其實還是沒清理干凈,百度蜘蛛抓的還是被黑內(nèi)容。
再看另一個網(wǎng)站的快照:
除了天津廣播網(wǎng),這個中國新聞網(wǎng)頁面也是很多被黑網(wǎng)站常用的。訪問網(wǎng)站也是看著正常的。把瀏覽器UA改為百度蜘蛛看到的是這個:
看來做的挺精細(xì),還在輪換關(guān)鍵詞呢,做完托福,再做GRE。
如果自己網(wǎng)站被黑了,除了瀏覽器UA改為百度蜘蛛看看是否有cloaking,還要在百度站長平臺的抓取診斷部分,用真正的百度蜘蛛抓一下,看看內(nèi)容是否異常。有的網(wǎng)站用程序檢測用戶IP地址,然后反查IP是否是真的百度蜘蛛,所以上面使用的改瀏覽器UA的方法不一定能在100%的情況下模仿百度蜘蛛,站長平臺里的抓取診斷就真的是百度蜘蛛了。
如果確認(rèn)百度蜘蛛抓的是正常內(nèi)容,快照還是不更新,可能需要等一段時間,百度的抓取、建庫是挺慢的,1- 2 個星期都正常。
至于被黑的原因,最常見的是CMS系統(tǒng)漏洞,這個例子里貌似不像,被黑的網(wǎng)站用什么系統(tǒng)的都有,有用dede的,有discuz的,有WP的,還有什么北方網(wǎng)系統(tǒng)的。
另一個常見的是密碼太簡單,或用的缺省設(shè)置,或多個賬號共用相同密碼,還有電腦被染上病毒等等,都可能造成密碼被攻破。
有的時候是整個服務(wù)器漏洞,比如這批被黑的網(wǎng)站不少是在120.133.3.xxx這個IP段上,可能和主機(jī)商的設(shè)置有關(guān),但主機(jī)漏洞情況并不常見。
網(wǎng)站被黑的情況五花八門,防止被黑要做的也很多,我不是網(wǎng)絡(luò)安全專家,就不瞎說了,SEO們還是需要了解一些安全知識的。