親愛的站長(zhǎng)們,你們有沒有遇到過這樣的煩惱:明明網(wǎng)站內(nèi)容質(zhì)量上乘,還特別針對(duì)爬蟲做了優(yōu)化,結(jié)果百度卻不收錄?別急,今天就來聊聊這個(gè)讓人頭疼的問題。
原來,問題可能出在網(wǎng)站頁面的長(zhǎng)度上。有這么一個(gè)上海的網(wǎng)站,它的主體內(nèi)容是用js生成的,還特別針對(duì)爬蟲抓取做了優(yōu)化,把圖片的二進(jìn)制內(nèi)容直接放到了HTML里。結(jié)果,頁面長(zhǎng)度竟然達(dá)到了164k!雖然頁面內(nèi)容質(zhì)量很高,但因?yàn)樘L(zhǎng),爬蟲抓取時(shí)被截?cái)嗔耍瑢?dǎo)致頁面被認(rèn)定為“空短”,最終沒有被收錄。
作為SEO工程師,我們有幾點(diǎn)建議給大家:
. 不建議站點(diǎn)使用js生成主體內(nèi)容。如果js渲染出錯(cuò),頁面內(nèi)容讀取可能會(huì)出現(xiàn)問題,影響爬蟲抓取。
. 針對(duì)爬蟲抓取做優(yōu)化時(shí),記得把主體內(nèi)容放在前面,避免因?yàn)樽ト〗財(cái)鄬?dǎo)致內(nèi)容不完整。
. 如果站點(diǎn)針對(duì)爬蟲抓取做了SEO優(yōu)化,建議頁面長(zhǎng)度控制在128k以內(nèi),不要太長(zhǎng)。
SEO優(yōu)化是一個(gè)需要持之以恒的過程,希望這篇文章能給大家?guī)硪恍﹩l(fā)。讓我們一起努力,共同進(jìn)步!