建站知識
網站設計知識 網站建設知識 網絡營銷知識 微信資訊 常見問題 網站備案 近期客戶網站建設套餐
標準型網站建設 精美型網站建設 營銷型網站建設 高端品牌網站建設 電子商務型網站建設 行業(yè)門戶型網站建設 手機網站建設 微信網站建設搜索引擎對哪些內容是辨識不了的
對于一個SEOer,或者一個需要和SEO打交道的網站制作者而言,準確了解網絡搜索引擎能看見什么,看不見什么,將有助于我們更加合理地推進工作。
搜索引擎并非完全不具備圖片內容辨識能力,但它通常是只能判斷出有一張圖片正在顯示,但是通常其無法識別這張圖片的內容是什么。除非這張圖片的提供者用ALT屬性提供了相關信息。搜索引擎對圖片的辨識是通過識別像素顏色來完成的,比如能通過圖片中肉色比例來判斷是否是色情圖片,這種判定方式實在是只能用“很弱”來評價。正因為很弱,所以這種判別是極不準確的——想必各位還記得當初“綠壩”將加菲貓的圖片誤判為色情圖的笑話。目前,搜索引擎通過光學字符識別技術已經能簡單判斷圖片中包含的文字信息,但一般只限于比較工整的字體。
較早期的SEO觀念認為,搜索引擎無法識別FLASH文件。在目前,這個認識已經嚴重過時了。無論是Google還是baidu,它們都可以從FLASH中抽取有用信息來提交搜索結果。但是如果要徹底判定這是個展示什么的FLASH文件,對于目前的搜索引擎來說還有難度,因為搜索引擎更側重于文字信息的抓取。而FLASH的制作者通常喜歡以圖片和音頻內容來完成自己的制作,可能出現的少量文字內容通常無法準確詮釋該文件的實際內容。
音頻和視頻文件也是搜索引擎通常會略過的內容,除非是使用了AD3標簽的MP3文件或者使用了AAC格式內嵌文字性說明的增強型播客。但別指望目前的技術能做到讓搜索引擎辨別這里音頻和視頻里到底在說些什么玩意兒。
同樣的,搜索引擎無法解析文件的源代碼,也無獲取任何編寫者不希望它獲取的網頁信息。盡管蜘蛛整天在各類網頁源代碼上攀爬著,但只要標記nofollow,那么相關代碼內容就會被蜘蛛所忽略。
對于網站制作者來說,有一個問題是特別需要注意的——蜘蛛對于AJAX表示束手無策。由于AJAX的動態(tài)顯示方式,其直接從數據庫獲取信息而不需要刷新頁面,故蜘蛛無法解析那些只會直接顯示在用戶電腦上的內容。不少JavaScript腳本也存在著相似的問題,即在用戶僅僅輸入而不執(zhí)行任務之前,HTML中不生成相關內容。