云南網(wǎng)站建設創(chuàng)新企業(yè) 昆明多彩網(wǎng)絡公司

在線qq:540105663

搜索引擎算法之:謹慎對待同義詞

來源:昆明多彩網(wǎng)絡公司 日期:2011-02-20 閱讀: 發(fā)表評論

中文中有很多詞語是同義詞的,百度詞匯當中也能很好的識別同義詞,但是在百度的搜索結(jié)果當中我們可以看出來百度對于同義詞的匹配是相當謹慎的

在搜索引擎中有一個很重要的分詞技術,比如將一個長的詞語分解成若干個短語,然后再根據(jù)這些短語呈現(xiàn)最終的搜索結(jié)果,而我們這里說得同義詞并非搜索引擎中的分詞技術,說的是一個該怎么樣去理解用戶意圖的技術。

比如說我們搜索“網(wǎng)站制作”和“網(wǎng)頁制作”這兩個同義詞語,可以對比一下搜索出來的結(jié)果,發(fā)現(xiàn)還是有很多不同的,雖然這兩個詞語的意思基本相同;而我們再搜索競爭較小的同義詞的時候就可以發(fā)現(xiàn)搜索結(jié)果相似程度的就出現(xiàn)上升趨勢。

這里我們可以大膽的猜測一下影響搜索引擎對于同義詞搜索結(jié)果的相關因素:

1、兩個同義詞如果意義非常接近,同時相關信息較少的話,搜索引擎會自動匹配這兩個詞語,并且呈現(xiàn)大部分相同的結(jié)果。

2、兩個同義詞意義非常接近,但是詞語的搜索指數(shù)很高,同時相關的網(wǎng)站競爭排名也非常激烈,那么呈現(xiàn)出來的結(jié)果就會迥異。

3、如果兩個同義詞前面加上了地域或者其他限制性的前綴,搜索引擎會考慮將這兩個詞語當成一個關鍵詞來對待,但幾率較小。

4、對于冷門和一些專業(yè)術語,搜索引擎如果在自身數(shù)據(jù)庫中有兩個同義詞的數(shù)據(jù),將同義詞當成一個關鍵對待的幾率將大大加大。

以上猜測僅參考了少部分的搜索詞語,搜索引擎對于同義詞的匹配和對待的態(tài)度是非常的謹慎,更多更準確的數(shù)據(jù)就需要更多的關鍵詞語去驗證了。

發(fā)表評論評論列表(有 條評論)