|17年深耕深圳網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)、網(wǎng)站制作

網(wǎng)站建設(shè)

營(yíng)銷推廣

小程序開(kāi)發(fā)

案例鑒賞

資訊學(xué)堂

關(guān)于博盈在線

深圳博盈網(wǎng)絡(luò)公司,網(wǎng)站搭建,設(shè)計(jì)制作與網(wǎng)站改版

聯(lián)系我們

聯(lián)系深圳網(wǎng)站建設(shè)及網(wǎng)站改版的網(wǎng)絡(luò)公司

聯(lián)系我們
服務(wù)熱線：
159 8944 9358 龍生
加入我們
HR郵箱：
[email protected]

專家談?wù)動(dòng)嘘P(guān)網(wǎng)站搜索引擎中模糊搜索理論研究分析

發(fā)布時(shí)間：2012-08-08 瀏覽次數(shù)：49600

    深圳網(wǎng)絡(luò)營(yíng)銷專家有關(guān)的研究中的IR模型（搜索引擎）使用模糊集合理論（Lotfi Zadeh博士于1969年創(chuàng)建的模糊邏輯分支）來(lái)發(fā)現(xiàn)兩個(gè)詞之間的語(yǔ)義關(guān)系。IR系統(tǒng)并非使用同義詞典或字典來(lái)找出兩個(gè)詞之間是否有關(guān)系，而是使用自己的海量?jī)?nèi)容數(shù)據(jù)庫(kù)來(lái)推測(cè)出詞之間的關(guān)系。
    這個(gè)過(guò)程雖然聽(tīng)起來(lái)復(fù)雜，但原理很簡(jiǎn)單。網(wǎng)絡(luò)營(yíng)銷專家指出搜索引擎需要依靠機(jī)器邏輯（對(duì)／錯(cuò)、是／非等）判斷，機(jī)器邏輯相對(duì)人類有它的優(yōu)勢(shì)，但機(jī)器邏輯不能像人類一樣思考。對(duì)人類來(lái)說(shuō)很直觀的事情，對(duì)計(jì)算機(jī)來(lái)說(shuō)可能非常難以理解。例如橘子和香蕉都是水果，但橘子和香蕉并不都是圓的。對(duì)人來(lái)說(shuō)這是很直觀的事情。
    機(jī)器要理解這一點(diǎn)以及其他與此類似的概念，語(yǔ)義聯(lián)系是關(guān)鍵。網(wǎng)上大量的人類知識(shí)可以被收錄進(jìn)索引庫(kù)，并且從中分析出人類已經(jīng)建立起來(lái)的聯(lián)系。所以機(jī)器掃描索引庫(kù)中“香蕉”和“橘子”這兩個(gè)詞出現(xiàn)的地方，注意到“圓形”和“香蕉”很少同時(shí)出現(xiàn)，而“橘子”和“園形”經(jīng)常同時(shí)出現(xiàn)，機(jī)器就知道橘子是圓的，而香蕉不是圓的。
    這就是模糊邏輯發(fā)揮作用的地方。只要分析詞語(yǔ)以何種頻率一起出現(xiàn)，在什么情況下一起出現(xiàn)，模糊集合理論就可以幫助計(jì)算機(jī)理解詞語(yǔ)之間是怎樣相關(guān)的。
    一個(gè)在此基礎(chǔ)上有所擴(kuò)展的相關(guān)概念是潛在語(yǔ)義分析(LSA，Latent Semantic Analysis)。通過(guò)研究?jī)|萬(wàn)網(wǎng)頁(yè)的海量索引，搜索引擎可以“學(xué)習(xí)”哪些詞之間有聯(lián)系，哪些概念之間有聯(lián)系。例如，運(yùn)用LSA，搜索引擎能夠分辨前往動(dòng)物園的旅途活動(dòng)，經(jīng)常包括觀看野生生物和動(dòng)物，可能是一次（旅行）的一部分。
    Google將相關(guān)詞顯示為黑體，并且能夠辨認(rèn)出哪些詞在它們的索引庫(kù)中經(jīng)常同時(shí)出現(xiàn)（連在一起，在同一頁(yè)或比較靠近的位置）。
    在SEO培訓(xùn)優(yōu)化中某些形式的LSA計(jì)算成本太高。這些應(yīng)用使我們認(rèn)識(shí)到搜索引擎怎樣分辨網(wǎng)上詞匯、詞組以及概念之間的聯(lián)系。隨著語(yǔ)義聯(lián)系成為搜索引擎算法越來(lái)越重要的部分，可以預(yù)期，頁(yè)面、網(wǎng)站和鏈接的主題將會(huì)越來(lái)越受重視。未來(lái)搜索引擎將更有能力理解概念和主題，分辨哪些內(nèi)容、鏈接、頁(yè)面與整個(gè)網(wǎng)站的主題不太吻合。

返回列表

相關(guān)資訊