下面大連網(wǎng)絡(luò)公司小編,就此摘錄了一些有效信息,從這些信息中,我" />
今天大連網(wǎng)站建設(shè)小編到了雅虎的搜索引擎上,看了我們的鏈接,發(fā)現(xiàn)很少,而且收錄的文章也是不多??吹竭@,很多站長(zhǎng)不免發(fā)現(xiàn)疑問,什么是讓他們有彼此怎么大的差距?
下面大連網(wǎng)絡(luò)公司小編,就此摘錄了一些有效信息,從這些信息中,我們肯定能看到為什么這兩款搜索引擎的不同之處。
很多人給過搜索引擎的一些定義,但每個(gè)人的理解可能不太一樣,下面我給出了李開復(fù)的給搜索引擎的定義:
搜索引擎(search engine)是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。
肯定有很的人會(huì)問:百度和谷歌哪個(gè)好呀!想要知道搜索引擎的不同之處,還是要看他們的質(zhì)量評(píng)估指標(biāo)。
下面我們從質(zhì)量評(píng)估進(jìn)行分析。
1、相關(guān)度 -- 請(qǐng)受過訓(xùn)練的人來評(píng)估每個(gè)引擎的前幾個(gè)結(jié)果是否相關(guān),評(píng)估時(shí)不參考結(jié)果的來源、引擎的品牌等。
2、索引規(guī)模 -- 每個(gè)引擎知道自己的規(guī)模,也就是有多少網(wǎng)頁(yè)(除去重復(fù)的),但是不知道對(duì)方的規(guī)模,可是可以根據(jù)兩方搜索結(jié)果的爬取,得知有多少網(wǎng)頁(yè)是我有他無(wú),或他有我無(wú),從此得知大約兩個(gè)引擎的索引規(guī)模。比較有挑戰(zhàn)的一點(diǎn)是如果索引規(guī)模大了可能導(dǎo)致相關(guān)度下降(因?yàn)橛行╅L(zhǎng)尾結(jié)果會(huì)排序太靠前)。
3、速度 -- 就是輸入搜索詞,得到結(jié)果的時(shí)間。很多測(cè)試告訴我們0.2秒的速度會(huì)導(dǎo)致用戶滿意度的落差,和未來使用的頻率。
4、新鮮度 -- 就是能爬到多新的內(nèi)容,而且要有一定規(guī)模(只有新聞內(nèi)容不算夠新)。
谷歌和百度的比較:
1、相關(guān)度領(lǐng)先百度2個(gè)點(diǎn)(大約是今天的英語(yǔ)谷歌和微軟的差距,就是說不大),但是我的理解是當(dāng)時(shí)百度自認(rèn)這方面領(lǐng)先谷歌。這是有可能的,因?yàn)槊總€(gè)公司內(nèi)部評(píng)估不同,就像今天微軟內(nèi)部自認(rèn)為英語(yǔ)相關(guān)度已經(jīng)超過谷歌一樣。
2、谷歌規(guī)模較大,但是很多重要的內(nèi)容都沒有(例如論壇)。(這里比較的是中文索引,但是其實(shí)谷歌的索引是全球所有語(yǔ)言都儲(chǔ)存的,因此任何搜索可能搜出任何語(yǔ)言和國(guó)家的結(jié)果)3、速度遠(yuǎn)遠(yuǎn)慢于百度。
4、新鮮度落后百度。
在2008年,谷歌和百度的比較:
1、相關(guān)度遠(yuǎn)遠(yuǎn)領(lǐng)先7個(gè)點(diǎn)(大約是谷歌英語(yǔ)剛出來時(shí)和雅虎的差距)。
2、索引規(guī)模是百度的10倍左右(當(dāng)然,對(duì)絕大部分常見搜索詞是感覺不出差別的),并且彌補(bǔ)了有些爬取的錯(cuò)誤和落差。
3、速度大約和百度一樣,雖然許多服務(wù)器不在國(guó)內(nèi)。
4、新鮮度達(dá)到6分鐘之內(nèi),也就是說一個(gè)網(wǎng)頁(yè)上線6分鐘后就可以被搜到(如果是PR值夠高的話)。
發(fā)現(xiàn)谷歌的進(jìn)步后,百度也開始更多的花功夫提升搜索質(zhì)量,在相關(guān)度和索引規(guī)模都有進(jìn)步。當(dāng)然,谷歌也推出Google Instant、real-time search、universal search。今天,我相信谷歌還是領(lǐng)先的,只是過去一年中國(guó)團(tuán)隊(duì)不再做中文搜索,差距應(yīng)該縮小了,領(lǐng)先程度肯定沒有2008年多。
大連網(wǎng)站建設(shè)小編有時(shí)會(huì)遇到谷歌搜索不到的情況,不知道你們有沒有遇到過。谷歌今天有不少結(jié)果出不來,這對(duì)一個(gè)搜索引擎是致命的,因?yàn)榇蟛糠钟脩魰?huì)把這個(gè)現(xiàn)象怪罪到谷歌身上,因而影響谷歌在用戶心中的“質(zhì)量”。
掃一掃
關(guān)注新圖聞科技
全國(guó)咨詢熱線
186-0984-0880