国产毛片午夜福利,国产黄网,国产亚洲天堂,97国产精品

  •  
    Google的原罪--網(wǎng)頁序列等級
    發(fā)布時間:2006-11-21   瀏覽次數(shù):1180676
    參考:淺談Google網(wǎng)頁級別   如何提高網(wǎng)站的Google PR值  對Google更新過程的最終解釋
    1998年,當時互聯(lián)網(wǎng)正在高速發(fā)展,處于最光彩照人的階段。1995年開始出現(xiàn)的搜索引擎引起世人關注,在當時被高科技的權威們(以及福布斯雜志)評判為另一個互聯(lián)網(wǎng)神奇組合中又一個讓大家富裕的利潤增長點。然而,這樣的創(chuàng)新除了意味著整個商業(yè)模式的終結之外沒有其他。 事實的真相是,像這些早期的預言家事后不得不承認的是:輕松的迅速致富的虛假諾言成為一種附加在公司頭上的壓力,妨礙了他們本來可以了解得更多,做得更好。

    最早最成功的搜索引擎之一,數(shù)字設備公司(DEC)旗下的AltaVista,從1998年開始迷失了它原有的方向,所有的網(wǎng)絡先驅們都在談論"門戶",所以AltaVista也嘗試成為一個門戶網(wǎng)站,它忘卻了繼續(xù)在搜索引擎序列上尋求發(fā)展。 甚至到了1998年,搜索人在搜索引擎中鍵入一到兩個關鍵字所獲得的搜索結果過多這個問題已經(jīng)變得非常明顯。AltaVista提供了眾多的方法以調整關鍵字的特定聯(lián)系,但是它仍然極少關心到"序列或者排序"的問題。序列,或者說是按照一定標準的返回信息列,應該早不成為問題了。搜索引擎用戶們可不想進行布爾邏輯運算,同時他們也不會想看前二十個以外的搜索結果。所以,真正的問題是:相對于搜索引擎B,在搜索引擎A中輸入相同的關鍵字,其首頁顯示結果如何能給用戶更多有用的幫助。AltaVista在忙著嘗試成為門戶網(wǎng)站的同時根本無法注意到這么重要的一點。

    站長網(wǎng),站長資訊


    進入Google 1998年初,斯坦福大學畢業(yè)生Larry Page和Sergey Brin已經(jīng)在網(wǎng)上運用了一個獨有的排列方法。他們在全球互聯(lián)網(wǎng)大會上交了名為"超級文本搜索引擎網(wǎng)站的解析"一文。斯坦福作為指導而Larry Page作為發(fā)明者,并于1998年9月注冊了專利。直到01年9月4日被授予專利(專利號:第6,285,999),這種計算方法被成為"頁面序列等級",而Google在當時擁有1億5千萬的日查詢量。AltaVista則日暮西山;甚至連續(xù)兩次易主都未能有所起色。 Goolge開始大肆宣傳頁面序列等級,因為這一個極為方便的流傳詞匯,使那些想知道為何Google的引擎確實能提供更好的搜索結果的人感到滿意。甚至在,Google都在為他們所取得的進步而驕傲。所有的宣傳都接近于一點,那些網(wǎng)絡文章的發(fā)表者有時候不得不說明他們所使用的"PR"含義,是指頁面序列等級(PageRank),一種計算方式,而非指Google所做的的公共關系(Public Relations): 頁面序列等級憑借了互聯(lián)網(wǎng)特有的自由民主特性,將大量的鏈接指向作為判定單個網(wǎng)頁價值的標準以及指向器。非常精髓之處在于:Google把從網(wǎng)頁A通向網(wǎng)頁B的鏈接作為一個A對B的投票。投票的多少決定在搜索引擎中的排名。但是,Google并不僅僅只注意一個的鏈接量,或者是某個網(wǎng)頁接到的鏈接要求有多少。一個網(wǎng)頁本身在Google的重要性越高,將越能使其它被鏈接的網(wǎng)頁顯得重要。比如:品牌幾何網(wǎng)站在Google的重要性指數(shù)為5,在中文網(wǎng)頁中已經(jīng)算較高,所以被品牌幾何鏈接的網(wǎng)頁的重要性會比其他被低于5的網(wǎng)站鏈接的重要性要高。 Google繼而承認,除了網(wǎng)頁序列等級之外,還有其它的變量被使用于決定網(wǎng)頁的意義。當另外的這些變量的宏大外觀易于被那些想知道如何提升自己網(wǎng)站排名的斑竹們辨識的時候,所有序列計算方法實際的細節(jié)將會被考慮作為Google公司的商業(yè)機密。使網(wǎng)站的管理者盡可能困難地探知他們的序列方法正是Google的興趣所在。 萬般皆序列 早在飽受懷疑之前,搜索引擎已經(jīng)在網(wǎng)上日漸重要。電子商務與網(wǎng)頁序列非常合拍,因為高位的網(wǎng)頁序列等級能直接轉化為銷售成績。各種不同的引擎設計出各種不同的方式使網(wǎng)頁序列創(chuàng)造利益價值,諸如付費排名,點擊付費廣告以及付費的含有性鏈接。02年6月27日,美國聯(lián)邦交易委員會在討論此類問題后要求:不論是按照客觀公正的網(wǎng)頁重要性標準進行排列,還是按照付費高低的網(wǎng)頁序列等級,都應該清楚地被標識出來,從而保護消費者的利益。這表明,像網(wǎng)頁序列等級這類總能被解釋得合情合理的計算方式將會為搜索網(wǎng)站的未來維持一個重要的方向。 這樣,搜索引擎網(wǎng)站不僅僅是改進了他們的排列方式,同時還使他們的網(wǎng)站成長得龐大以至于大多數(shù)網(wǎng)上沖浪的人每天都會使用搜索引擎數(shù)次。所有的門戶網(wǎng)站都嵌入了搜索功能,而且他們中大多數(shù)都不得不依靠少數(shù)已有的搜索引擎提供商提供搜索結果。這是因為真正有能力經(jīng)常檢索和排列超過2億個頁面以保持數(shù)據(jù)時效性的網(wǎng)站屈指可數(shù)。Google也許是被公認的持續(xù)性和規(guī)律性的搜索引擎,而實現(xiàn)這一點也只用了兩年不到的時間。Google用一周時間覆蓋現(xiàn)有的網(wǎng)頁,同時再用一周時間計算排列每一個頁面的序列等級。Google的一個更新周期大約是28天,這對那些對新聞如饑似渴的網(wǎng)蟲們來說似乎是慢了一些。

    站長資訊網(wǎng)www.admin5.com


    01年8月,Google對新聞類網(wǎng)站開始了二次迷你檢索,此類檢索將會使新聞類網(wǎng)站每天均被檢索一次。而每次檢索的結果將會被混在一起,這樣會給搜索者一種更新的印象。 對于普通的網(wǎng)站管理者,從1996年到02年,運營好一個網(wǎng)站的技巧被戲劇性地改變了。這完全是由于搜索引擎重要性的增加。盡管在00年以及01年大多數(shù).COM神話開始崩潰(這對于那些對崩潰前的日子記憶猶新的非商業(yè)性網(wǎng)站的斑竹們是一個解脫),這個事實一直延續(xù)到現(xiàn)在,而搜索引擎幾乎是所有網(wǎng)站頁面設計與鏈接的基本要素。那也是為什么搜索引擎網(wǎng)站認為應該將聯(lián)邦交易委員會所提出的公正客觀的排序標準計算法則需要進一步審視。 什么樣的客觀標準才是有效的 序列標準評判分成三個部分。部分是鏈接受歡迎程度,這被大量的搜索引擎一定程度使用。Google的頁面序列等級是"鏈接知名度"的最原始模式,并且保持著其最純潔的表達方式。這第二個部分則是網(wǎng)頁特色。這部分包括字體大小、網(wǎng)頁標題、關鍵字、關鍵字出現(xiàn)頻率、文字相近度、文件名、目錄名以及域名。那部分是內容分析。通常這一步會將搜索結果即時分類后歸入幾個項目中,這使得搜索者可以通過更具體的樣式得到數(shù)據(jù)。以上每一種方法都有自己的作用。搜索引擎使用和第二種方法的一些組合,或者是單獨使用頁面特性檢索(第三種方法),又或者是三種方法全部使用。 內容分析是這三種方法中最最困難的一種,但它也是非常讓人浮想聯(lián)翩的。如果一切變得理想化,當使用這種方法時,圖形的檢索將會成為可能,這種方法會使搜索引擎因為其創(chuàng)新與卓越贏得輝煌的聲譽。但在許多情況下,這種方法并不能正常運作,因為計算機對于自然語言的處理并不擅長。它們不會明白這一大堆來自于不相干的來源的語言之間有什么細微的差別。而且大部分的搜索引擎都會使用成打的語言種類,而由于每一種語言都會有自己的不同之處,這使得內容分析更為困難。有一些搜索引擎已經(jīng)對此做了一些有趣的改進,其中有些甚至還發(fā)展了圖形搜索功能,但是Google并不是其中之一。其實內容分析最有希望的前景在于它能夠被用于和鏈接知名度相結合,在特定的領域內排列網(wǎng)站。這可能為解決一些純鏈接知名度的問題提供一個新的思考角度。 鏈接知名度,Google把它成為PageRank,很顯然是Google的序列層最重要的部分。當一個頁面的部分頁面特性能夠勝過其較其上位的競爭頁面的頁面序列時,一些按照通常標準具有十分完美頁面關聯(lián)的網(wǎng)頁會因為極低的頁面序列而被埋沒將會成為十分正常的事。另一方面,一個在其標題、頭條以及內部鏈接均有可查詢元素的網(wǎng)站,也可能因為其母網(wǎng)站的鏈接知名度不夠而在排列中遭到埋沒,同時不能向這些相關網(wǎng)站過渡足夠的頁面序列等級。 02年12月,Google發(fā)布了一個可供下載的工具欄,它可以看到任何網(wǎng)頁相關的頁面序列等級。實際上可下載的工具欄解析,以及針對競爭頁面所做的頁面排列研究,也涉及了對頁面序列規(guī)律的相當洞察。 此外,頁面序列等級驅使Google每月檢索一次,相對于那些頁面序列等級低的網(wǎng)站,頁面序列等級高的網(wǎng)站將會被更早,更快,更深入地檢索。對于那些擁有相對較低序列等級的大型網(wǎng)站,這確實是個阻礙。假如你的網(wǎng)頁不被檢索,那也不會被編入序列索引中。假如不被編入Google的索引中,人們不會知道。假如人們不知道,那么沒有足夠的點數(shù)維持網(wǎng)站。Google另外對所有網(wǎng)頁啟動了28天的更新周期,所以錯過的網(wǎng)頁在下一輪更新還有機會。簡單地說,頁面序列等級是Google的核心與實質,對于非常重要的檢索和排列也一樣。到02年Google已經(jīng)被普遍認知為世界最知名的搜索引擎。 如何使頁面序列等級達到標準? 首先,Google的單純的宣言"頁面序列等級完全是依賴于網(wǎng)站的的民主特性"必須被認真審視一番。在一個民主體制中,每一個人只有一次投票機會。而對于頁面序列等級,富有的人比貧窮的人有更多的投票機會,或者,在網(wǎng)絡范圍內,頁面序列等級高的網(wǎng)頁所投的票會比頁面序列等級低的網(wǎng)頁所投的票重要。Google對此的解釋是:"投票計算是投票方自身的重要性決定了投票本身的重要?quot;。換句話說其實是,富人更富,而窮人幾乎都不能被計算在內。這不是"的民主",而是的暴政。搜索引擎是美國的夢幻機器,是一個可以以大欺小的地方。頁面序列等級只是看上去更貼合聯(lián)邦交易委員會所標榜的 "公平、客觀的序列標準"。 其次,只有大型的網(wǎng)站才會有大量的數(shù)據(jù)。假如你的網(wǎng)站擁有一個較平均的頁面序列等級,你不用非常費心地將你的數(shù)據(jù)改成Google能檢索到的有效格式,因為Google很有可能不會檢索你所有的數(shù)據(jù)。這對于一些擁有超過幾千個網(wǎng)頁,同時主頁在Google的工具欄上的粗略分數(shù)只有不足5個等級分的網(wǎng)站來說非常重要。 再次,為了讓Google能深入訪問并檢索擁有數(shù)千個頁面的網(wǎng)站,這需要一個入口網(wǎng)頁的分層系統(tǒng),它能使Google的檢索系統(tǒng)從頂層向下開始工作。一個擁有數(shù)千網(wǎng)頁的單獨網(wǎng)站,其所有典型的外部鏈接都會鏈接至它的主頁,而很少或者根本不會鏈接到它的內頁上。因此主頁的頁面序列等級也籍由內部分層鏈接結構的功效而得以分布到深層頁面上。但當檢索系統(tǒng)搜索到這些大樹底下的真正"事物"的時候,這些頁面的頁面序列等級經(jīng)常會歸零。零意味著該頁面的序列等級完全毀壞,甚至當該頁面已經(jīng)被Google的檢索系統(tǒng)發(fā)現(xiàn),并被列入索引中,而它具有出色的頁面特性。因此原則是:只有較大型的,知名度高的網(wǎng)站將它們的數(shù)據(jù)置于網(wǎng)上的機會更大,然后期待Google能夠適時地光顧它們的數(shù)據(jù)。這對于早在1999年Google啟動之前已經(jīng)存在的網(wǎng)站也是一樣的。 無數(shù)據(jù)網(wǎng)站會如何呢? 頁面序列等級也會在一些地方產(chǎn)生負面的效果,甚至是那些沒有什么數(shù)據(jù)的網(wǎng)站。頁面序列等級的實質是不公平的,它其實是其積極作用的對立面。當大多數(shù)人將積極的作用看作反面的不公正時,沒有人會主張這種有利于已有特權的人為的不公正是解決問題的方法。這本來也是Google所主張的內容。 由于Google的強勢,在02年開設新網(wǎng)站并使網(wǎng)站走上正規(guī)相對于Google成名前困難了許多。新網(wǎng)站的步是要讓自己被列入一個開放式的目錄計劃,比較直白的說去dmoz.org 登記你的網(wǎng)站。這是Google每月一次檢索基礎。再經(jīng)過將近一年試圖從其它已建立的網(wǎng)站誘騙鏈接(或友情鏈接交換)到自己的新網(wǎng)站,一個新的斑竹可以期望每天有不到30次的訪問量。而另一方面,一個有相當頁面序列等級的網(wǎng)站每天則會有上萬的訪問量。這是網(wǎng)絡世界的標準,而Google那0~10的工具欄則是這一標準的表達,而6分也許是及格。由原先的等級4升至等級5需要更多次的新鏈接。這一點并不容易達到。癥的法可能早已經(jīng)在網(wǎng)絡某個角落存在了,只不過假如存在于新的網(wǎng)站上,那么你無法發(fā)現(xiàn)它。值得注意的是中文網(wǎng)站的分數(shù)會相對低很多,這是因為發(fā)展及Google業(yè)務進程的原因。 頁面序列等級也鼓勵網(wǎng)站管理者們改變他們的鏈接模式。在討論"搜索引擎化"的論壇上,斑竹們甚至討論對一些鏈接廣告收費,收費標準是按照它們所達到的頁面序列等級。這將使那些頁面序列等級很低同時支付這些鏈接廣告的網(wǎng)站收益。而有時候這些頁面序列等級是由于鏈接作弊或者是其它一些不正當努力的成果,而這些正是Google努力去偵測并及時將之頁面序列等級歸零作為處罰。另一方面,Google專業(yè)的網(wǎng)站優(yōu)化員能夠這些類似垃圾郵件的技術。鏡像網(wǎng)站以及存在于某些網(wǎng)域內的復制頁將會被Google查禁并立即處罰,甚至當某些類似網(wǎng)站有其存在的特殊原因時也是這樣。

    admin5.com


    總之,Google使得鏈接模式發(fā)生了意義重大的改變。許多網(wǎng)站管理者吝嗇于給出自己的鏈接(這能緩解你的頁面序列等級轉移到你所給予鏈接的網(wǎng)站),同時他們又不顧一切地想從別人的網(wǎng)站得到更多的鏈接。因此"google吧"網(wǎng)站將友情鏈接的頁面放在了二級頁面,也正式因為這樣的考慮。當游戲變得商業(yè)化時,才會這樣有趣。 Google應該做什么 我們覺得頁面序列等級在走它自己的路。Google完全可以放任它,同時不應該去突出它。步應該停止在工具欄上再顯示頁面序列等級。這同時會減弱頁面序列等級在網(wǎng)站優(yōu)化者和網(wǎng)站管理者中的印象,以及由于這些已形成的印象所導致的奇異的影響。第二步是在所有的公關文章中不提及頁面序列等級,而代之以有關鏈接知名度只是眾多頁面序列算法中的一個重要因素的內容。同時Google應該保持眾多算法的平衡以使得的頁面特色不會因為較低的鏈接知名度而變得無用。 頁面序列等級必須合理化以使"富人的專制"特性縮減,并代之以類似鏈接知名度的更為平等的方式。這在很大程度上將會簡化那些用以滿足排列2億網(wǎng)站需要的復雜的循環(huán)計算結果,而得出如此復雜的計算結果對Google來說代價也是是非常昂貴的。而網(wǎng)站檢索也必須不以頁面序列等級所驅動。Google應該使用一種方法,使得某網(wǎng)站即使在一次檢索中未被發(fā)現(xiàn),Google的檢索程序也能在下一次檢索時從前一次遺漏的地方發(fā)現(xiàn)這個網(wǎng)站。 Google對于網(wǎng)絡來說是越來越重要了,它也許應該成為一項公眾或公益事業(yè)。來自于像聯(lián)邦交易委員會這樣的政府機構的,對于搜索引擎利益的控制是非常應該的,但我們感覺聯(lián)邦交易委員會也僅僅非常表面和空洞地注意到了搜索引擎表面的弊端。開始采用贊助鏈接以及廣告欄的Google并不是一個很大的顧慮,即使Nader小組針對所謂"商業(yè)目的提示警告"向聯(lián)邦交易委員會進行了投訴。 這其實是個錯誤,因為"商業(yè)目的提示警告"的提出是沒有足夠接近地觀察和了解頁面序列等級的結果。Google已經(jīng)實行的頁面序列等級的一些方面幾乎和付費頁面排序一樣有害。為了保護消費者的利益,聯(lián)邦交易委員會應該控制廣告商在搜索引擎中的過度炫耀以保護消費者利益。Google仍舊是個搜索引擎,他們只要修正了頁面序列等級的一些壞處足以說明它還是一個的搜索引擎。 當這篇寫于02年8月的文章被最終翻譯時,Google收購了Blogger.com, 中國的.CN域名剛剛于3月17日推出,blogger.cn還沒有被人注冊。外面天氣很好。 admin5.com 版權所有


    注:Daniel Brandt是公眾信息調查有限公司(Public Information Research, Inc.)的創(chuàng)建人和總裁。這家公司是一個贊助NameBase服務的免稅公共團體。他自1982年開始編輯NameBase,而他所編輯的數(shù)據(jù)資料是從1974開始的,而現(xiàn)在他PIR的一些網(wǎng)站的程序員和網(wǎng)站管理人。他經(jīng)常參加各種論壇上的討論,在這些論壇上許多網(wǎng)站管理者交流一些秘密的計算方法,程序錯誤以及對搜索引擎的不同行為的看法。在00年10月Google成為個透過數(shù)千個動態(tài)頁面深入PIR主網(wǎng)站的搜索引擎之前,Brandt已經(jīng)在觀察Google與NameBase的交互性。而關于他反對Google的霸權這件事上他是這么說的:"我感覺這像是件正確的事情。這相當于在網(wǎng)絡世界里又一次我的起兵反抗。"次是針對他以前的一次起訴官司而言。 

    admin5.com


    立即預約