国产毛片午夜福利,国产黄网,国产亚洲天堂,97国产精品

  •  
    搜索引擎技術(shù)核心揭密
    發(fā)布時(shí)間:2005-03-31   瀏覽次數(shù):1186274
    編者按:這是一篇精彩的編程教學(xué)文章,不但詳細(xì)地剖析了搜索引擎的原理,也提供了筆者自己對(duì)使用PHP編制搜索引擎的一些思路。整篇文章深入淺出,相信無(wú)論是高手還是菜鳥(niǎo),都能從中得到不少的啟發(fā)。   談到網(wǎng)頁(yè)搜索引擎時(shí),大多數(shù)人都會(huì)想到雅虎。的確,雅虎開(kāi)創(chuàng)了一個(gè)互聯(lián)網(wǎng)絡(luò)的搜索時(shí)代。然而,雅虎目前用于搜索網(wǎng)頁(yè)的技術(shù)卻并非該公司原先自己開(kāi)發(fā)的。00年8月,雅虎采用了Google(www.google.com)這家由斯坦福大學(xué)學(xué)生創(chuàng)建的風(fēng)險(xiǎn)公司的技術(shù)。理由非常簡(jiǎn)單,Google的搜索引擎比雅虎先前使用的技術(shù)能更快、更準(zhǔn)確搜索到所需要的信息。   讓我們自己來(lái)設(shè)計(jì)、開(kāi)發(fā)一個(gè)強(qiáng)勁、的搜索引擎和數(shù)據(jù)庫(kù)恐怕短時(shí)間內(nèi)在技術(shù)、資金等方面是不可能的,不過(guò),既然雅虎都在使用別人的技術(shù),那么我們是不是也可以使用別人現(xiàn)成的搜索引擎網(wǎng)站呢? 剖析編程思路   我們可以這樣設(shè)想:模擬一個(gè)查詢,向某個(gè)搜索引擎網(wǎng)站發(fā)出相應(yīng)格式的搜索命令,然后傳回搜索結(jié)果,對(duì)結(jié)果的HTML代碼進(jìn)行分析,剝離多余的字符和代碼,按所需要的格式顯示在我們自己的網(wǎng)站頁(yè)面里。   這樣,問(wèn)題的關(guān)鍵在于,我們要選定一個(gè)搜索信息準(zhǔn)確(這樣我們的搜索才會(huì)更有意義。⑺俣瓤欤ㄒ?yàn)槲覀兎治鏊阉鹘Y(jié)果并顯示需要額外的時(shí)間),搜索結(jié)果簡(jiǎn)潔(便于進(jìn)行HTML源代碼分析和剝離)的搜索網(wǎng)站,由于新一代搜索引擎Google的各種優(yōu)良特性,這里我們選擇它為例,來(lái)看看用PHP怎樣實(shí)現(xiàn)后臺(tái)對(duì)Google(www.google.com)搜索、前臺(tái)個(gè)性化顯示這一過(guò)程。   我們先來(lái)看看Google的查詢命令的構(gòu)成。進(jìn)入www.google.com網(wǎng)站,在查詢欄中輸入“abcd”,點(diǎn)擊查詢按鈕,我們可以發(fā)現(xiàn)瀏覽器的地址欄變成:"http://www.google.com/search?q=abcd&btnG=Google%CB%D1%CB%F7&hl=zh-CN&lr=",可見(jiàn),Google是通過(guò)表單的get方式來(lái)傳遞查詢參數(shù)并遞交查詢命令的。我們可以使用PHP中的file()函數(shù)來(lái)模擬這個(gè)查詢過(guò)程。 了解File()函數(shù)   語(yǔ)法: array file(string filename);   返回值為數(shù)組,將文件全部讀入數(shù)組變量中。這里的文件可以是本地的,也可以是遠(yuǎn)程的,遠(yuǎn)程文件必須指明所使用的協(xié)議。例如: result=file(“http://www.google.com/search?q=abcd&btnG=Google%CB%D1%CB%F7&hl=zh-CN&lr=”),該語(yǔ)句將模擬我們?cè)贕oogle上查詢單詞“abcd”的過(guò)程,并將搜索結(jié)果以每行為元素,傳回到數(shù)組變量 result中。因?yàn)檫@里讀取的文件是遠(yuǎn)程的,所以協(xié)議名“http://”不能缺少。   如果要讓用戶輸入搜索字符進(jìn)行任意搜索,我們可以做一個(gè)輸入文本框和提交按鈕,并將上文中的被搜索字符“abcd”用變量替換:
    立即預(yù)約