整理了下搜索引擎原理知識,許多涉及到具體算法的地方很深奧,不知道該怎樣向不了解搜索引擎的人去傳播知識。我編了幾個通俗的案例去講,不知各位能否看懂,若是看不明白,有沒有更好的簡介方式。正確的理解什么是營口網(wǎng)站SEO優(yōu)化合理的運維自己的公司網(wǎng)站

1。關鍵詞
與關鍵詞有聯(lián)系的幾個原理,像HITS,齊普夫定律,向量空間模型,TF/IDF等。
每個關鍵詞的權重是通過數(shù)學公式與語義庫、網(wǎng)頁庫等結合算出來的。
堆砌關鍵詞的權重不是1+1=2,而是2>權重>1的一個動態(tài)數(shù)值,采取向量的夾角余弦公式cos=(ab)/(|a||b|),再加上搜索引擎對堆砌關鍵詞的anti-spam算法,和現(xiàn)在主流的seo觀點相悖。
2。搜索引擎爬蟲
搜索引擎蜘蛛的爬行方式與中國古代商朝的王位繼承制度相似,下面是維基百科的介紹。
商代政權由子姓王族所掌握,王族分為兩組,一組謚稱以甲乙為主,一組謚稱以丁為主,兩組互相通婚,輪流繼位執(zhí)政。王位多傳于另一組的下輩,有時也傳于同組內的同輩。王位以此互傳的方式,從而在兩組之間祖孫隔代繼承。
3。更新網(wǎng)站
斯坦福大學的2名研究者在2000年得出結論是網(wǎng)頁存在半衰期,接近泊松分布,所以1個網(wǎng)站長期不更新,搜索引擎爬蟲也會依據(jù)泊松分布,逐漸減少抓取次數(shù)。
4。關鍵詞密度
分詞實現(xiàn)源自20世紀的詹姆斯·喬伊斯一本天書《尤利西斯》,在這本書的1章,沒有1個標點符號,于是有位哈佛大學語言學家齊普夫專攻此書,把書里所有單詞全部統(tǒng)計出來,計算詞頻,發(fā)現(xiàn)了《尤利西斯》包含n個詞,將這些詞按其出現(xiàn)的頻次遞減地排序,那么序號r和其出現(xiàn)頻次f之積fr,將近似地為一個常數(shù),即fr=b,(式中r=1,2,3。…),又以其他名著驗證,結論非常近似。后來搜索引擎引進了這一定律,給每個詞庫中的每個關鍵詞按照總詞頻給以一定權重,低頻詞的權重較高,高頻詞的權重較低,所謂的關鍵詞密度亦是據(jù)此,長尾詞在文章中往往有較高的權重,重復出現(xiàn)關鍵詞,可以提高關鍵詞在頁面中的權重。
5。圖片
網(wǎng)頁中的圖片抓取不是一般抓取網(wǎng)頁的蜘蛛來抓的,而是由專門的抓取圖片的爬蟲負責。靠其他網(wǎng)頁上的超鏈接,alt屬性,網(wǎng)頁標題,以及圖片說明來確定這張圖片是什么畫面。
6。外鏈廣泛度
互聯(lián)網(wǎng)模型是鏈接拓撲結構,即緞帶形狀。不論傳統(tǒng)的互聯(lián)網(wǎng)亦或社交網(wǎng)絡,都是如此。搜索引擎通常從拓撲結構的左側開始向右單向爬行抓取。
最左邊的是歷史悠久的導航網(wǎng)站,之后是大型門戶網(wǎng)站,中間最密集的是中小型門戶網(wǎng)站,網(wǎng)站,右端是seo常接觸的企業(yè)網(wǎng)站,自媒體,草根站長。seoer經(jīng)常說外鏈為皇,就是因為seo接手的網(wǎng)站往往處在互聯(lián)網(wǎng)拓撲結構的右端末尾,從導航站開始,大量的外鏈可以提高搜索引擎爬蟲抓取目標頁的次數(shù)。
不明覺厲+1,哎特別是那些不懂優(yōu)化的后勤人員,在應聘我的時候,叫我說,什么是SEO?什么是SEM?SEO排名原理?等等?。?!問的我無言以對啊。我說這,她說那。我說那,她說這。沒有共同語言,你叫我怎么給她說。
數(shù)學系畢業(yè)的人表示:
原來還有這一出,哈哈~
我跟不熟悉的人介紹的時候,就跟他們說:
百度定了一套搜索的游戲規(guī)則,我們把網(wǎng)站按照這個游戲規(guī)則整理整理,
百度給你放在搜索結果的前幾個。
怎樣給不懂搜索引擎的人講搜索引擎原理?
首先分析對方的文化程度,接觸互聯(lián)網(wǎng)時間,對互聯(lián)網(wǎng)了解程度。
其次通過簡單的白話敘述搜索引擎遠離及每個名詞在白話中的意義。要讓他知道搜索引擎是什么,都有那些,排名怎么看。
再次深入描述原理,一點點的引入,是不要用官方語言,白話更容易理解。