首頁(yè) > 新聞 > 網(wǎng)站建設(shè) > 企業(yè)網(wǎng)站建設(shè)標(biāo)簽代碼的使用方法
企業(yè)網(wǎng)站建設(shè)標(biāo)簽代碼的使用方法
index、noindex、follow、nofollow的使用;
爬蟲(chóng)是目前最常見(jiàn)的網(wǎng)絡(luò)程序,曾經(jīng)有過(guò)統(tǒng)計(jì),說(shuō)是目前的網(wǎng)絡(luò)流量有一半以上是爬蟲(chóng)使用的。雖然爬蟲(chóng)程序隨處可見(jiàn),但是并不代表這種做法就是合理合法的。
在抓取網(wǎng)頁(yè)時(shí),我們要讓自己的爬蟲(chóng)遵守Robot.txt協(xié)議。一般網(wǎng)站有兩種方式聲明不想被爬蟲(chóng)爬取按:第一種是在站點(diǎn)的根目錄下增加一個(gè)純文本文件,例如http://www.aaa.com/robots.txt。第二種是直接在頁(yè)面中使用robots的meta標(biāo)簽。
接下來(lái),詳細(xì)介紹一下robots的meta標(biāo)簽。標(biāo)簽有四類(lèi):index、noindex、follow、nofollow。使用時(shí)以逗號(hào)分隔。
index指令:表示Robot可以索引本頁(yè);
follow指令:表示Robot可以跟蹤本頁(yè)鏈接;
noindex指令:表示拒絕Robot索引本頁(yè),但可跟蹤該頁(yè)上的鏈接;
nofollow指令:表示拒絕Robot跟蹤本頁(yè)鏈接,但可索引本頁(yè)。
根據(jù)以上的命令,我們就有了一下的四種組合:
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本頁(yè),而且可以順著本頁(yè)繼續(xù)索引別的鏈接
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不許抓取本頁(yè),但是可以順著本頁(yè)抓取索引別的鏈接
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本頁(yè),但是不許順著本頁(yè)抓取索引別的鏈接
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不許抓取本頁(yè),也不許順著本頁(yè)抓取索引別的鏈接。
這里需要注意的是,不要把兩個(gè)對(duì)立的反義詞寫(xiě)到一起,例如
<META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">
還有一點(diǎn),禁止搜索引擎建立快照。
<meta name="robots" content="noarchive">
以上的一段代碼限制了所有的搜索引擎建立你的網(wǎng)頁(yè)快照。如果我們需要僅僅限制一個(gè)搜索引擎建立快照的話,就可以像如下這樣去寫(xiě)
<meta name="Googlebot" content="noarchive">
這樣的標(biāo)記是禁止搜索引擎為你的網(wǎng)站建立快照。
Meta標(biāo)簽的使用;
meta標(biāo)簽的組成
meta標(biāo)簽共有兩個(gè)屬性,它們分別是http-equiv屬性和name屬性,不同的屬性又有不同的參數(shù)值,這些不同的參數(shù)值就實(shí)現(xiàn)了不同的網(wǎng)頁(yè)功能。
1、name屬性
name屬性主要用于描述網(wǎng)頁(yè),與之對(duì)應(yīng)的屬性值為content,content中的內(nèi)容主要是便于搜索引擎機(jī)器人查找信息和分類(lèi)信息用的。
meat標(biāo)簽的name屬性語(yǔ)法格式是:<meta name="參數(shù)" content="具體的參數(shù)值"> 。
其中name屬性主要有以下幾種參數(shù):
A、Keywords(關(guān)鍵字)
說(shuō)明:keywords用來(lái)告訴搜索引擎你網(wǎng)頁(yè)的關(guān)鍵字是什么。
舉例:<meta name ="keywords" content="science, education,culture,politics,ecnomics,relationships, entertaiment, human">
B、description(網(wǎng)站內(nèi)容描述)
說(shuō)明:description用來(lái)告訴搜索引擎你的網(wǎng)站主要內(nèi)容。
舉例:<meta name="description" content="This page is about the meaning of science, education,culture.">
C、robots(機(jī)器人向?qū)?
說(shuō)明:robots用來(lái)告訴搜索機(jī)器人哪些頁(yè)面需要索引,哪些頁(yè)面不需要索引。
content的參數(shù)有all,none,index,noindex,follow,nofollow。默認(rèn)是all。
舉例:<meta name="robots" content="none">
D、author(作者)
說(shuō)明:標(biāo)注網(wǎng)頁(yè)的作者
舉例:<meta name="author" content="zys666,zys666@21cn.com">
2、http-equiv屬性
http-equiv顧名思義,相當(dāng)于http的文件頭作用,它可以向?yàn)g覽器傳回一些有用的信息,以幫助正確和精確地顯示網(wǎng)頁(yè)內(nèi)容,與之對(duì)應(yīng)的屬性值為content,content中的內(nèi)容其實(shí)就是各個(gè)參數(shù)的變量值。
meat標(biāo)簽的http-equiv屬性語(yǔ)法格式是:<meta http-equiv="參數(shù)" content="參數(shù)變量值"> ;其中http-equiv屬性主要有以下幾種參數(shù):
A、Expires(期限)
說(shuō)明:可以用于設(shè)定網(wǎng)頁(yè)的到期時(shí)間。一旦網(wǎng)頁(yè)過(guò)期,必須到服務(wù)器上重新傳輸。
用法:<meta http-equiv="expires" content="Fri, 12 Jan 2001 18:18:18 GMT">
注意:必須使用GMT的時(shí)間格式。
B、Pragma(cache模式)
說(shuō)明:禁止瀏覽器從本地計(jì)算機(jī)的緩存中訪問(wèn)頁(yè)面內(nèi)容。
用法:<meta http-equiv="Pragma" content="no-cache">
注意:這樣設(shè)定,訪問(wèn)者將無(wú)法脫機(jī)瀏覽。
C、Refresh(刷新)
說(shuō)明:自動(dòng)刷新并指向新頁(yè)面。
用法:<meta http-equiv="Refresh" content="2;URL=http://www.chinayancheng.net">
注意:其中的2是指停留2秒鐘后自動(dòng)刷新到URL網(wǎng)址。
D、Set-Cookie(cookie設(shè)定)
說(shuō)明:如果網(wǎng)頁(yè)過(guò)期,那么存盤(pán)的cookie將被刪除。
用法:<meta http-equiv="Set-Cookie" content="cookievalue=xxx; expires=Friday, 12-Jan-2001 18:18:18 GMT; path=/">
注意:必須使用GMT的時(shí)間格式。
E、Window-target(顯示窗口的設(shè)定)
說(shuō)明:強(qiáng)制頁(yè)面在當(dāng)前窗口以獨(dú)立頁(yè)面顯示。
用法:<meta http-equiv="Window-target" content="_top">
注意:用來(lái)防止別人在框架里調(diào)用自己的頁(yè)面。
F、content-Type(顯示字符集的設(shè)定)
說(shuō)明:設(shè)定頁(yè)面使用的字符集。
用法:<meta http-equiv="content-Type" content="text/html; charset=gb2312">
meta標(biāo)簽的功能
上面我們介紹了meta標(biāo)簽的一些基本組成,接著我們?cè)賮?lái)一起看看meta標(biāo)簽的常見(jiàn)功能:
1、幫助主頁(yè)被各大搜索引擎登錄
meta標(biāo)簽的一個(gè)很重要的功能就是設(shè)置關(guān)鍵字,來(lái)幫助你的主頁(yè)被各大搜索引擎登錄,提高網(wǎng)站的訪問(wèn)量。在這個(gè)功能中,最重要的就是對(duì)Keywords和description的設(shè)置。因?yàn)榘凑?b class="lemma-word" data-id="223" style="font-weight: normal;">搜索引擎的工作原理,搜索引擎首先派出機(jī)器人自動(dòng)檢索頁(yè)面中的keywords和decription,并將其加入到自己的數(shù)據(jù)庫(kù),然后再根據(jù)關(guān)鍵詞的密度將網(wǎng)站排序。因此,我們必須設(shè)置好關(guān)鍵字,來(lái)提高頁(yè)面的搜索點(diǎn)擊率。下面我們來(lái)舉一個(gè)例子供大家參考:
<meta name="keywords" content="政治,經(jīng)濟(jì), 科技,文化, 衛(wèi)生, 情感,心靈,娛樂(lè),生活,社會(huì),企業(yè),交通">
<meta name="description" content="政治,經(jīng)濟(jì), 科技,文化, 衛(wèi)生, 情感,心靈,娛樂(lè),生活,社會(huì),企業(yè),交通">
設(shè)置好這些關(guān)鍵字后,搜索引擎將會(huì)自動(dòng)把這些關(guān)鍵字添加到數(shù)據(jù)庫(kù)中,并根據(jù)這些關(guān)鍵字的密度來(lái)進(jìn)行合適的排序。
。病⒍x頁(yè)面的使用語(yǔ)言
這是meta標(biāo)簽最常見(jiàn)的功能,在制作網(wǎng)頁(yè)時(shí),我們?cè)诩?b class="lemma-word" data-id="384" style="font-weight: normal;">HTML代碼下都會(huì)看到它,它起的作用是定義你網(wǎng)頁(yè)的語(yǔ)言,當(dāng)瀏覽者訪問(wèn)你的網(wǎng)頁(yè)時(shí),瀏覽器會(huì)自動(dòng)識(shí)別并設(shè)置網(wǎng)頁(yè)中的語(yǔ)言,如果你網(wǎng)頁(yè)設(shè)置的是GB碼,而瀏覽者沒(méi)有安裝GB碼,這時(shí)網(wǎng)頁(yè)只會(huì)呈現(xiàn)瀏覽者所設(shè)置的瀏覽器默認(rèn)語(yǔ)言。同樣的,如果該網(wǎng)頁(yè)是英語(yǔ),那么charset=en。下面就是一個(gè)具有代表性的例子:
。糾eta http-equiv=″content-Type″ content=″text/html; charset=gb2312″〉
該代碼就表示將網(wǎng)頁(yè)的語(yǔ)言設(shè)置成國(guó)標(biāo)碼。
。、自動(dòng)刷新并指向新的頁(yè)面
如果你想使您的網(wǎng)頁(yè)在無(wú)人控制的情況下,能自動(dòng)在指定的時(shí)間內(nèi)去訪問(wèn)指定的網(wǎng)頁(yè),就可以使用meta標(biāo)簽的自動(dòng)刷新網(wǎng)頁(yè)的功能。下面我們來(lái)看一段代碼:
〈meta http-equiv=″refresh″ content=″2; URL=http://www.yeah.net″〉
這段代碼可以使當(dāng)前某一個(gè)網(wǎng)頁(yè)在2秒后自動(dòng)轉(zhuǎn)到http://www.yeah.net頁(yè)面中去,這就是meta的刷新作用,在content中,2代表設(shè)置的時(shí)間(單位為秒),而URL就是在指定的時(shí)間后自動(dòng)連接的網(wǎng)頁(yè)地址。
。础(shí)現(xiàn)網(wǎng)頁(yè)轉(zhuǎn)換時(shí)的動(dòng)畫(huà)效果
使用meta標(biāo)簽,我們還可以在進(jìn)入網(wǎng)頁(yè)或者離開(kāi)網(wǎng)頁(yè)的一剎那實(shí)現(xiàn)動(dòng)畫(huà)效果,我們只要在頁(yè)面的html代碼中的<head></head>標(biāo)簽之間添加如下代碼就可以了:
<meta http-equiv="Page-Enter" content="revealTrans(duration=5.0, transition=20)">
<meta http-equiv="Page-Exit" content="revealTrans(duration=5.0, transition=20)">
一旦上述代碼被加到一個(gè)網(wǎng)頁(yè)中后,我們?cè)龠M(jìn)出頁(yè)面時(shí)就會(huì)看到一些特殊效果,這個(gè)功能其實(shí)與FrontPage2000中的Format/Page Transition一樣,但我們要注意的是所加網(wǎng)頁(yè)不能是一個(gè)Frame頁(yè);
。、網(wǎng)頁(yè)定級(jí)評(píng)價(jià)
IE4.0以上版本的瀏覽器可以防止瀏覽一些受限制的網(wǎng)站,而之所以瀏覽器會(huì)自動(dòng)識(shí)別某些網(wǎng)站是否受限制,就是因?yàn)樵诰W(wǎng)站meta標(biāo)簽中已經(jīng)設(shè)置好了該網(wǎng)站的級(jí)別,而該級(jí)別的評(píng)定是由美國(guó)RSAC,即娛樂(lè)委員會(huì)的評(píng)級(jí)機(jī)構(gòu)評(píng)定的,如果你需要評(píng)價(jià)自己的網(wǎng)站,可以連接到網(wǎng)站http://www.rsac.org/,按要求提交表格,那么RSAC會(huì)提供一段meta代碼給你,復(fù)制到自己網(wǎng)頁(yè)里就可以了。下面就是一段代碼的樣例:
〈meta http-equiv=″PICS-Label″
content=′(PICS-1.1 ″http://www.rsac.org/ratingsv01.html″
l gen true comment ″RSACi North America Server″
for ″http://www.rsac.org″
on ″2001.08.16T08:15-0500″
r (n 0 s 0 v 0 l 0))′〉
。、控制頁(yè)面緩沖
meta標(biāo)簽可以設(shè)置網(wǎng)頁(yè)到期的時(shí)間,也就是說(shuō),當(dāng)你在Internet Explorer 瀏覽器中設(shè)置瀏覽網(wǎng)頁(yè)時(shí)首先查看本地緩沖里的頁(yè)面,那么當(dāng)瀏覽某一網(wǎng)頁(yè),而本地緩沖又有時(shí),那么瀏覽器會(huì)自動(dòng)瀏覽緩沖區(qū)里的頁(yè)面,直到meta中設(shè)置的時(shí)間到期,這時(shí)候,瀏覽器才會(huì)去取得新頁(yè)面。例如下面這段代碼就表示網(wǎng)頁(yè)的到期時(shí)間是2001年1月12日18時(shí)18分18秒。
〈meta http-equiv=″e(cuò)xpires″ content=″Friday, 12-Jan-2001 18:18:18 GMT″〉
7、控制網(wǎng)頁(yè)顯示的窗口
我們還可以使用meta標(biāo)簽來(lái)控制網(wǎng)頁(yè)顯示的窗口,只要在網(wǎng)頁(yè)中加入下面的代碼就可以了:<metahttp-equiv="window-target" content="_top">,這段代碼可以防止網(wǎng)頁(yè)被別人作為一個(gè)Frame調(diào)用
robots.txt作用及其使用
robots.txt就是一份網(wǎng)站和搜索引擎雙方簽訂的規(guī)則協(xié)議書(shū),是搜索引擎中訪問(wèn)網(wǎng)站的時(shí)候要查看的第一個(gè)文件。首先爬行來(lái)檢查該站點(diǎn)根目錄下是否存在robots.txt。如果存在,蜘蛛就按照協(xié)議上規(guī)定爬行抓;沒(méi)有robots.txt,蜘蛛會(huì)隨著鏈接爬行進(jìn)行抓取。
理解User-agent和Disallow的定義:
User-agent:該項(xiàng)用于描述搜索引擎蜘蛛的名字;Disallow:該項(xiàng)用于描述不希望被抓取和索引的一個(gè)URL,這個(gè)URL可以是一條完整的路徑
下面是一些robots.txt基本的用法:
1、禁止所有搜索引擎訪問(wèn)網(wǎng)站的任何部分:
User-agent: *
Disallow: /
2、允許所有的robot訪問(wèn)
User-agent: *
Disallow:
或者也可以建一個(gè)空文件robots.txt
3、禁止所有搜索引擎訪問(wèn)網(wǎng)站的幾個(gè)部分(下例中的cgi-bin、tmp、private目錄)
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /private/
4、禁止某個(gè)搜索引擎的訪問(wèn)(下例中的BadBot)
User-agent: BadBot
Disallow: /
5、只允許某個(gè)搜索引擎的訪問(wèn)(下例中的WebCrawler)
User-agent: WebCrawler
Disallow:
User-agent: *
Disallow: /
- 基于用戶創(chuàng)新
界面設(shè)計(jì)日新月異,夢(mèng)創(chuàng)義堅(jiān)持基于用戶需求的界面創(chuàng)新設(shè)計(jì)……
- 服務(wù)設(shè)計(jì)思維
互聯(lián)網(wǎng)的格局發(fā)生的改變,在我們進(jìn)行設(shè)計(jì)服務(wù)時(shí)更是考慮不同用戶、不同……
- 洞察用戶心理
洞察用戶有意識(shí)和無(wú)意識(shí)的行為以及心理特征通過(guò)構(gòu)造一系列的服務(wù)來(lái)促進(jìn)……
- 查看更多 >>
最新新聞Latest News
- 中小型企業(yè)網(wǎng)站建設(shè)完應(yīng)該如何營(yíng)銷(xiāo)
- 很多中小型企業(yè)往往糾結(jié)于以下10個(gè)問(wèn)題:一、我們起步比別人晚,我們的……
- 做企業(yè)網(wǎng)站到底做給誰(shuí)看?
- 設(shè)計(jì)經(jīng)常時(shí)不時(shí)的遇到一些企業(yè)客戶,常常搞不清楚誰(shuí)會(huì)真正看你的企業(yè)網(wǎng)……
- 傳統(tǒng)企業(yè)進(jìn)軍移動(dòng)互聯(lián)網(wǎng),從移動(dòng)云網(wǎng)站開(kāi)始
- 移動(dòng)互聯(lián)網(wǎng)是移動(dòng)通信和互聯(lián)網(wǎng)融合的產(chǎn)物,其發(fā)展的重要基礎(chǔ)便是智能手……
- 網(wǎng)站建設(shè)和運(yùn)營(yíng)五大細(xì)節(jié)決定用戶黏性
- 網(wǎng)站的成功離不開(kāi)搜索引擎優(yōu)化,更離不開(kāi)最基礎(chǔ)最根本的用戶群體,如何……
- 2015年值得關(guān)注的電子商務(wù)5大趨勢(shì)
- 線上線下銷(xiāo)售的界線正在變得越來(lái)越模糊。在2015年,這一趨勢(shì)仍將繼續(xù)!