我在写晋远信息网(www.geofuture.net)时没有考虑到url如何面向搜索引擎优化,完成了以后才开始优化的。这时要考虑一方面要静态的url,一方面要尽量保持原有的程序不变以便于以后维护,所以就采用url_rewrite的方法。下面是httpd.conf中相应的部分
documentroot /home/geofuture
servername www.geofuture.net
serveralias *.geofuture.net geofuture.net *.cic123.com
directoryindex index.files index.html index.php
rewriteengine on
#rewritelog logs/rewrite.log
#rewriteloglevel 9
#rewriterule / http://geofuture.vicp.net/ [l]
rewritecond %{request_filename} index.files [or]
rewritecond %{request_filename} error.files [or]
rewritecond %{request_filename} cat.files [or]
rewritecond %{request_filename} area.files [or]
rewritecond %{request_filename} info.files [or]
rewritecond %{request_filename} topic.files [or]
rewritecond %{request_filename} post.files [or]
rewritecond %{request_filename} profile.files [or]
rewritecond %{request_filename} userinfo.files [or]
rewritecond %{request_filename} cert.files [or]
rewritecond %{request_filename} revise.files [or]
rewritecond %{request_filename} review.files [or]
rewritecond %{request_filename} feedback.files [or]
rewritecond %{request_filename} keyrank.files [or]
rewritecond %{request_filename} rss.files
rewriterule ^(.+?)\q(.*)$ $1=$2 [n]
rewriterule ^(.+?)zz(.+)$ $1&$2 [n]
rewriterule ^(.+?)\.files(.*)$ $1.php$2 [n]
rewriterule ^(.+?)\.php(/|&)(.+).html$ $1.php?$3 [l]
errordocument 400 /error.php?status=400
errordocument 401 /error.php?status=401
errordocument 403 /error.php?status=403
errordocument 404 /error.php?status=404
errordocument 405 /error.php?status=405
errordocument 408 /error.php?status=408
errordocument 410 /error.php?status=410
errordocument 411 /error.php?status=411
errordocument 412 /error.php?status=412
errordocument 413 /error.php?status=413
errordocument 414 /error.php?status=414
errordocument 415 /error.php?status=415
errordocument 500 /error.php?status=500
errordocument 501 /error.php?status=501
errordocument 502 /error.php?status=502
errordocument 503 /error.php?status=503
errordocument 506 /error.php?status=506
我只把以内容为主的栏目优化了,至于登录和搜索等部分保持不变,因为这些部分也是搜索引擎不关心的。同时,一些常见的状态码(http status)也有相应的静态页面。上面只修改了外来请求的url,而程序生成的url通过下面的代码实现:
上面的函数定义放在公共头文件里面。然后,在需要优化的页面开始处加入以下代码:
ob_start(url_rewrite);
这也是原来的程序唯一需要修改的地方。这样做还有一个问题。 例如我写的分页函数等代码, 都要求原来动态的url, 而优化了以后通过 $_server['php_self'].'?'.$_server['query_string'] 就只能得到优化以后的静态url, 所有依赖于动态url的代码都得修改一下, 以能够处理原来的url和优化的。这样得改写公共头文件的许多代码。所以我就想了一个迂回的办法:
有了上面的函数,在需要动态url的地方只要调用一下就可以了,而不需重写各个核心函数。需要注意的是,url_rewrite和url_resume虽然是相反的过程,但是它们的参数是不同的。前者的参数是整个缓冲区,后者只是一个单个的url,因为恢复的情况毕竟很少,而全局处理重写可以提高速度。