具體特征如下:
1、通過模板實現俄文正常。
2、通過後台數據庫生成的靜態俄文信息,後台顯示正常, 前台亂碼。
3、英文正常。
和該主題相關的類似或不同表達
FSO寫UTF-8編碼文件
FSO怎麼才能生成utf-8編碼的文件
FSO生成的文件默認是什麼編碼格式
如何轉換成UTF-8編碼
FSO生成靜態網頁的問題
ASP中用FSO生成文件代碼如下
復制代碼 代碼如下:
function createfile(sfilename,scontent)
set fso=server.CreateObject("scripting.filesystemobject")
set f1=fso.opentextfile(sfilename,2,true,-1)
f1.write(scontent)
f1.close
set fso=nothing
end function
fso.opentextfile(sfilename,2,true,-1) 最後一個參數-1是指定編碼格式為Unicode,編碼格式為Unicode在網頁顯示的是UTF-16 little-endian。
OpenTextFile方法
創建指定文件並返回TextStream對象,該對象可用於讀或寫創建的文件。
object.OpenTextFile(filename[, iomode[, create[, format]]])
參數 object,必選項。應為FileSystemObjec或Folder對象的名稱。 這裡是fso。
filename,必選項。字符串表達式,指明要創建的文件。 這裡是sfilename。
iomode,可選參數,表示該文件是被用來讀、寫還是追加,默認為1表示讀,2表示寫操作,8表示追加操作。
create,可選參數,如果文件不存在是否創建,默認為false,如果希望進行創建,則設置為true。
format,參數可為下列設置之一,默認為ASCII格式,並沒有我們要的utf-8:
TristateUseDefault -2 以系統默認格式打開文件。
TristateTrue -1 以Unicode格式打開文件。
TristateFalse 0 以ASCII格式打開文件。
FSO的編碼屬性只有三種,系統默認,Unicode,ASCII,並沒有我們要的utf-8,所以一般中文系統上使用FSO組件生成的文件都是gb2312編碼格式。
解決方法一
GB2312編碼包含俄語字母,如果頁面設置為簡體中文GB2312, 那麼俄文能夠正常顯示, 但由於中文默認“宋體”顯示,在 “宋體”中俄語會顯示為全角字符,很難看,所以要采用外文字體,如“新羅馬”或“Arial”等。中國客戶那裡可以交差, 但真正的俄國人浏覽頁面時, 就需要下載和安裝中文,很不理想, 很可能導致放棄浏覽網頁。
解決方法二
ASP由於是一種古老的語言,它的一些功能對UTF-8支持非常差。FSO不支持直接生成UTF-8格式的文件,因為它無法指定需要的文件格式,比如,想生成一個UTF-8格式的文件,使用常用的Scripting.FileSystemObject對象就不行。必須換一種思路,用Adodb.Stream,當前一些blog程序就是這樣實現的,如zblog。
Scripting.FileSystemObject 對象創建文件的函數,是下面方式:
FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]])
其中的unicode屬性是這樣描述的:
可選項。Boolean值指明是否以Unicode或ASCII文件格式創建文件。如果以Unicode文件格式創建文件,則該值為True;如果以ASCII文件格式創建文件,則該值為False。如果省略此部分,則假定創建ASCII文件。
鮮然,無法用這個函數來創建UTF-8格式文件。
使用ADODB.Stream對象,使用方法見下面:
復制代碼 代碼如下:
Set objStream = Server.CreateObject("ADODB.Stream")
With objStream
.Open
.Charset = "utf-8"
.Position = objStream.Size
.WriteText=str
.SaveToFile server.mappath("/sitemap.xml"),2
.Close
End With
Set objStream = Nothing
附錄:ASCII、Unicode、UTF-8介紹
ASCII是一種字符集,包括大小寫的英文字母、數字、控制字符等,它用一個字節表示,范圍是0-127。
由於ASCII表示的字符非常有限,各個國家或者地區在此基礎上提出了自己的字符集,比如在中國應用非常廣泛的GB2312,它為漢字提供了編碼,用兩個字節表示。
這些字符集之間互不兼容,相同的數字可能表示不同的字符,為信息交流帶來了麻煩。
Unicode是一種字符集,它將世界上的所有字符映射成一個唯一的數字(code point),比如字母a對應的數字0x0041。目前Unicode還處於發展中,它所包容的字符越來越多。
在將Unicode表示的字符進行存儲時,還需要一定的編碼方式,比如UCS-2,它用兩個字節來表示Unicode編碼的字符。而UTF-8是Unicode字符集的另外一種編碼方式,它是變長度的,最多6個字節,小於127的字符用一個字節表示,與ASCII字符集的結果一樣,因而具有非常好的兼容性,ASCII編碼下的英語文本不需要修改就可以當作UTF-8編碼進行處理,應用非常廣泛。