技術(shù)員聯(lián)盟提供win764位系統(tǒng)下載,win10,win7,xp,裝機(jī)純凈版,64位旗艦版,綠色軟件,免費(fèi)軟件下載基地!

當(dāng)前位置:主頁(yè) > 教程 > 服務(wù)器類 >

Linux 本編輯器vim顯示utf-8文檔亂碼的解決方法

來(lái)源:技術(shù)員聯(lián)盟┆發(fā)布時(shí)間:2018-05-22 06:35┆點(diǎn)擊:

  在Linux系統(tǒng)操作中,Vim是文本編輯器,在使用Vim的時(shí)候,居然顯示utf-8文檔亂碼,遇到這種情況要如何解決呢?下面小編就給大家介紹下Linux如何解決Vim顯示utf-8文檔亂碼問(wèn)題,一起來(lái)看看吧。

    1.相關(guān)基礎(chǔ)知識(shí)介紹

  在Vim中,有四個(gè)與編碼有關(guān)的選項(xiàng),它們是:fileencodings、fileencoding、encoding和termencoding。在實(shí)際使用中,任何一個(gè)選項(xiàng)出現(xiàn)錯(cuò)誤,都會(huì)導(dǎo)致出現(xiàn)亂碼。因此,每一個(gè)Vim用戶都應(yīng)該明確這四個(gè)選項(xiàng)的含義。下面,我們?cè)敿?xì)介紹一下這四個(gè)選項(xiàng)的含義和作用。

  (1)encoding

  encoding是Vim內(nèi)部使用的字符編碼方式。當(dāng)我們?cè)O(shè)置了encoding之后,Vim內(nèi)部所有的buffer、寄存器、腳本中的字符串等,全都使用這個(gè)編碼。Vim 在工作的時(shí)候,如果編碼方式與它的內(nèi)部編碼不一致,它會(huì)先把編碼轉(zhuǎn)換成內(nèi)部編碼。如果工作用的編碼中含有無(wú)法轉(zhuǎn)換為內(nèi)部編碼的字符,在這些字符就會(huì)丟失。因此,在選擇 Vim 的內(nèi)部編碼的時(shí)候,一定要使用一種表現(xiàn)能力足夠強(qiáng)的編碼,以免影響正常工作。

  由于encoding選項(xiàng)涉及到Vim中所有字符的內(nèi)部表示,因此只能在Vim啟動(dòng)的時(shí)候設(shè)置一次。在Vim工作過(guò)程中修改encoding會(huì)造成非常多的問(wèn)題。用戶手冊(cè)上建議只在 .vimrc中改變它的值,事實(shí)上似乎也只有在 .vimrc中改變它的值才有意義。如果沒有特別的理由,請(qǐng)始終將encoding設(shè)置為utf-8。為了避免在非UTF-8的系統(tǒng)如Windows下,菜單和系統(tǒng)提示出現(xiàn)亂碼,可同時(shí)做這幾項(xiàng)設(shè)置:

  set encoding=utf-8

  set langmenu=zh_CN.UTF-8

  language message zh_CN.UTF-8

  (2)termencoding

  termencoding是Vim用于屏幕顯示的編碼,在顯示的時(shí)候,Vim會(huì)把內(nèi)部編碼轉(zhuǎn)換為屏幕編碼,再用于輸出。內(nèi)部編碼中含有無(wú)法轉(zhuǎn)換為屏幕編碼的字符時(shí),該字符會(huì)變成問(wèn)號(hào),但不會(huì)影響對(duì)它的編輯操作。如果termencoding沒有設(shè)置,則直接使用encoding不進(jìn)行轉(zhuǎn)換。

  舉個(gè)例子,當(dāng)你在Windows下通過(guò)telnet登錄Linux工作站時(shí),由于Windows的telnet是GBK編碼的,而Linux下使用UTF-8編碼,你在telnet下的Vim中就會(huì)亂碼。此時(shí)有兩種消除亂碼的方式:一是把Vim的encoding改為gbk,另一種方法是保持encoding為utf-8,把termencoding改為gbk,讓Vim在顯示的時(shí)候轉(zhuǎn)碼。顯然,使用前一種方法時(shí),如果遇到編輯的文件中含有GBK無(wú)法表示的字符時(shí),這些字符就會(huì)丟失。但如果使用后一種方法,雖然由于終端所限,這些字符無(wú)法顯示,但在編輯過(guò)程中這些字符是不會(huì)丟失的。

  對(duì)于圖形界面下的GVim,它的顯示不依賴TERM,因此termencoding對(duì)于它沒有意義。在GTK2下的GVim 中,termencoding永遠(yuǎn)是utf-8,并且不能修改。而Windows下的GVim則忽略termencoding的存在。

  (3)fileencoding

  當(dāng)Vim從磁盤上讀取文件的時(shí)候,會(huì)對(duì)文件的編碼進(jìn)行探測(cè)。如果文件的編碼方式和Vim的內(nèi)部編碼方式不同,Vim就會(huì)對(duì)編碼進(jìn)行轉(zhuǎn)換。轉(zhuǎn)換完畢后,Vim會(huì)將fileencoding選項(xiàng)設(shè)置為文件的編碼。當(dāng)Vim存盤的時(shí)候,如果encoding和fileencoding不一樣,Vim就會(huì)進(jìn)行編碼轉(zhuǎn)換。因此,通過(guò)打開文件后設(shè)置fileencoding,我們可以將文件由一種編碼轉(zhuǎn)換為另一種編碼。但是,由前面的介紹可以看出,fileencoding是在打開文件的時(shí)候,由Vim進(jìn)行探測(cè)后自動(dòng)設(shè)置的。因此,如果出現(xiàn)亂碼,我們無(wú)法通過(guò)在打開文件后重新設(shè)置fileencoding來(lái)糾正亂碼。

  簡(jiǎn)而言之,fileencoding是Vim中當(dāng)前編輯的文件的字符編碼方式,Vim保存文件時(shí)也會(huì)將文件保存為這種字符編碼方式 (不管是否新文件都如此)。

  (4)fileencodings

  編碼的自動(dòng)識(shí)別是通過(guò)設(shè)置fileencodings實(shí)現(xiàn)的,注意是復(fù)數(shù)形式。fileencodings是一個(gè)用逗號(hào)分隔的列表,列表中的每一項(xiàng)是一種編碼的名稱。當(dāng)我們打開文件的時(shí)候,VIM按順序使用fileencodings中的編碼進(jìn)行嘗試解碼,如果成功的話,就使用該編碼方式進(jìn)行解碼,并將fileencoding設(shè)置為這個(gè)值,如果失敗的話,就繼續(xù)試驗(yàn)下一個(gè)編碼。

  因此,我們?cè)谠O(shè)置fileencodings的時(shí)候,一定要把要求嚴(yán)格的、當(dāng)文件不是這個(gè)編碼的時(shí)候更容易出現(xiàn)解碼失敗的編碼方式放在前面,把寬松的編碼方式放在后面。例如,latin1是一種非常寬松的編碼方式,任何一種編碼方式得到的文本,用latin1進(jìn)行解碼,都不會(huì)發(fā)生解碼失敗——當(dāng)然,解碼得到的結(jié)果自然也就是理所當(dāng)然的“亂碼”。因此,如果你把latin1放到了fileencodings的第一位的話,打開任何中文文件都是亂碼也就是理所當(dāng)然的了。

    以下是網(wǎng)上推薦的一個(gè)fileencodings設(shè)置:

  set fileencodings=ucs-bom,utf-8,cp936,gb18030,big5,euc-jp,euc-kr,latin1

  其中,ucs-bom是一種非常嚴(yán)格的編碼,非該編碼的文件幾乎沒有可能被誤判為ucs-bom,因此放在第一位。