在計算機(jī)還沒有出現(xiàn)之前,有一種叫做電傳打字機(jī)(Teletype Model 33)的玩意,每秒鐘可以打10個字符。但是它有一個問題,就是打完一行換行的時候,要用去0.2秒,正好可以打兩個字符。要是在這0.2秒里面,又有新的字符傳過來,那么這個字符將丟失。
于是,研制人員想了個辦法解決這個問題,就是在每行后面加兩個表示結(jié)束的字符。一個叫做"回車",告訴打字機(jī)把打印頭定位在左邊界;另一個叫做"換行",告訴打字機(jī)把紙向下移一行。
這就是"換行"和"回車"的來歷,從它們的英語名字上也可以看出一二。
后來,計算機(jī)發(fā)明了,這兩個概念也就被般到了計算機(jī)上。那時,存儲器很貴,一些科學(xué)家認(rèn)為在每行結(jié)尾加兩個字符太浪費了,加一個就可以。于是,就出現(xiàn)了分歧。
Unix系統(tǒng)里,每行結(jié)尾只有"<換行>",即"n";Windows系統(tǒng)里面,每行結(jié)尾是"<回車><換行>",即"rn";Mac系統(tǒng)里,每行結(jié)尾是"<回車>"。一個直接后果是,Unix/Mac系統(tǒng)下的文件在Windows里打開的話,所有文字會變成一行;而Windows里的文件在Unix/Mac下打開的話,在每行的結(jié)尾可能會多出一個^M符號。
因此在linux下創(chuàng)建的文本文件在windows中會連成一行,因為windows認(rèn)為沒有換行符(CRLF)。
在windows下創(chuàng)建的文本文件在linux中可能會出現(xiàn)每一行后面多了一個^M,這個^M要用ctrl + v ctrl + m打出,代表的意思就是CR(Carriage Return).
說到這里有人也許會問,為什么我在windows下創(chuàng)建的文本文件,在linux中顯示正常呢?
例如,我在windows下創(chuàng)建一個文本文件a.txt,放到我的linux中,用vim打開
可以看到顯示結(jié)果正常,行的結(jié)尾并沒有^M符號。這是因為vim在打開文件時,會自動檢測換行符,如果文本的所有換行符都是^M$(CRLF, 即windows的換行標(biāo)記),那么vim會自動以dos格式顯示文本內(nèi)容,忽略掉每一行結(jié)尾的^M$,因此文本顯示是正常的。
注意上面我圖片的兩個箭頭指示的vim編輯器最下方的兩個標(biāo)志[noeol]和[dos],先來解釋第二個標(biāo)志"[dos]",這表示vim識別到文本的每一行都是^M$的換行符,因此vim自動以dos文本格式來顯示文件。所以我們看到文本顯示是正常的。
那么為什么有的時候windows下創(chuàng)建或編輯的文件在linux下會出現(xiàn)^M呢,vim不是能自動識別嗎?這是因為,vim會檢查文本的每一行換行符,只要有一行的換行符不是windows格式,那么vim就會以unix文件格式來顯示文件,這時換行符為$, 因此我們會看到文本的行后面多了一個^M符號。
這里我用cat -A顯示文件的特殊符號:
文件一共四行,可以看換行符都是^M$(箭頭所指),因此vim會用[dos]文件格式來顯示這個文本。
這里還可以發(fā)現(xiàn)文件的最后一行沒有換行符,這就是第一張圖vim中的[noeol]標(biāo)志的由來 ,因為在windows下處理的文本,最后一行是不會加上換行符的,而linux下創(chuàng)建的文本的規(guī)則是每一行都有換行符,包括最后一行。因此vim會提示no end-of-line, 告訴我們這個文件包含沒有換行符結(jié)束的行。
用wc -l統(tǒng)計這個文件的行數(shù):
結(jié)果是3行,少了一行,原因是文件的最后一行沒有換行符。
我在linux下用vim編輯一個新文件,內(nèi)容和剛剛的a.txt一樣,用cat -A查看:
可以看到linux下創(chuàng)建的文本,每一行都是有換行符的,包括最后一行,用wc -l統(tǒng)計行數(shù):
這時統(tǒng)計結(jié)果正確。
再用sed替換windows下創(chuàng)建的a.txt, 將其中一行的換行符^M$中的^M去掉,變成linux的換行符$
這里我把文件的第二行的換行符替換成了linux格式的$,注意sed命令中的^M
在命令行中不是直接輸入,而是 ctrl+v和ctrl+m. 再用vim打開這個文件: