Vim中特殊字符的读写详解

 更新时间:2016年11月20日 17:01:32   投稿:daisy  
最近在工作中遇到一个文章,在跨平台工作的时候由于不同编辑器处理换行和空白字符风格不一致, 常常在Vim下会看到一些特殊字符。这些特殊字符的含义可通过digraph-table查询, 也可根据digraph-table或Unicode/ASCII编码手动输入这些特殊字符。下面来一起看看详细的介绍

一、查看特殊字符

Vim中可见特殊字符会直接显示,不可见特殊字符会显示为该字符在命令行的输入方式, 例如\r显示为^M。通过:help digraph-table可看到所有Vim中可输入的特殊字符, 该文档的第一页如下:

char digraph hex  dec  official name
^@   NU   0x00  0  NULL  (NUL)
^A   SH   0x01  1  START OF HEADING (SOH)
^B   SX   0x02  2  START OF TEXT (STX)
^C   EX   0x03  3  END OF TEXT (ETX)
^D   ET   0x04  4  END OF TRANSMISSION (EOT)
^E   EQ   0x05  5  ENQUIRY (ENQ)
^F   AK   0x06  6  ACKNOWLEDGE (ACK)
^G   BL   0x07  7  BELL (BEL)
^H   BS   0x08  8  BACKSPACE (BS)
^I   HT   0x09  9  CHARACTER TABULATION (HT)
^@   LF   0x0a  10  LINE FEED (LF)
^K   VT   0x0b  11  LINE TABULATION (VT)
^L   FF   0x0c  12  FORM FEED (FF)
^M   CR   0x0d  13  CARRIAGE RETURN (CR)

第一列为特殊字符,第二列为digraph(见下文),第三列为十六进制表示, 第四列为十进制表示,第五列为该字符的官方名称。

显示当前文件的二进制编码可输入: %!xxd,该命令会替换文件内容!恢复:: %!xdd -r

二、通过digraph输入

Vim中显然没有什么特殊字符选择工具,但提供了两种输入特殊字符的方式:

     1、通过两个字符来输入一个特殊字符(digraph)。

     2、直接通过编码值(ASCII或Unicode)输入。

其中digraph是一种类似双拼的方法,连续输入两个字符来表示一个特殊字符。 需要先按下前导键<Ctrl-K>,例如在编辑模式下输入:

<Ctrl-K>Rg

将会出现®字符,其中"Rg"是该字符的digraph(双拼)。 所有的digraph可以通过:help digraph-table查询。

三、通过字符编码输入

除了digraph,还可直接通过字符编码来输入它,该字符不需要在Vim的digraph-table中。 这种方式也是在插入模式下进行的,需要先按下前导键<Ctrl-V> (Windows下<Ctrl-Q>)。

 有下列5种方式:

      十进制值ASCII:^Vnnn (000 <= nnn <= 255)

      八进制值:^VOnnn 或 ^Vonnn (000 <= nnn <= 377)

      十六进制值:^VXnn or ^Vxnn (00 <= nn <= FF)

      十六进制BMP Unicode:^Vunnnn (0000 <= nnnn <= FFFF)

      十六进制任何Unicode:^VUnnnnnnnn (00000000 <= nnnnnnnn <= 7FFFFFFF)

上述操作都是在Unicode字符编码设置下进行的。例如:

<Ctrl-V>065

将会输出A字符,65是它的ASCII编码,而Unicode兼容ASCII。

四、换行的搜索/替换/输入

换行在Vim中的行为很特殊也不够一致,需要单独讨论一下。

首先区分一下\r和\n:

     前者是回车(Carriage Return),在Vim中可通过<c-k>CR输入,显示为^M。

     后者是换行(New Line),在Vim中通过<CR>(回车)键输入,显示为回车并换行;

所以对于Windows风格换行(\r\n)在Vim中会在每行结尾显示^M。

替换

注意使用:s命令替换为换行(New Line)时,应当使用\r(相当于回车键)而不是\n。 例如将所有逗号替换为换行:

:%s/,/\r/g

如果使用\n则目标会被替换为空字符NULL(显示为^@)。

将DOS风格换行(\r\n)的文件转为Unix风格换行(\n)其实很简单,不需要手动查找替换:

:set fileformat=unix 
:w

搜索

在搜索模式(/)搜索换行时仍然应当使用\n字符,因为Vim的换行(Unix风格)确实是\n而不是\r\n。例如:

/foo\nbar

可以匹配到所有的:

foo
bar

五、查看不可见字符

除了特殊字符外,ASCII字符中还有大量的不可见字符,例如空格回车制表符等。 这些字符可以通过list变量来控制它们的显示与否:

" 显示隐藏字符
:set list
" 不显示隐藏字符
:set nolist
" 设置显示哪些隐藏字符
:set listchars=eol:$,tab:>-,trail:~,extends:>,precedes:<

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能有所帮助,如果有疑问大家可以留言交流。

相关文章

最新评论