python如何实现全角半角的相互转换

 更新时间:2023年11月08日 09:34:20   作者:西奥斯  
这篇文章主要介绍了python如何实现全角半角的相互转换方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

转换说明

全角半角转换说明

有规律(不含空格):

  • 全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)
  • 半角字符unicode编码从33~126 (十六进制 0x21~ 0x7E)

特例

空格比较特殊,全角为 12288(0x3000),半角为 32(0x20)

# 正则直接把全角空格替换为半角空格
text2 = re.sub('\s+', ' ', str1)

除空格外,全角/半角按unicode编码排序在顺序上是对应的(半角 + 0x7e= 全角),所以可以直接通过用+-法来处理非空格数据,对空格单独处理。

注:

  • 中文文字永远是全角,只有英文字母、数字键、符号键才有全角半角的概念,
  • 一个字母或数字占一个汉字的位置叫全角,占半个汉字的位置叫半角。

字符串整个替换

def strQ2B(ustring):
    """全角转半角"""
    rstring = ""
    for uchar in ustring:
        inside_code = ord(uchar)
        print(inside_code)
        if inside_code == 12288:  # 全角空格直接转换
            inside_code = 32
        elif 65281 <= inside_code <= 65374:  # 全角字符(除空格)根据关系转化
            inside_code -= 65248
 
        rstring += unichr(inside_code)
    return rstring
 
 
def strB2Q(ustring):
    """半角转全角"""
    rstring = ""
    for uchar in ustring:
        inside_code = ord(uchar)
        if inside_code == 32:  # 半角空格直接转化
            inside_code = 12288
        elif 32 <= inside_code <= 126:  # 半角字符(除空格)根据关系转化
            inside_code += 65248
 
        rstring += unichr(inside_code)
    return rstring

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

最新评论