因為本博客使用的字體是明朝(*HiraMinProN*),該字體頗有古風,很符合個人的口味,Apple的設備無論是ios還是mac都內置了該字體。但是在使用中它對於簡體中文的支持很差,存在很多未覆蓋的字符。如果使用繁體中文書寫博客,應用該字體的效果還是不錯的。所以為了對中文的博文進行處理,使用*python*編寫了以下輕量級的簡繁體中文轉化腳本。
所需要的Python庫:zh_wiki.py,langconv
代碼編寫:
from langconv import *
class article:
'''
图片处理类
参数
-------------
infile: 输入文件路径
outfile: 输出文件路径
'''
def __init__(self,infile,outfile):
self.infile = infile
self.outfile = outfile
#简体转繁体
def simple2traditon(self):
fp = open(self.outfile,'w')
with open(self.infile) as t:
for line in t:
print(line)
line = Converter('zh-hant').convert(line)
print(line)
fp.write(line)
fp.close()
#繁体转简体
def tradition2simple(self):
fp = open(self.outfile, 'w')
with open(self.infile) as t:
for line in t:
line = Converter('zh-hans').convert(line)
fp.write(line)
fp.close()
實現效果: 轉換前: 唐僧为什么要取经——《西游记》中的政治路线图 轉換后: 唐僧為什麼要取經——《西遊記》中的政治路線圖 單行較長時速度一般,處理大文件速度一般,但是足夠輕量級,處理博文已經完全夠用
寫在最後:希望能體會到更多文字本身的美,深藏于文字內部的美。
參考博客:简体中文转繁体的python简单实现