Rime demo

我的 Rime(鼠须管 Squirrel)配置,仓库:iDvel/rime-settings

部署前注意

请先将 pinyin_simp.dict.yaml 中的 - cn_dicts/private 这行删除,这是我自己的私人词库(联系人之类的),否则部署时会报错。

各文件说明

.
├── default.custom.yaml  # 全局设置
├── squirrel.custom.yaml # 皮肤设置

├── pinyin_simp.schema.yaml # 拼音方案(关键配置文件)
├── symbols.custom.yaml     # 自定义 symbols,单独拆分出来了,主要是将「/」模式改为了「v」模式
├── pinyin_simp.dict.yaml   # 挂载词库
├── cn_dicts/               # 词库主目录

├── easy_en.schema.yaml # 英文方案
├── easy_en.dict.yaml   # 挂载词库
├── en_dicts/           # 词库主目录

├── custom_phrase.txt # 自定义文本
├── opencc/           # Emoji、符号、词语映射
├── rime.lua          # lua 脚本
└── zh-hans-t-essay-bgw.gram # 八股文语言模型

installation.yamluser.yaml 两个文件在第一次部署后会自动生成。

部署完成后可以在 installation.yaml 中修改或添加以下两行,配置同步目录,示例:

# ...
sync_dir: "/Users/dvel/Dropbox/Rime_userdb" # 同步的路径
installation_id: "Dvel-MBP-1"        # 本机的 ID 标志
# ...

方案设计

在 pinyin_simp 基础上修改,首先删掉了反查和笔画,然后发现没剩下多少代码了,就不单独新建 pinyin_simp.custom.yaml 再以 patch 的方式写配置了,直接在里面写了。

挂载了英文输入方案以方便进行输入英文。

中英文的词库都放进了 cn_dicts/en_dicts/ 中,让主目录清爽一些。

「朙月拼音」Vs.「袖珍简化字」

简体与繁体的问题,在 Squirrel 0.15.0 开始 [email protected] 的过滤失效了,生僻字暴增,就考虑换到了纯简体的字表、词库。

「朙月拼音 luna_pinyin」原本其实是使用繁体作为词库,若要输出简体是经过了 opencc 转换的。

简体用户最好是用「袖珍简化字 pinyin_simp」方案,词库直接使用简体的,这样出词不用经过转换,自己新增词库也很方便,搜狗、百度都有很多专业词库可以直接转换并嵌入。

搜狗转 Rime 词库,我用的是这个仓库:lewangdev/scel2txt

「easy_en」Vs.「melt_en」

「melt_en」(融合拼音的英文输入方案)是「easy_en」的一个改版。

支持了响应大写字母(Shift + 字母),精简掉了大写字母开头的词汇,只保留小写,自己可以新增特定的大写词汇,且也可以用小写来响应。

我觉得「melt_en」还是比较符合我的输入习惯,大家可以都试试。

字表与词库

字表

在为 Rime 寻觅字表时,发现官方的袖珍简化字方案、四叶草方案及其他一些方案的字表欠佳。

一是因为生僻字过多,普通用户完全用不上这些古字,繁体字只需要切换简繁即可;

二是因为错误及过时的注音也很多,袖珍简化字方案自带词库至少有几个百错误。

一个一个手动修改太过麻烦,干脆整理一份完全正确的:《通用规范汉字表》的 Rime 词库

词库

同样的,官方原版词库的异形词与错别字太多,目前我是在使用「华宇野风系统词库」 +「清华大学开源词库」。

前者是我能找到的词库中错别字最少的词库,后者作为扩展词库补充。

外加自己偶尔的新增,个别专业词库的新增,搜狗网络流行词的月更,使用起来还算舒服。

自定义文本与英文方案

英文方案有一个问题,就是会导致单编码时被常输入的英文单词占据,看着不是很好。

所以引入了 custom_phrase.txt 将单编码的汉字顺序固定死,同时也方便快捷输出一些字。

custom_phrase.txt 还有一个问题,就是不与拼音互相造词,如果使用了完整编码,如「你ni」这样的,那么「你」这个字将无法与参与造词,即自造词无法被记住。

所以只能固定非完整编码的字词,「仙剑xianjian」应改为「仙剑xj」,「是shi」应改为「是s」。

修订

花了大量精力对词库的异形词、错别字、错误注音进行了修订。

现在开源的简体输入法系统词库可忒难找了,大多数都错误连篇,自己融合了两个还凑合的词库,参考一些异形词整理表、常见错别字、Google、词典等对其进行了修正。

也试过维基词库和一些搜狗的巨型词库,但是错误挺多的,实在修不过来,相比大词库,我更希望保证词库的正确性。

参考 & 感谢

希望本配置帮助到了你,以下是我上手时主要参考的仓库,表示感谢: