update: 雾凇拼音,我的 Rime 配置及新手指引

Rime demo

我的 Rime 配置说明,仓库:iDvel/rime-ice

使用说明

备份后删除 ~/Library/Rime/ 目录下原有的配置文件,再将仓库所有文件复制粘贴进去就好了。

请先将 pinyin_simp.dict.yaml 中的 - cn_dicts/private 这行删除,这是我自己的私人词库(联系人之类的),否则鼠须管无法部署,小狼毫只能输入英文。

各文件说明

.
├── default.custom.yaml  # 全局设置
├── squirrel.custom.yaml # 鼠须管的皮肤设置
├── weasel.custom.yaml   # 小狼毫的皮肤设置

├── pinyin_simp.schema.yaml # 拼音方案(关键配置文件)
├── pinyin_simp.dict.yaml   # 挂载词库
├── cn_dicts/               # 词库目录
├── symbols.custom.yaml     # 自定义的 symbols,单独拆分出来了

├── melt_eng.schema.yaml # 英文方案
├── melt_eng.dict.yaml   # 挂载词库
├── en_dicts/            # 词库目录

├── fixed.txt         # 固顶字/自定义短语
├── opencc/           # 词语映射
├── rime.lua          # lua 脚本
└── zh-hans-t-essay-bgw.gram  # 八股文语言模型

方案设计


在 pinyin_simp 基础上修改,删掉了反查和笔画后发现没剩下多少代码了,就不单独新建 pinyin_simp.custom.yaml 再以 patch 的方式写配置了,就直接在里面写了。

中英文的词库都放进了 cn_dicts/en_dicts/ 中,让主目录清爽一些。

「袖珍简化字」Vs.「朙月拼音」

简体与繁体的问题,不过简繁和方案没有关系,主要是词库,切换简繁时使用不同的 s2t 或 t2s 选项就可以了。

在 Squirrel 0.15.0 开始 [email protected] 的过滤失效了,生僻字暴增(默认的字表过大),就考虑换到了纯简体的字表、词库。

「朙月拼音 luna_pinyin」原版是使用繁体作为词库,若要输出简体是经过了 opencc 转换的。

如果是简体用户,不如直接使用简体词库,这样出词不用经过 opencc 转换,可避免一些 Bug 和错字。(比如某些字打不出来、某些词汇无法记住)

melt_eng Vs. easy_en

melt_eng(融合拼音的英文输入方案)是 easy_en 的一个改版。

支持了响应大写字母(Shift + 字母);

精简掉了大写字母开头的词汇,只保留小写;

自己可以新增特定的大写词汇,且也可以用小写来响应;

输入大写开头的字母则直接过滤掉中文候选内容,适合输入忘记了后面怎么拼写的长单词。

词库

字表

在为 Rime 寻觅字表时,发现官方的袖珍简化字方案、四叶草方案及其他一些方案的字表欠佳。

一是生僻字过多,普通用户完全用不上这些极为生僻的,主流字典都没有收录的字,繁体字只需要切换简繁即可;

二是错误及过时的注音也很多,袖珍简化字方案自带词库至少有几个百错误。

一个一个手动修改太过麻烦,干脆自己整理一份完全正确的:《通用规范汉字表》的 Rime 字表

多音字问题

如果引入了没有注音的词库,Rime 会自动帮忙注音,用多种多音字都可以打出来,但是:

当含有多音字的词组缺少编码字段时,自动注音程序会利用权重百分比高于 5% 的读音进行组合、生成全部可能的注音。—— Rime 输入方案设计书

示例:

# du:dou 不高于 5:100(等于也不行,必须大于),du 不会参与自动注音
都	dou	100
都	du	5

# 大于 5:100,都会参与自动注音
长	chang	100
长	zhang	6

将常用多音字之间的权重比调整为至少在 5:100 以上,剩下几百个犄角旮旯的发音没有理会。

词库

同样的,官方原版词库的异形词与错别字太多,寻寻觅觅找了一些还不错的词库。

词库修订&更新

简体输入法系统词库可忒难找了,大多数公开的都是垂直的专业词库,鲜有开源、全面、准确、舒适的系统词库。自己融合了几个还凑合的词库,参考一些异形词整理表、常见错别字、Google、校对网、《现汉7》《现规》等对其进行了修正。

主要维护的词库:

  • 8105.dict.yaml 字表。
  • main.dict.yaml 基础词库,含注音、词频。
  • ext.dict.yaml 补充词库,只保留三个字及以上不太需要词频的词汇,无注音,依赖于 Rime 的自动注音。

维护内容主要是异形词、错别字的校对,错误注音的修正,缺失的常用词汇的增添,词频的调整。

欢迎在词库方面提 issue,我会及时修正。

想要的但没有实现的功能

固定候选项顺序

落格输入法有这个功能,很好用,Rime 暂时不能或不知道怎么来实现。

将字、词或符号固定在一个编码的前 N 个位置(落格还支持固定在第 N 个),而其他的位置正常参与调频。

custom_phrase.txt 确实可以固定在前 N 个,但这样不参与造词,太想要这功能了😭。

[✔]特殊候选项提升

「西安xi’an」「提案ti’an」这种不输入 ' 时和「先xian、天tian」有冲突的词语,候选项过于靠后,且多次输入无法提升。想提升到第一页候选项,不知如何做到😭。

已解决:参考的 rime-melt

[✔]英文在候选项中的问题

在很多英文单词输入最后一个字母之前,候选项第一的是一个毫不相干的词汇,有点影响体验。

2022-05-06-000637

有一种解决办法就是第一个字母输入大写,这样候选项中就全是英文。

有点麻烦,似乎无法解决😭。

已解决:调教 Rime 英文输入方案

参考 & 感谢

希望本配置帮助到了你,以下是我上手时主要参考的仓库,表示感谢: