极爽词库4.3 for fcitx » 荒野无灯weblog

Keep It Simple, Stupid.

荒野无灯weblog

极爽词库4.3 for fcitx

此文原文标题为《极爽词库6.0官方标准版本for fcitx》,后发现,其实4.3版的词库才是经典。
因此现在我也改用4.3版的词库。


极点五笔输入法确实是非常优秀的输入法,目前最新版为7.3版,采用的是“极爽词库4.3版 for 极点五笔UniCode版本” 。不过不知道为什么它不用6.0版的极爽词库。
在WINDOWS 下面,下载 极爽词库6.0官方标准版for极点五笔,解压出来得 freeime.mb ,然后用它替换freeime/mb/default目录下面的相同文件。用极品五笔的词库导出功能将词库导出为一个txt文件。
用极品五笔的词库导出功能将词库导出为一个txt文件。
词库信息=极爽词库6.0官方标准版本 for 极点五笔UniCode版本
生成日期:2010-4-16 19:57

OK了,有了需要的东东。下面切换到LINUX下面。
由于导出的txt文件编码格式是utf-16le的,因此我们得对它进行转码,而且,文件的格式是DOS格式,得转换为UNIX格式的换行。
用神器VIM吧。

:set ff=unix
:set fileencoding=utf-8
:set nobomb

然后删除 从 [Description] 到 [Text] 的内容,并保存。
接下来就用荒野自己写的极点词库转fcitx词库的PHP脚本来转换词库了:

linuxsir论坛的第六元素已经指出二者码表的主要不同之处:
其实fcitx码表源文件的结构和极点的码表结构差不多,除了一些附件信息外,唯一的差别就在于对重码字词的安排上,极点的是放在一个条目下的,而fcitx是分开放的。
所以转换的关键就在于把“zykg 斋 主客观 左右开弓 颤 ”之类变成
“zykg 斋
zykg 主客观
zykg 左右开弓
zykg 颤”

jd2fcitx.php.zip (679 字节)

php jd2fcitx.php freeime.txt my-jishuang4.3.txt


不知道极爽词库最后以/开头且后面接着是 gs***** 的东东是干神马的,这里我还是留着,没有去掉。
其实也可以用fcitx 3.6.x版中附带的jd2fcitx 来转换,不过转换之前要注意把极爽的一些特殊标记去除(如~ ^ ! / 等 ),我写的jd2fcitx.php默认过滤掉了这些的。

cp /usr/local/share/fcitx/table/wbx.mb .
mb2txt wbx.mb > wbx.txt

获得一个fcitx码表的模板,然后重命名之:

mv wbx.txt ihacklog-jishuang-v4.3.txt
vim ihacklog-jishuang-v4.3.txt

[数据] 下面的东东全部删除,
然后

:read my-jishuang4.3.txt

保存之。

[admin@huangye temp]$ txt2mb ihacklog-jishuang-v4.3.txt ihacklog-jishuang-v4.3.mb
Delete:  dirr $X[极点目录]%freeime%, Too long
Delete:  joke 嘦巭好,兲嫑跑*_*!, Too long
Delete:  minute $MI分, Too long
Delete:  minute $mi分, Too long
Delete:  month $M月, Too long
Delete:  month $m月, Too long
Delete:  mute $x[静音开关]mute, Too long
Delete:  now $y年$m月$d日$0h时$0mi分$0s秒, Too long
Delete:  opencd $x[弹出CD]opencd, Too long
Delete:  second $S秒, Too long
Delete:  second $s秒, Too long
Delete:  tray $x[最小化桌面窗口]tray, Too long
Delete:  zzxe ю

Reading 87891 records.
cp -v ihacklog-jishuang-v4.3.mb ~/.config/fcitx/table/
cp /usr/local/share/fcitx/table/wbx.conf .
mv wbx.conf ihacklog-jishuang43.conf
vim ihacklog-jishuang43.conf
cp -v ihacklog-jishuang43.conf ~/.config/fcitx/table/

ihacklog-jishuang43.conf 内容如下:

[CodeTable]
Name=Jishuang4.3
IconName=wubi
File=ihacklog-jishuang-v4.3.mb
AdjustOrder=AdjustNo
Priority=1
UsePY=True
PYKey=z
AutoSend=-1
NoneMatchAutoSend=0
UseMatchingKey=True
MatchingKey=z
AutoPhrase=True
AutoPhraseLength=4
AutoPhrasePhrase=True
SaveAutoPhrase=3
ExactMatch=False
PromptTableCode=False
Symbol=zzzz

干掉fcitx ,然后重新启动fcitx : fcitx -d
可以看到已经成功加载我亲手制作的词库了 :mrgreen:

Info:table.c:182-Load Table Config File:wbpy.conf
Info:table.c:182-Load Table Config File:jishuang6.0.conf
Info:table.c:182-Load Table Config File:wbx.conf
Info:table.c:182-Load Table Config File:jidian_huangye.conf
Info:table.c:266-Load Table Dict from /home/admin/.config/fcitx/table/ihacklog-jishuang-v4.3.mb

下一步如果有时间的话就研究下怎么把拼音词库与五笔词库合并,生成新的五笔拼音码表。

最后感谢Yuking写了fcitx这么优秀的输入法软件,还要感谢谢 fcitx 4的开发者csslayer ,感谢窝子,做出极爽词库这么好用的词库。
窝子的老巢http://wozy.wordpress.com/jishuang/
窝子的新巢http://wozy.in/

Tagged in : Linux,fcitx,词库,码表,codetable

All Comments (0)
Gravatar image
No Comments