2009-05-18

http://code.google.com/p/ciku/

http://code.google.com/p/ciku/


http://www.linuxsir.org/bbs/showthread.php?t=347526
如何扩展小企鹅输入法的词库 更新程序算法2009-04-01











如何扩展小企鹅输入法的词库

1.sg2fcitx扩展搜狗细胞词库http://code.google.com/p/sg2fcitx/

http://pinyin.sogou.com/dict/

下载你需要的txt版细胞词库.


代码:

sg2fcitx 搜狗细胞词库.txt > fcitx式的文件.txt
cat fcitx式的文件.txt >> pyPhrase.org

再用程序noOverlap消除重复的词。

替换fcixt-3.6.0-rc/date/pyPhrase.org,然后重新编译fcitx就可以使用新词库了.

参考链接:http://blog.chinaunix.net/u/30503/showart_1880495.html

http://blog.chinaunix.net/u/30503/showart_1883904.html



2.使用open-phrase的词库

到open-phrase上面下载词库http://code.google.com/p/open-phrase/


代码:

# cat phrase_pinyin_freq_sc.txt | sort +2 -3 -r -g | awk '{print $2 " " $1 " " $3}' > try.txt
# uniq try.txt | awk '{print $1 " " $2}' > pyPhrase_op.org

替换fcixt-3.6.0-rc/date/pyPhrase.org,然后重新编译fcitx就可以使用新词库了.

这个词库偏大。

参考链接:http://blog.chinaunix.net/u/30503/showart_1884473.html





附则:

noOverlap用法: ./noOverlap

要求:noOverlap当前目录下有pyPhrase.org文件用于消除重复词汇,自动生成tmp.txt文件里没有重复的词汇,即无重复词汇的pyPhrase.org

没有评论:

How to upgrade micronucleus

micro micronucleus nucleus 是 ATtiny/ ATMega328p的bootloder, 它的过人之处是给这些芯片带来usb支持. 使得它们可以直接通过usb口来烧录. 我购买了很多 digispark 开发板. 这些开发板小巧方便价格低廉. ...