Java,Senでnaist-dicを使う
用意するもの
naist-dicのnaist-jdic.csvをsenのdicディレクトリに入れとく(EUC-JPなので文字コード変換が必要ならしとく)。
デフォルトのdic.csvじゃなくこっちを利用するようにするためbuild.xml修正。
< !-- Comment out if you would like to add your custom dictionary. Custom dictionary format have to compatibule with 'dic.csv'. This parameter is a file path for custom dictionary. You can add multiple dictionary here like "custom_dic1.csv custom_dic2.csv.." If you add huge dictionary, you have to modify maxmemory attribute in java task. -- > < !-- <arg line="customize_dic.csv" /> -->
となってるところ、argタグのコメントアウトはずして
<arg line="naist-jdic.csv" />
ふつうにコンパイルするとOutOfMemoryErrorなので最大メモリも設定
<target name="create" depends="dics0" unless="dics.present"> <java classname="net.java.sen.tools.MkSenDic" fork="true" maxmemory="1024M"> <!-- here -->
してからantコマンド実行。これでビルド通って辞書ができる。
このままだとsenが長い単語バグ踏むのでリンク先の通りに修正してください。