Java,Senでnaist-dicを使う

用意するもの

naist-dicのnaist-jdic.csvをsenのdicディレクトリに入れとく(EUC-JPなので文字コード変換が必要ならしとく)。
デフォルトのdic.csvじゃなくこっちを利用するようにするためbuild.xml修正。

       < !-- Comment out if you would like to add your custom dictionary.
            Custom dictionary format have to compatibule with 'dic.csv'.
            This parameter is a file path for custom dictionary. 
            You can add multiple dictionary here like "custom_dic1.csv custom_dic2.csv.."
            If you add huge dictionary, you have to modify maxmemory attribute in java task.
       -- >
< !--
      <arg line="customize_dic.csv" />
-->

となってるところ、argタグのコメントアウトはずして

      <arg line="naist-jdic.csv" />

ふつうにコンパイルするとOutOfMemoryErrorなので最大メモリも設定

  <target name="create" depends="dics0" unless="dics.present">
    <java classname="net.java.sen.tools.MkSenDic"
          fork="true"
          maxmemory="1024M"> <!-- here -->

してからantコマンド実行。これでビルド通って辞書ができる。

このままだとsenが長い単語バグ踏むのでリンク先の通りに修正してください。