mkbingram でバイナリ化したバイナリN-gramファイルとして与えることができます.
単語表記 [出力文字列] 音素列・・・クラスN-gramを用いる場合は,これらの前に「属するクラス名」,「クラス内単語生起確率」を以下のように記述します.
クラス間N-gram上のクラス名 @クラス内単語生起確率の対数値 単語表記 [出力文字列] 音素列・・・第1カラム目の「クラス名」は,クラス間のN-gramでのクラス名を表記します. 第2カラム目の「クラス内単語生起確率の対数値」は,その単語のクラス内での生起確率を,常用対数(log10)で指定します.
認識実行時には,このようにして作成したクラス付き単語辞書を,通常と同様に
-v で指定します.形式はJulius側で自動判別されます.もちろん,
同時に使用するクラスN-gramと第1カラム目の名前の対応がとれている必要があります.
このような部分クラスN-gramを使用する場合,単語N-gramのエントリは通常と同じように単語辞書で記述し,クラス化されたエントリについてのみ,上記のようにクラスの情報を記述します.以下は,地名が「<地名>」でクラス化されている部分クラスN-gramを想定した場合の辞書の記述例です.
今日+42 [今日] ky o: は+16 [は] w a <地名> @-2.33251 京都+52 [京都] ky o: t o <地名> @-1.68893 奈良+52 [奈良] n a r a <地名> @-2.63574 和歌山+52 [和歌山] w a k a y a m a 出張+6 [出張] sh u q ch o: です+67 [です] d e s u
configureで--disable-class-ngramを指定してください.