other versions
- bookworm 1.1.1~a021+cvs20130302-7
- testing 1.1.1~a021+cvs20130302-7
- unstable 1.1.1~a021+cvs20130302-7.1
- experimental 1.1.1~a021+cvs20130302-7.1~exp1
UJIS_DIC(5) | File Formats Manual | UJIS_DIC(5) |
名称¶
UJIS形式辞書ファイル ― UJIS形式辞書ファイルの形式
機能¶
- UJIS形式辞書ファイルは、バイナリ形式の固定形式辞書と登録可能形式辞書
をUJIS形式で表現したものである。
UJIS形式辞書ファイルと固定形式辞書,および登録可能形式辞書間の相互変
換は、辞書ユーティリティを用いて行う。
バイナリ形式に変換する場合、単語は読みでソートされていなければならない。
UJIS辞書ファイルに対する語句の追加,削除,及び変更は、vi
等のエディ
タで行う。
ファイルの形式
\comment コメント(CR)
\total 総頻度(CR)
\hinsi (CR)
読み(SP)単語(SP)品詞(SP)頻度(SP)[コメント](CR)
読み(SP)単語(SP)品詞(SP)頻度(SP)[コメント](CR)
読み(SP)単語(SP)品詞(SP)頻度(SP)[コメント](CR)
| | | |
| | | |
| | | |
(EOF)
- コメント
- 辞書全体に付けられたコメントである。
- 総頻度
- 辞書全体の頻度(その辞書が経験した単文節変換の回数)である。int 型。
- 読み
- 単語の読み。256文字までの長さで、ユーザ辞書はひらがな・ 「ー」・半角英数字、固定形式辞書はひらがな・「ー」で逆順に表現する。 なお、半角英字は大文字・小文字の区別をしない。 ソート時の文字の大小関係は、「ー」・ひらがな・半角英数字の順である。
- 単語
- 256文字までの半角文字・全角文字・外字など全ての文字表現が可能。 スペース、改行文字などの制御文字は に続く2桁の8進数で表す。\ に 続く 0 以外の文字はその文字になる(\\ → \)。
- 品詞
- 品詞名で、直接表現する。
名詞
固有名詞
品詞名は、/usr/local/lib/wnn/hinsi.data 参照。 - 頻度
- 各単語の頻度である。
- コメント
- 512文字まで。
6 Septemter 1993 |