
[PocketCafe トップ] [Pocketに書斎][Pocket日記] [Mail]
H/PCで国語辞典を使う
-実はけっこう修正個所が多かったりする-
作成日 00/03/26 ★Jornada680に国語辞典導入
『Jornadaスーパーブック』に国語辞書の導入方法が載っていたので、早速試してみました。 ★準備編
★ちょっと修正
PDIC形式の辞書は、1行目が単語、2行目が意味の二行一組構成になっています。
更新日 00/11/04
ジョルナダはバンドルアプリが少ないのですが、ネット上で様々なソフトが公開されているので、あまり不自由していません。ですが、国語辞典がバンドルされていないことだけは、例外です。ほかのソフトと違って、WindowsCE用の辞典ソフトは市販されていないからです。
『Jornadaスーパーブック』によると、PDD図書館に、フリー(正確には、PDD;Public Domain Data です。)の国語辞典ファイルが公開されているということなので、これをダウンロードして、CE用の辞書検索ソフトで使えるように変換します。
はんどへるどぴーしー↓
【ハンドヘルドPC】○携帯情報端末の内、OSにWindowsCEを採用しているもの。↓
単語はひらがなで記してあります。カタカナだとダメなのかどーかは、試していないのでわかりません。ですが、単語に「ヴ」が入っていると、「FET Dictionary Serch」で検索したときにハンドヘルドPCがハングアップしてしまいます。だから、「しヴァ」→「しば」のように、先に「ヴ行」を「ば行」に変換しておく必要があります。ちなみに「ヴ」にひらがなはありません。
PDIC形式の仕様では、「意味」は複数行にまたがることができません。上の例では、わざと「意味」が2行に渡るように見せかけていますが、間に改行コードは入っていません。
だから、
けいせんひょう↓
【罫線表】↓
┌────┬──┬──┬──┬──┬──┬──┬──┐↓
├────┼──┼──┼──┼──┼──┼──┼──┤↓
└────┴──┴──┴──┴──┴──┴──┴──┘↓
罫線表のように、必ず改行コードが入ってしまうものも、PDICでは使えません。残しておくとやはり検索の時にハングアップします。2000年3月現在の辞書データでは、「あんぺあぶれーかー」「えと」「かいへい」「きゅうせい」「ごぎょうせつ」は罫線表を使っているので、罫線部分を先に削除しておきましょう。
※ 2000年9月公開版では、さらに罫線を使った単語が増えました。「じゅうにじんしょう」「たいふう」「にじゅうしばんかしんふう」「はちぎゃく」「れきほう」です。
PDD図書館の国語辞典ファイルは五十音順に並んでいますが、
あかい
あがし
あかんこ
あきた
の順で並んでおり、清音と濁音の区別がありません。
ところが「FET Dictionary Serch」は、どうやら清音と濁音を、区別しているようです。
「あかんこ」を検索しようとしても、「あか・・・」までは検索できるけど、間に「あが・・・」が入っているので、そこで検索が止まってしまいます。
そこで、
あかい
あかんこ
あがし
あきた
のように、濁音部分を後ろに持ってきてあげると、うまく検索できました。
つまり、ダウンロードした国語辞典をフルに使おうと思えば、辞典ファイルを、清音濁音の区別を付けて、ソート(並べ替え)し直さないといけないわけです。
★ソートするための細工
いくらなんでも1万件以上のデータを手動でソートすることはできません。そこで、並び替えソフト(ソータ)を使ってパソコンに並び替えさせることにします。
ソータは、デリミタを指定できる「GOSORT」を使います。
デリミタとは、要素と要素の間を識別するために挿入される区切り記号のことです。
kokugoce.plで生成される辞書ファイルは
せついっさいうぶ↓ 【説一切有部】○[仏]上座部の分派。単に「有部」とも呼ぶ。↓ せっかい《せきくわい》↓ 【石灰】○(1)生石灰・消石灰の総称。↓ せっかく《せきくわく》↓ 【石槨】○古墳などの、棺や副葬品を納める石造りの室。↓ |
54 print $str,"\n","\n";
55 }
56 if( $kmidashi == 1 ){
57 for( $j= 0 ; $j < $i ; $j++ ){
58 print $midashi2[$j], "\n","\n";
59 if( $swflag == 1 ){
60 print "⇒", $midashi;
61 #print "→", $midashi;
62 }else{
63 print $str,"\n","\n";
数字は行番号 |
|
せついっさいうぶ↓ 【説一切有部】○[仏]上座部の分派。単に「有部」とも呼ぶ。↓ ↓ せっかい《せきくわい》↓ 【石灰】○(1)生石灰・消石灰の総称。↓ ↓ せっかく《せきくわく》↓ 【石槨】○古墳などの、棺や副葬品を納める石造りの室。↓ |
|
■せついっさいうぶ↓ 【説一切有部】○[仏]上座部の分派。単に「有部」とも呼ぶ。↓ ■せっかい《せきくわい》↓ 【石灰】○(1)生石灰・消石灰の総称。↓ ■せっかく《せきくわく》↓ 【石槨】○古墳などの、棺や副葬品を納める石造りの室。↓ |
★使ってみよう
作成したkokugoce.txtを、ハンドヘルドPCにコピーします。コピーが終われば、「FET Dictionary Serch」のメニューから[Dictionary]-[Option]を選び、辞書を設定します。

検索結果