4 外国語のためのエディタ

世に出回っているエディタのなかで、マルチリンガルな用途に向くのはどれなのかを調べてみました。

実験の対象にどのエディタを選ぶのかについては、ここを参考にさせてもらいました(と言うより、フリーのエディタにかんしてはそっくり借用と言っていいくらいです)。

TEditorコンポーネントを使っているエディタは基本的に外国語の編集には向かぬはずですが、一部には独自に機能を拡張しているものもあるかに聞き及びますので、一応、目に付いたものは調べておきました。



4.1 お断り

ここで述べられているのはWindows用エディタについての話でして、MacやLinuxその他の環境の方にとっては価値のある情報はおそらくありません。


このページでは、OS含め環境によってはインストールされていないフォント、すなわちPalatino LinotypeTahoma、ないしArial Unicode MSを指定した箇所があります。これらのフォントを入れておられない方から、しかじかのフォントをしかじかの方法で指定せよとの、あるいはテキストデータではなく図版でもいいから文字を見たいというご要望があれば善処するかも知れません。

また、フォントサイズや行間を含めたレイアウトは、WindowsXP+IE6以外では多少見にくくなるようです。



4.2 実験の内容

マルチリンガルな用途といってもあくまで日本人が使うわけですから、日本語と混在させる必要もあります。したがってUTF-8(UTF-16LEでもいいですが)が使えるかどうかは最重視していますが、私個人が読み書きする機会のあるISO-8859-1を扱えるかどうかも実験項目に入れました。中文や東欧の言語と関係の深い方なら、ISO-8859-1ではなくBig5なりBG2312なりISO-8859-2なりのファイルで別に実験を行う必要があるでしょう。

後の実験項目は、(ほとんどアトランダムに)幾つかの言語を選び、それぞれのキーボードレイアウトで文字が打てて、かつ打った文字を検索できるか、というものが中心です。


行った実験は次の通り。



実験1 ユニコード対応(UTF-8)とファイル名

1.1 ルター訳1545年版のマタイ福音書をメモ帳にコピペし、UTF-8(以下、単にUTF-8と書くのはBOMつきのそれのことです)で保存したテキストファイルを読み込ませる

1.2 äöüßそれぞれに検索を掛ける

1.3 Matthäus.txtという名前にリネームして保存し、かつそれを開きなおすことができるか



実験2 ISO-8859-1

同じく、ルター訳のマタイをGreenPadにコピペし、ISO-8859-1で保存したテキストを読み込ませる



実験3 西欧主要言語

「カナダ・マルチリンガル標準」レイアウトでè€âãäと打ってみる(に修飾キー、âにデッドキーを使用。ãäはデッドキーを呼び出すのに修飾キーを併用)



実験4 北欧諸語

4.1 「サーミ対応ノルウェイ語」配列でåøẅšŋを打ってみる(にデッドキー、šŋに修飾キー使用)

4.2 上の5文字で検索を掛ける



実験5 ロシア語

5.1 「ロシア語」配列でaiueoの順にキーを押す(фшгущと表示される)(修飾キーおよびデッドキー使用せず)

5.2 上の5文字それぞれで検索を掛ける



実験6 簡体字中文

6.1 「中国語(中国)」配列(Microsoft Pinyin IME 3.0)でIMEをオンにしてnihaoの順番でキーを押してから変換させる(你好と表示される)

6.2」に検索を掛ける



実験7 朝鮮語

7.1 「韓国語」配列、Korean Imput System(IME2002)でIMEをオンにしてaiueoの順番でキーを押してから変換させる(먀ㅕ대と表示される)

7.2 上の3文字それぞれで検索を掛ける



実験8 古典ギリシア語

8.1 「ギリシア語(ギリシア語Polytonic)」配列でἆᾄと打ってみるにデッドキー、にデッドキーを呼び出すための修飾キーを使用)

8.2 上の3文字で検索を掛ける



実験9 ヘブライ語と合成文字

ヘブライ語で、猪木は「1,2,3 ダー!」と言った、という意味(になってたらいいな)の文章を打つ。固有名詞の「猪木」と「ダー」にニクダーを付ける合成文字を使用。こちらのサイトの記述を参考に、終わりの引用符(感嘆符の次に入力する")のさらに後ろにU+200Fを付け加えてみる。ちなみに、MS Word(と主要ブラウザ)では、
יִנָקִ אמר "1,2,3, דָ!"
と表示されて、アラビア数字の箇所はやっかいながら、他の部分ではおおむね満足できる模様。
これにより、
9.1 合成文字が正しく表示できるか
9.2 文字の並びと語順が正しく表示できるか
を見る。

ついで、改行してヘブライ語の子音文字のみで構成された単語を数個並べ、その行で
9.3 単語の間のスペースにキャレットを置いてカーソルキーの左右を押してみる
9.4 HomeキーとEndキーを押す




4.3 結果

結果はこんな感じです。

(なお、各エディタへのリンクにつきましては、貼っても問題ないだろうとか、貼らないと不親切だろうと私が判断するところにしか貼りません)



4.3.1 表

  配布形態 1.1 1.2 1.3 2 3 4.1 4.2 5.1 5.2 6.1 6.2 7.1 7.2 8.1 8.2 9.1 9.2 9.3 9.4 最終実験日 備考
1Editor 1.0.7 フリー × 1 2 3 4 05.Apr.6. Palatino Linotypeでテスト。ẅやŋは他の文字と区別して検索できるのに、ギリシア拡張の文字はできない。
Alpha 0.7.5.7 fix 7 フリー 5 2 6 7 05.Apr.6. Wordばりに、コード値に続けてAlt+Xで文字を入力できるのはかなり便利で、実験に際して重宝した。サロゲートペアにも対応。
BabelPad NT 1.7.1 フリー 8 9 10 05.Apr.6. UTF-8やUTF-16なら大丈夫だが、Shift-JISのファイルを読ませるための方法がわからず。日本語IMEとの相性もよくない。また、日本語ファイル名のついたテキストを読ませようとして落ちたことが数度あった。
Pentec e-Editor 5.45 フリー 5 11 12 × 13 13 11 13 11 11 14 - 14 14 - - 05.Apr.6. UTF-8のファイルを開けるのみで、KBレイアウトの変更には(中朝を除き)未対応。別アプリで書いたもののコピペは可能だが、検索は(ロシア語を除き)不可。
EmEditor Pro 4.13 シェア4200円 5 8 15 4 05.Apr.6. 西欧主要言語で使う文字にはWordと同様のショートカットが標準で設定されている。欧文ワードラップもそこそこ使える。
GreenPad 1.05U フリー 5 16 17 4 05.Apr.7Readmeで断られているのだから、ヘブライ語でテストするのは酷かな。他の言語では順調。
HANGZEI 0.0.1.5 フリー 5 18 5 1 2 6 4 05.Apr.7. 設定で「右→左書き言語対応」にできるが、どういう機能なのかよくわからず。ひょっとして、キャレットの位置を最後に打った単語の末尾に置けるだけ?
秀丸 5.00 β14 シェア4200円 12 5 19 19 13 × 20 3 4 05.Apr.7. 西欧主要言語や露中朝ならともかく、ややマイナーな言語となると厳しそう。
LiteEditor .NET版 0.0.5 フリー × 8 9 10 05.Apr.8. かなり優秀で、今回のテストでは問題視すべきところがさほど見当たらず。
萌ディタ 0.6.0.43 (2005/01/11) フリー 21 5 × 20 3 4 05.Apr.8. Unicodeの区画ごとにフォントを指定できる。Matthäus.txtで保存できなかったのはちょっと意外。
苗2.1a フリー 11 12 × 22 11 11 11 11 14 - × 23 24 25 05.Apr.8. 打てるレイアウトもあるが、Shift-JISでエンコードできない文字は検索不能。また、保存の際に文字コードが選べない(Shift-JISでしか保存できない?)
真魚 2.0.3.1 フリー 26 5 26 26 26 × 20 3 4 05.Apr.9. 主にBDM UF+でテスト。字間が空くのと合成文字未対応なのが残念。自前のクリップボード履歴を持っていて、変音文字等の履歴も保持されるのは便利。
Notepad (WinXP) OSに付属 × 8 9 10 05.Apr.9. かなり優秀。
Notepad++2.9 フリー 27 12 19 27 27 27 27 13 1 14 14 - - 05.Apr.9. 海外のエディタとしては珍しく日本語IMEでストレスがないが、Shift-JISのファイルを読ませる方法がやはりわからず。該当言語のLanguageファイルを当てればKBからの入力やヘブライ語の処理もできそうだが、今回は試さず。
SC UniPad 1.10 シェア199米$等 12 5 19 19 13 × 28 9 29 05.Apr.9. 海外のエディタ。日本語IMEとはやはり相性が悪く、Shift-JISのファイルも読めなかった。Win標準のKBレイアウトではẅŋやギリシア拡張に難があるが、このエディタで使うレイアウトを自作できるので、手間の多さや汎用性の低さを厭わなければギリシア拡張などは朝飯前、Unicode4.0の相当部分の文字を打てる模様。
ToMoEditor 2.9 フリー 11 12 × 22 11 11 11 11 14 - × 8 9 25 05.Apr.9. 「苗」と同様、打てるレイアウトもあるがShift-JISでエンコードできない文字の検索は不可。ヘブライ語ではU+200Fが「猪木」のi音の右に来る。ファイル保存の際にUTF系が選べる。
WZ Editor 5.02C SE パッケージ10290円等 5 30 5 19 19 13 × 14 - 14 14 - - 05.Apr.9. 多言語機能は限定的。Pフォントだと不安定で、改行マークやEOFの後ろにキャレットが来たり、選択中の文字列が化けたりするので、MSゴシック他でテスト。
xyzzy 0.2.2.234 フリー 31 32 5 19 31 31 31 31 14 - 14 14 - - 05.Apr.9. 主にBDM UF+でテスト。少し工夫しないとPフォントが選べないのは、外国語メインの使用ではネックになりそう。
  配布形態 1.1 1.2 1.3 2 3 4.1 4.2 5.1 5.2 6.1 6.2 7.1 7.2 8.1 8.2 9.1 9.2 9.3 9.4 最終実験日 備考

1 で検索を掛けると、のみならずにもヒットしてしまう。
2 文字は右から左へと正しく書けるようだが、各単語の並ぶ順番がおかしい。
3 左から右に書く言語と同様、Shift+右カーソルでキャレットの右側が選択される。まあ、右カーソルを押したら選択部分が右側に伸びてゆくというこの従来の方式の方が、直感的にわかりやすい気はしますが。
4 Homeキーを押すとその行の左端に、Endキーで右端にキャレットが移動(右から左に書く言語から見れば正当な動作ではない)。
5 自動認識ではコード判定に失敗するが、コードを指定してやると正しく読み取る。
6 ローマ字転写で"CBA(スペース1)FED(スペース2)IHG(スペース3)LKJ"という文字列があったとして、Gの右にキャレットを置いてShift+右カーソルを押すと、選択範囲はG-H-I-スペース3-J-K-Lと伸びる。同じキャレット位置でShift+左カーソルだと、スペース2-F-E-D-スペース1-C-B-Aと伸びる。語順がおかしいのに、キャレットの動きとしては正常ということ?
7 文字の並び順は正しいものの、新しく打った「単語」は行の右に追加されてゆく仕様なので、ヘブライ語アルファベットをアレフから順に半角スペースを入れながら打ってゆくと、左から右に「アレフ、ベート、ギメル、ダレット・・・」と続く。一方、行頭や行末の認識は正常なので、Homeキーを押すと左から数えて最初の単語の右端に、Endキーを押すと右から数えて最初の単語の左端にキャレットが移動して面食らう。なお、この実験とは関係ないが、打鍵中にタブを押すと文字が消える。
8 文字の並び順には問題なし。語順もおおむね良好 (詳細は後出の図を参照)。キャレットは(半角スペース打鍵直後を除けば)行の左端にある。BabelPadでは、数字を打つと表示が乱れてちょっと不安(ヘブライ語の文字を再び入力すると元に戻る)。
9 Shift+右カーソルで選択範囲が左に、Shift+左カーソルで右に伸びるという動作。語順も正しいので6に比べると戸惑うことがないし、15のように珍妙でもない。
10 新しく打った単語は行の左に追加され、Homeキーを押すと行の右端に、Endキーで行の左端にキャレットが移動するという動作。
11 Shift-JISでエンコードできない文字の検索は不可。äを指定しているのにaやàにもヒットしたり(e-Editor)、キーボードでの入力でもコピペでも、そうした文字を検索対象に指定することができなかったり(ToMoEditor)、指定できても実際に検索を実行するとエラーメッセージが出るだけだったり(苗)。
12 Shift-JISでエンコードできぬ文字はファイル名に使えない。別アプリで作ったMatthäus.txtを読むことも出来ない。
13 キーボードからの入力は不可だが、別アプリで書いたものを開いたりコピペするのは可。その文字への検索を掛けることのできるエディタもある。
14 キーボードからもコピペからも、入力および表示は一切不能。
15 ヘブライ語部分ローマ字転写で"あいうえお\nLKJ(スペース3)IHG(スペース2)FED(スペース1)CBA\n"という文字列があったとして(\nは改行を示す)、Dの右にキャレットを置いてShift+右カーソルを押すと、選択範囲を示す濃い青色の部分は「右に」向けて伸びるのに、その中で実際に選択される文字はスペース3-J-K-L-\nの順に、カーソルを押すごとに選択範囲の「左端」に追加されてAの右隣りの\nに達する。同じキャレット位置でShift+左カーソルだと、選択範囲を示す青色の部分は「左に」向けて伸びるのに、そのなかで選択されている文字はI-H-G-スペース2-F-E-D-スペース1-C-B-Aの順に、カーソルを押すごとに選択範囲の「右端」に追加されてゆき、カーソルをさらに押すと\n-お-え-う...と続く。 動作を再現したGIFアニメはこちら。9に比べるとかなり不自然な動作で使いづらい。
16 文字の並びは正常だが、語順は1EditorやAlphaと同様に不調。U+059Dの右隣に不自然なスペースが空くが、選択状態にするとU+05E7がなぜかここにも入力されている(が見えなくなっている)ことが分かる。
17 動作としては3と同じだが、選択中の文字列は化けてしまう。
18 保存はできるが開けない。
19 ŋはキーボードからの入力は不可だが、コピペならできて、検索もできる。åøšには問題なし。
20 文字は入力した順に左から右に表示される(右から左に書く言語に未対応の模様)。
21 保存には失敗するが、別のアプリで作ったMattäus.txtを読むことは可能。
22 ŋはキーボードからの入力もコピペも不可。åøšはキーボードから打てる。
23 amarの箇所を見ると右から左に書こうと努力していることは分かるが、U+05B4やU+05B8を間に挿入した「猪木」の箇所では、左から右に書かれて おり、語順もおかしい。ToMoEditorともどもキーボードレイアウトが強制的にヘブライ語以外のものに変更されることがしばしばで、試し打ち自体に苦労する。
24 キャレットの動作としては9と同じだが、実験9.2で語順がおかしかったので別項目とする。
25 HomeキーとEndキー、どちらを押しても行の左端に来る。
26 Shift-JISでエンコードできない文字については、その文字の後ろに不自然なスペースが開く。フォントをCourierやLucida Consoleに換えても同様。
27 検索文字としてキーボードからäöüßを指定するのは不可。コピペで、しかも一字のみだとダメなので複数の文字(Königdaß、あるいはфшや你好など)で試すと、検索ボックス(Findと名のついたウィンドウ)では文字化けしているが、実際にはKönig等々が正しくヒットする。日本語の場合は、AnsiFormatだと検索ボックスにはキーボードから正しく入力でき、検索も(検索語が一字でも複数字でも)ヒットする模様。古典ギリシア語も1字で検索を掛けることだけはできるが、実際の動作は1と同じなので実用に耐えず。
28 合成文字は未サポートだが、設定で双方向の文字列に対応。新しく打った単語は行の左に追加されるが、キャレットは行の右端にある。ただし、ファイル内の文字列全体を右詰めにも出来るので、そうした場合はキャレットが常に行の左端に位置することになり、メモ帳やLiteEditorよりもスムースな印象。
29 Homeを押すと行の右端の文字に、Endを押すとその更に右(に勝手に入るらしい)のU+2028に移動。
30 他のエディタで作ったMatthäus.txtを開くと、Matthaus.txtに勝手にリネームしてしまう。Matthäus.txtで保存しなおすことはできない。
31 西欧主要近代語や露中朝で実験に使った文字はミニバッファから入力でき、検索も利く。ただし、検索(S)メニューから呼ぶ検索および置換ウィンドウでは、Shift-JISでエンコードできない文字はキーボードからも、またクリップボードエンコーディングをUTF-16に指定したコピペでも、入力は一切受け付けない。さらに、上付き数字やギリシア拡張、ヘブライ文字(基本、拡張とも)などは、キー入力でもコピペでも、エディタ本体やミニバッファに入力することができない(usr\(ユーザー名)\wxp\xyzzy.iniで直接Palatino LinotypeやDavid Transparentを指定しても同様)。今回の実験とは関係ないが、Canadian French (Legacy)(や自作のKBレイアウト)でáが打てなかったり、相当数のブロック(一例としてラテン拡張追加だとU+1E00から1E7Fまでとか)に対応していない模様だったりと、細かく見ると難が多い。
32 ミニバッファからでもファイル(F)メニューからでも、Matthäus.txtとしては保存できないし別アプリで保存したファイルは開けない。

なお、ヘブライ語がどのように表示されるのかの結果の一部は図版でもまとめ、簡単な補足もいれておきましたので、関心のある方は参照してください。

        子音単語の語順モデル
1Editor     CBA FED IHG...
Alpha     CBA FED IHG...
BabelPad, LiteEditor,Notepad     ...IHG FED CBA
EmEditor     ...IHG FED CBA
GreenPad     CBA FED IHG...
Hangzei     CBA FED IHG...
    ...IHG FED CBA
真魚     ABC DEF GHI...
ToMoEditor     ...IHG FED CBA
SC Unipad     ...IHG FED CBA


海外のエディタについてはしばしば「日本語IMEとの相性が悪い」というあいまいな書き方をしていますが、日本語を入力する際に(どういう名で呼ばれているものなのか知りませんが)エディタ本体とは別に細長い入力欄が出現するものについてこう形容しています。SC Unipadでのスクリーンショットを取っておきましたが、Babelpadでも大体おなじです。慣れればどうということもないのかも知れませんが、私には、少し、違和感がありました。


海外のエディタの場合、IMEの再変換が利くのかどうかとか、IMEに辞書登録ができるのかも調べようかと思ったのですが、ただでさえ実験項目が増えてきて面倒になったのと、結果表の横幅が長くなりすぎてさらに見づらくなりそうなので、今回はパスしました。このあたりについては、当分やらないつもりですが今後もしそうする機会があって、またそのときにその気になれたら、次回の改訂の折にでも。




4.3.2 共通した設定内容

1. OSはWindowsXP SP2、MS-IME2003。FontLink機能はOS標準のまま
2. キーボードはMS Natural Keyboard Elite、キーボードのドライバと各レイアウトはOS標準で入っているもの
3. 各エディタでフォントは私の知る限り普及率の高いもののなかではもっとも守備範囲の広いArial Unicode MSに指定。これがが選べないエディタの場合や、また表示できない文字が出てきたときは、注記してフォントを変えた



4.3.3 上の表に掲げなかったエディタについて

PeggyPad4.25, JmEditor2.0.25, VxEditor0.4.6, K2Editor1.4.28, NoEditor1.18.10.4, TepaEditor4.38, KNT Editor2.2.18,てきすたー8.96, OEdit4.7.2.2, HyperPageTextEditor3.3.6は全ての実験項目で×(Unicode対応とされるが実は日本語部分のみ)。


MMエディタ7.19も、編集メニュー>「言語の設定」や、環境設定>関連付け>「Unicodeファイルの編集コードの関連付け」を弄っても、全ての実験項目で×でしたし、äßáのようなごく簡単な文字の入力すら受け付けませんでした。コピペすると表示できるように見えるものの、保存して開きなおすとasaに戻っているので、実質上は外国語の読み書きには使えないと判断したのですが、テキスト版のヘルプにはUnicodeでの外国語(と日本語の混在した文章の)編集に対応しているように読める箇所もありますから、当方の設定にミスがあるのかもしれません。


さらに、QX Editor6.9の欧文モードも試しましたが、UTF系のコードが使えない、利かない修飾キーないしデッドキーがある、äを検索するとaáにもヒットするなど、フランス語やスペイン語のようなメジャーな言語をしか使わない人であっても、実務上は制限が厳しそうです。


サクラエディタUnicode版、TeraPad0.86、LittleSpider0.53は公式サイトまたはReadmeなどに日本語部分のみとのコメントがあるので実験せず。また、JaJedit0.9.97とSonaPad1.0.0.5もUTF系のコードを扱えないようなので実験対象外としました。



4.4 まとめ

簡体字中文やロシア語など、実験で使った多くの言語については、私は初歩の知識ももってはいません。ヘブライ語も初心者向けの文法書を一冊読んだきりで、文字をどうにか判別できる程度の習熟度です。ですからよく知らぬ言語にかんして行った実験内容は適切なものではなかった可能性はあります。それに、実験を行った言語の数も、私の知識の偏りと時間の不足とから、世界にある言語のなかのほんの一部に過ぎません。

また、試したエディタのなかで私が常用しているのはほんの少しですから、それぞれのエディタに詳しい方なら設定を工夫してより良い結果を出せるのかも知れません。とくに、xyzzyの細かい使い方などは私にはよくわからないのですが、xyzzyを使おうと思われるような方は、このサイトが対象としている層とは違うような気もちょっぴりします。


今回試したなかで、全ての言語で満足すべき結果を残したのは、OS標準の二種類のエディタとLiteEditor。日本語IMEを使い、かつShift-JISのファイルの需要もまだあるという私たちのPC環境への対応を省みない限りでは、BabelPadとUnipadもかなり優秀でした。とくに、専用のキーボードレイアウトを作る機能のついているUnipadは面白いのですが、汎用性の低さが気になります。可能ならばMSKLCで作った方が別のソフトウェアでも使える点でずっと良さそうですし、(軽快さはともかく)使い勝手でもMSKLCにだいぶ劣るようですが、ひょっとしたら、MSKLCでは定義できない文字でもUnipadならば利用できる、というようなことがあるのかも知れません。


良好な結果を残したエディタの多くが、9X系用とNT系用とでバイナリを分けているか、9X系OSをそもそもサポート対象外としているのは印象的で、私のような文系人間にとってはエディタを選ぶ際のわかりやすい目安になりそうです。それから、Shift-JISでエンコードできない文字をファイル名として扱えるかどうかも、多言語環境に対応するエディタを探す上で大まかな判断基準の一つになるかも知れません。テクストのまとめやスクラップを作っていると、章節なり記事なりのタイトルをそのままファイル名にしたいことが(少なくとも私には)よくありますし、そういうファイルを受け取ることもありますから、áâãなどをファイル名として扱えると便利なのですが、それらの文字をファイル名として使えるエディタならば、他のより重要な用途でもこなせる可能性が高まる模様です。

内部でUnicode処理をしているか、Shift-JIS処理かという話はよく聞きますが、この辺りの技術的な事柄について、私には詳しいことを述べる知識がありません。


各エディタのバージョンが上がったり、あるいは今回の実験に何らかのミスがあったりで、奇特な方が将来、同様の実験をされる折には、また違った結果が出る可能性はあります。間違いや不正確な記述を見つけられた方は、トップページに書いておりますアドレスまで、ご連絡いただければ幸いです。




04年12月
05年1月 ちょっぴり修正
05年2月 Windows2000(とKnoppix)でも読める(箇所が多くなる)ように修正
05年2月 実験項目と実験するエディタの見直し
05年4月 実験項目1.3の追加、3種類のエディタの追加など



目次に戻る