SHIFT-JIS環境で英文字の特殊文字を表示する


外国語関係のホームページをやっていて本当に困るのが、“特殊文字”の表示だ。最近のコンピュータはどんどん便利になってきて、機械の中には特殊文字のフォントがあるにもかかわらず、ウェブページでそれを表示することができない。それで、「ウムラウトの表示は技術上できないので御了承ください」などのように書かれたホームページをよく見かける。

しかし実は、私たちも技術上、ウムラウトの表示ができるのだ。しかもそれは、何か特別なソフトが必要なのではなく、手作業でできる。ちょっと面倒臭いが、全然できないと諦めるよりはいい。

英文字の特殊文字が必要なのは、次のような場合だ。

1.日本式ローマ字の表示

日本式ローマ字では、母音の長音を表す記号を用いている。これは普通、文字コードを英語にしなければ表示できない。しかし、次のやり方で、表示できる。イコールの左側が表示された文字で、イコールの右側はそれを表示するために入力する文字だ。赤い字で表示されているのが元になる字で、大文字と小文字が区別されることに注意しよう。

â = â
 = Â
î = î
Î = Î
û = û
Û = Û
ê = ê
Ê = Ê
ô = ô
Ô = Ô

上の記号の成り立ちを見てみると、“&”と“;”に囲まれた中に記号を入れている。他の特殊文字も全てこのやりかたで行われる。“&”と“;”は特殊文字表示命令の始まりと終わりを表すらしい。

そしてその中に、表示したい文字を入れ、その後ろに“circ”を付け足す。これは“circumplex”(=曲アクセント)の略号だろう。あるページで発見した他の特殊文字は、母音字の上に“´”を付けるものだが、ソースを見てみると、これは“circ”の代りに“acute”となっていた。これは文字どおり“acute”(=鋭アクセント)を表す。

そこで、ひょっとして文字の上に“^”をつけるのは“grave”(=重アクセント)ではないかと思ってやってみたら、大成功! 言語学を勉強していてよかった。ではウムラウトは“um”かなと思ってやってみたら、失敗。そこで今度は“umlaut”を入れてみたら、ウムラウトの入った母音字の後ろに“aut”が出てきた。ということは、ウムラウトの表示には、“circ”の部分を“uml”に変えればいいわけだ。

これで、石川啄木の『ローマ字日記』の一部を表示してみよう。この箇所は、ローマ字と日本語が交ぜ書きになっている部分だ。

Kyô mo yasumu. Kyô wa ichi-nichi Pen wo nigitte ita. "鎖門一日" wo kaite yame, "追想" wo kaite yame, "Omoshiroi Otoko?" wo kaite yame, "少年時の追想" wo kaite yameta. Sore dake Yo no Atama ga Dôyô shite ita. Tsui ni Yo wa Pen wo nage-dashita. Soshite hayaku neta. Nemurenakatta no wa Muron de aru.(石川啄木著『ローマ字日記』岩波文庫、p.98)

これを表示するとき、文字コードの指定をメタタグに入れておかないと、コンピュータによっては日本語の部分が文字化けしてしまうかも知れない。だから、次のようなメタタグをヘッドに入れておくべきだ。

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=SHIFT_JIS">

また、日本語のフォントだけでは英字の特殊文字がきれいな形で表示されず、見た目が悪くなることがある。そこで、フォントの表示もしておいた方がいい。<body>の下に、次のようなタグを入れておいたらどうだろうか。

<font face="MS Gothic, Osaka, Geneva, sans-serif">

ここに書き込んでおいたフォント名は、ウィンドーズとマックの両方できれいに出るようにするためだ。私が選んだものだが、私の持っているマックとウィンドーズではきれいに表示されたが、ひょっとしたらもっと適切な選択があるかも知れない。

これらの特殊文字は、ウィンドーズでもマッキントッシュでも、インターネットエクスプローラでは表示されるが、ネットスケープでは表示されない。実は私は他に、マッキントッシュのネットスケープでだけ特殊文字を表示できる方法を知っているのだが、これほど無益な技術もないかも知れない。

2.ドイツ語の表示

ドイツ語を表示するときには、ウムラウトや特殊な文字が必要になる(フィンランド語も)。ウムラウトの表示は、上で示したように“circ”を“uml”に替えればいい。

ä = &auml;
Ä = &Auml;
ï = &iuml;
Ï = &Iuml;
ü = &uuml;
Ü = &Uuml;
ë = &euml;
Ë = &Euml;
ö = &ouml;
Ö = &Ouml;

ドイツ語にはそれだけでなく、エスツェットと呼ばれる文字“ß”があったと思う。これは、コード番号で表示させる。さっきの“&”と“;”の間に、番号であることを示す“#”を書き入れ、その後ろに該当するコード番号を書く。“ß”は223番に出てきたから(ごていねいに#000から#600まで調べてみたのだ)、下のように入力する。

&#223;

この数字の部分を入れ替えることによって、様々な特殊文字を表示することができる。この方法でドイツ語のテキストを表示すると、こんな感じになる。(何のことか全く分らないまま打ち込んでいるからとんだ間違いをしでかしているかも知れません。)

In Berlin lebte ein berühmter Medizinprofessor, der bei seinen Studenten sehr gefürchtet war. Wenn er Vorsitzender in der Nächsten Prüfungskommission werden sollte, dann war stets große Aufregung, denn er war dafür bekannt, daß er die schwierigsten Fragen stellte und oft einen Kandidaten durchfallen ließ, wenn dieser nicht die Antwort gab, die der Professor zu hören wünschte.

3.イタリア語の表示

イタリア語を表示するには、日本語ローマ字の表示で示したタグに、“circ”の代りに“grave”や“acute”を入れればできる。これでイタリア語のテキストを表示すると、下のようになる。

Dal 1946 l'Italia è una repubblica democratica. La sovranità spetta infatti al popolo, che la esercita attraverso il Parlamento. Il Parlamento italiano è composton dalla Camera dei deputati (630 membri) e dal Senato dela Repubblica (315 membri).

4.フランス語の表示

フランス語は特殊文字が多い。母音の上に記号を付けるものは、日本語ローマ字の表示で説明したようにやればいいが、特殊な母音字もある。

“œ”と“Œ”は、それぞれ339番と338番なので、小文字は“&#339;”、大文字は“&#338;”と入力すればいい。面倒ならこのタグをコピー&ペーストすればいい。ただしこのタグは、マッキントッシュのIEでは“oe”、“OE”と表示されるかも知れない。マッキントッシュのフォントにもこの字は入っているのだが、これはどうしたことだろうか。

それと、フランス語をフランス語らしくしているセディーユという名の文字(Ç, ç)がある。この大文字のコードは199番で、小文字は231番だ。マックではきれいに表示されないかも知れないが、ウィンドーズではきれいに表示される。

Mais, aussitôt après, je pris garde que, pendant que je voulais ainsi penser que tout était faux, il fallait nécessairement que moi, qui le pensais, fusse quelque chose. Et remarquant que cette vérité : je pense, donc je suis, était si ferme et si assurée, que toutes les plus extravagantes suppositions des sceptiques n'étaient pas capables de l'ébranler, je jugeai que je pouvais la recevoir, sans scrupule, pour le premier principe de la philosophie, que je cherchais.

5.エスペラント語の表示

エスペラント語は国際補助語として開発された言語だが、サイバー時代にはちょっと不便な言語になってしまった。特殊文字を使うからだ。しかも、よく使う。エスペラント語で使う文字は次のタグで表される。また、私のマックでは文字の上につける飾りが右上にずれて表示される。

Ĉ = &#264;
ĉ = &#265;
Ĝ = &#284;
ĝ = &#285;
Ĥ = &#292;
ĥ = &#293;
Ĵ = &#308;
ĵ = &#309;
Ŝ = &#348;
ŝ = &#349;
Ŭ = &#364;
ŭ = &#365;

これでエスペラント語を表示すると次のようになる。

Jen mi donas el la sinagogo de Satano, kiuj sin nomas Judoj, kaj estas ne tiaj, sed mensogas; jen mi igos ilin veni kaj adorkliniĝi antaŭ viaj piedoj, kaj scii, ke mi vin amis. Ĉar vi observis la vorton de mia pacienco, mi ankaŭ vin konservos el tiu horo de provo, kiu venos sur la tutan mondon, por provi la loĝantojn sur la tero.

6.ギリシャ語の表示

ギリシャ語の表示は、以上の方法と違う。フォントの指定を行う方法を取る。“symbol”という書体を使うのだ。以下のタグの中に書き込む。

<font face="symbol"></font>

この入力の難点は、ギリシャ語の正書法にあるアクセント記号や気息記号、下付きのイオタなどが表記できないことだ。それでもまあ、もともとのギリシャ語は文字以外に何の飾りも付いていなかったのだから、許されるだろう。ギリシャ語の文字はローマ字の次の文字に当たる。ギリシャ語関係のホームページを使いたい人にははなはだ不満なやり方だが、現在一番簡単なのはこの方法だ。

A, a = A, a
B, b = B, b
G, g = G, g
D, d = D, d
E, e = E, e
Z, z = Z, z
H, h = H, h
Q, q (J) = Q, q (J)
I, i = I, i
K, k = K, k
L, l = L, l
M, m = M, m
N, n = N, n
X, x = X, x
O, o = O, o
P, p = P, p
R, r = R, r
S, s/V = S, s/V
T, t = T, t
U, u = U, u
F, f (j) = F, f (j)
C, c = C, c
Y, y = Y, y
W, w = W, w

これでギリシャ語のテキストを表示すると次のようになる。

Tote idwn IoudaV o paradidouV auton oti katekriJh metamelhJeiV estreyen ta triakonta arguria touV arciereusin kai presbuteroiV legwn, Hmarton paradouV aima aJwon. oi de eipan, Ti proV hmaV; su oyh. kai riyaV ta arguria eiV ton naon anecwrhsen, kai apelJwn aphnxato.

なお、この文字は、マッキントッシュのIEでは表示できない。ウィンドーズではIEで表示できるのだが、マッキントッシュを使っている人は、ネットスケープを使う必要がある。ウェブブラウザの他言語支援は、ネットスケープよりはIEの方が優れていて、マッキントッシュよりもウィンドーズの方が優れている。


どうだろうか。今まで技術的な問題で外国語関係のホームページを作ることをあきらめていた人も、やる気が出てきたのではないだろうか。