データ復旧のプロが集結!
日本では、アメリカのARPAネットのような長距離ネットワークがない状況からスタートしましたから、遠く隔たったローカルエリア・ネットワーク同士をつなぐという概念はまるでなかったのです。
せいぜい、大学内のネットワークを二つつなぐというくらいが、ネットワーク間相互接続の具体的な形でした。
つまり、外部のネットワークとの接続についての技術は、ローカルエリア・ネットワークの技術に比べて大きく遅れました。
それは、法律の規制により、通信回線を自由に使えない状況があったからです。
一九八五年四月に電電公杜が民営化されてNTTになるまでは、―般の回線を電話以外の目的で使うことは、ハードルが高くて普通の人にはとてもできませんでした。
正式には認可が必要でしたし、それにはたいへんな手間と出費がかかりそうでした。
たとえば三〇〇の(いまから見ればおもちゃのような)モデムで、電話回線を使ってどことどことをつなぐということの正式な認可を得るために、書類を出して、機器をそろえてとなると、何百万円かは覚悟しなければなりません。
しかも、電電公社との、何段階ものネゴシエーションのために足しげく通わなければだめだとか、そんな状態だったと思います。
JUNETの実験このような状況だったので、―般の長距離のネットワークが、日本では大きく遅れたのですが、八五年四月の電電公社民営化以後、電話磯や接続機器についての自由度がある程度出てきて、電話回線に接続して使える、データ通信用の一般向けモデムが発売されるようになりました。
そしてそれを使って、離れたコンピュータの相互接続をするという実験が始まりました。
これがJUNETです。
UNIXというオペレーティングシステム(OS)を使っているコンピュータ同士を、電話回線でつないだわけです。
実際には、このネットワークの実験は、電電公社民営化以前の―九八四年―〇月、東京工業大学、東京大学、慶応義塾大学を結ぶことから始めました。
民営化後を見越して開発が進められていた機器を使って、非公式に開始したのですが、民営化後も、事務レベルでは大きな抵抗感がありました。
電話回線を電話以外インターネットの変遷の目的で使うのはいけないことだと、多くの人が心配するなかで、「草の根」からネットワークをつないでいくという実験を重ねていったのです。
ちょうどそれが、当時コンピュータを研究していた人たちが、自分の仕事に関するメッセージを、相互にやりとりすることをだんだん覚えていく過程に重なったので、JUNETはどんどん広がることになりました。
そして同時にいくつかの課題が出て、研究が進められることになりました。
そのなかにはいくつかのテーマがあったのですが、ひとつは、言葉の問題でした。
三章でも少しふれましたが、コンピュータの世界での重大な分かれ道だったと思いますので、もう少しくわしく説明してみたいと思います。
そもそもは、コンピュータ・サイエンティストにとっては、ネットワークでソフトウェアをやりとりすることが必要だったのですが、実際にやりとりを始めると、人間と人間のコミュニケーションに使われるようになりました。
つまり最初は、ほとんどコンピュータのプログラム本体と、それに関連する若干の説明だけ―「このプログラムをあげる」とか、「このプログラムのここはこういうふうに書くから」という程度で、いわばコンピュータ同士のコミュニケーションだったのが、だんだん、人間同士のちょっとした冗談とか、食事の話とかが加わってくるし、―方では、もっと大きな議論をするようにもなりました。
前にも言いましたが、ここで障害になったのが言葉の問題だったわけです。
そのころはまだ、コンピュータで日本語を使う、そしてネットワークに日本語を通すということをまじめに考えていなかったので、英語で書くか、日本語をローマ字でつづるかだったのですが、これがひどい障害になってきました。
日本語化問題そこでJUNETのグループは、とうとうコンピュータ‥ネットワークで日本語をどう使うかという問題を議論するようになりました。
すると、UNIXというOSのあり方そのものとぶつかるような問題点も、どんどん出てきました。
たとえば、UNIXでは文字は一バイトと決まっていて、極端な話「キャラクター」(文字)という語と「バイト」という語が、あまり区別されないようなところもありましたが、そのようなコンセプトは根本的に違うのではないかという疑問が生じました。
私たちがUNインターネットの変遷IXの国際語化でやった仕事のかなりの部分は、「キャラクター」と「バイト」という語が区別なく使われているのを、これは「キャラクター」、これは「バイト」と区別をつけていくことだったといってもいいくらいでした。
また、日本語の入力方式の問題もかなり議論されました。
いまではおなじみになっている「かな・漢字変換」、「ローマ字・かな漢字変換」などです。
そして、それにはいい辞書が必要だけれど、各自が大きな辞書をもつのはたいへんだ、ネットワークでつながっているなら、どこかに辞書を置いて共有すればいいのではないか、という議論などが出ましたが、そのときに、では日本語だけでいいのか、ソフトウェアとして考えるときには国際語の問題を考えなければいけないのではないか、という問題が意識化され、いろいろな人と議論することになりました。
そのとき議論した仲間たちは、日本ではいまのWIDE(後述)の―員だったり、国際的にも今度JAVA言語をつくったビル・ソヨイのグループや、UCBR(カリフォルニア大学バークレー校)のグループのメンバーや、ベル研究所のオペレーティングシステムの研究者だったりします。
国内的にも国際的にも、いまコンピュータ・ネットワークのなかで働いているような研究者たちがみんな集まって、日本語はどう取りあつかうのか、国際語はどうするのか、と話しあいながら、結果として、電子メール上では国際的にあまりストレスのないコード(ISO2022-JP。いわゆる七ビットTUISコード)に、ネットワーク用のいくつかの付加規則を加えたもの)を設定して使おうと決めたのです。
実際的な解決これも、いま思うと、インターネットのほかの分野でしばしば見られるように、かなり実際主義的なやり方でした。
というのは、根本的な改定ではなく、すでに存在する体系で動くということを優先して決めたからです。
少し細かくなりますが説明してみましょう。
ローマ字は、八ビット(一バイト)ですべて表せるということは、三章でお話ししました。
しかし、実は英語に限れば大文字・小文字、数字合わせても、七ビット(一二八)で十分なのです。
そこで、世界のほとんどのソフトウェア(ほとんどかアメリカ製)は、文字については七ビットだけを使い、八ビットめをそのソフトウェアに固有な役割をもたせるような使い方をインターネットの変遷していました。
これが、日本語などマルチ・バイトの文字を通そうとする時に問題になるのです。
つまり、日本語の―文字は二バイト、すなわち―六ビット(ケタ)で示されるのに、八ビットめに、特別の意味をもたせているソフト(UNIXもそうでした)では、八ビットめで反応してしまうということになるからです。
これでは、「一六ビットで一文字」という方法は困難だということになります。
ここで、八ビットを別の目的に使っているソフトウェアがいけないのだから、そっちのほうを直すべきだという考え方と、いや、世界のソフトウェアはほとんど文字は七ビットで表示するようになっているのだから、何とか日本語も七ビットを基準にした二バイトで通るように工夫しようという、二つの議論が出たわけです。
期間限定でデータ復旧のキャンペーンを行っているなら、データ復旧のメリットを盛り込むなど、工夫できます。
今後のデータ復旧作成に少しでもデータ復旧を役立てていただきたいと思います。
データ復旧とともに、データ復旧を整備し、向上化に貢献します。
