« 荒松雄先生逝去 | Main | 現代ウイグル語小辞典(オンライン版)試験運用開始 »

データベースあれこれ

昨晩、旧知の研究者(在ドイツ)から以前構築したデータベースODIAS(Online Database on Inner Asian Studies )はどうなったのかという問い合わせが入りました。1年に数度、しかもすべて海外からそういう問い合わせが来るのですが、私はそのたびに憂鬱になります。

2004年に新疆写本(ODIAS-Y)と印刷物のデータベース(ODIAS-B)を構築していただいたのはいいのですが、母体の大型プロジェクトが終わったとたんに従来のサーバーが廃止となり、以後ODIASは稼動していません。金の切れ目が縁の切れ目、のような感じになっていますがどうも母体プロジェクトのサーバが今どのようになっているか不透明で、今後我々のデータベースが復旧するのかどうか見通しが立たないのが現状です。

実は万が一データベースが復旧したとしても今後それを拡張発展させていけるかどうかは大変不安なのですね。所詮そのデータベースは人(プログラマー)に作ってもらったデータベースで、メンテナンス、機能の拡張なども結局は作成者に有償でお願いしなくてはなりません。経済的な問題が仮にクリアできたとしても、サーバーへのアクセスは(私も、プログラマもそのサーバーの管理者ではない外部者ですから)逐一公式の手続きをとらなければならないというポリティカルな問題がいちいちついてまわります。これではきめ細かな更新などは望むべくもありません。

これは、自前でデータベースをあらためて構築し、自分が取り扱いやすいサーバーを使うほかはないんだろうな、というのが今の正直な気持ちです。しかし、では具体的にはどうしたらいいのか?市販のアプリケーション・ソフトのWeb公開機能(たとえばこれ)を使うのもひとつの考えですが、これにしてもそのソフトに未来永劫(というと大袈裟でしょうか)隷属しなければならない訳で、何だか面白くありません。かといって今からプログラミングを勉強するのも正直馬鹿馬鹿しい。私はそこまで暇ではないのです。ITを使うことはあっても、ITに使われるのは真っ平ごめん。何事にも限度というものがあり、私はもし必要ならプログラミングを知っているプロなりにお願いするべきで、自分でプログラムまで手を出すのはやりすぎだと思っています。

そういう思いをもちつつ鬱々としているのですが、ひょんなことで生物系のデータベース構築に関する興味深い記事を見つけました。この中「分散型広域データベースとしての位置づけ」という一文はなかなか示唆的です。要は個別にデータベースのプログラムを備える必要が本当にあるのか。インターネット上に素のコンテンツをおくだけで、それは既存の検索エンジンのデータとなるわけだから、そちらを利用するのもひとつの考えだ、ということですね。

たとえばサーバー上の1領域(フォルダ)に文献情報のデータを「上手に」配置して、あとはグーグルのサイト検索をその領域に対して行うように設定してやればそれなりにうまくいきそうです。もちろん、データの配置は上手にやらなければなりません。できるだけ細かな単位でひとつのhtmlファイルをつくるとか、すべてのファイルがリンクで辿れるようにするとか(でなければロボットはそのファイルを拾ってくれないでしょうね)、前述のサイトでも細かな部分ではCGIなどの機能追加の必要性にふれていましたが、CGIで手当てできる範囲は私でも何とかできるかもしれません。

何だかんだ言っても新疆研究で必要になる文献データは数が限られています。写本データは現在1000余ほどですが、これも劇的に増えたとしてもまさか2000に達することはあるまいと思われます。出版物目録にしてもどうやっても1万はいかないでしょう。つまり、扱うデータ量は先般私が構築した現代ウイグル語の小辞典(16,000語)ほどの量はないのです。こんな小さなデータの「入れ物」にあまり大仰なものは必要ないでしょう。と、書いて私は自分に「こんな仕事はたいしたことではない(そうだ、Yes, we can!)」と言い聞かせている訳ですが、さてどうなりますやら。


|

« 荒松雄先生逝去 | Main | 現代ウイグル語小辞典(オンライン版)試験運用開始 »

Comments

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



« 荒松雄先生逝去 | Main | 現代ウイグル語小辞典(オンライン版)試験運用開始 »