Jasp開発チーム
中野 純司
(統計数理研究所)
山本 由和
(徳島文理大学)
小林 郁典
(徳島文理大学)
藤原 丈史
(東京情報大学)
本多 啓介
(オープンテクノロジーズ)
ご意見・お問い合わせ

| TOP |
Jasp システムの概要
Jaspとは何か?
Jasp (Java based Statistical Processor)はJava 言語で作成された統計解析システムです.統計学の初心者から専門家までの幅ひろいユーザが、それぞれの目的に応じて使えるように設計されています.もちろん、Jasp を使うのにJava 言語の知識はまったく必要ありません.比較的簡単な Jasp 言語を利用することにより、最新の計算機技術を統計解析のために容易に利用することができるようになっています.

初心者は画面上のアイコンをクリックするというグラフィカルなユーザインタフェース (GUI, Graphical User Interface)で Jasp を操作できます.利用できる統計解析手法の整理された一覧表や簡単な説明も GUI で見ることができます.

GUI を利用したくない場合や複雑な統計解析を行いたい場合には、Jasp 言語 を用いて指示を与えることができます.Jasp 言語は関数を用いる言語で 、オブジェクト指向によるプログラミングを行うこと もできます.Jasp 言語による命令を直接与えるために、文字によるユーザイン タフェース(CUI, Character User Interface) のウインドウが用意されています し、命令を一連のプログラムとしてファイルに保存しておき、それをまとめて実行することもできます.

Jasp のユーザインタフェース(UI, User Interface) の特徴として、GUI と UI が、密接にむすびついていることがあげられます.ユーザは GUI とCUI を同 時に、自由に使い分けながら解析を行うことができます.一般に初心者やたまに しか Jasp を利用しないひと、または定型的な処理を行うことが多いひとは GUI を利用するでしょう.頻繁に利用する人、複雑な非定型的な処理を行うひ と、または新しい統計解析手法の開発を行う研究者はプログラムを書く必要があるので、 CUI を利用するほうが便利でしょう.そして立場や分野がことなるデータを扱う場合には、ひとりのひとでも、専門家としてふるまったり、初心者としてふるまったりすることがあることを考えると、 GUI と CUI が自由に行き来できることは使いやすい統計解析システムの必要条件だと思います.

Jasp のもう一つの特徴はネットワーク機能を十分に利用できることです. Jaspの統計計算はユーザの目の前の計算機で行われているとは限りません.ユー ザが操作しているのは UI の部分を受け持つクライアントプログラムであり、 実際に計算を行うサーバプログラムは離れた場所にある計算機で実行されているかもしれないのです.もちろん、クライアントとサーバが同じ計算機上で動いていてもかまいません.ユーザはいずれの場合でも同じ操作が行えますし、サーバがど こにあるかはほとんどの場合、気にする必要がありません.また、クライアントプログラムは WWW ブラウザ上のアプレットとして実行することもできます(この場合は、セキュリティ保持のためにいくらかの機能制限があります).さらに、大規模な計算を行いたい場合、複数のサーバを同時に利用して、分散処理を行うこ ともできます.そのための UI はできるだけ簡単になるように設計されてい ます.

Java で書かれたプログラム(class)を Jasp で用いることは非常に簡単です. これはJasp が基礎に用いているスクリプト言語 Pnuts の機能によります.また、 Javaのオブジェクト指向の考え方がこれを容易にしています.新しい Java プログラムを使うためには、単にそのクラスファイル(をまとめたもの)を import するだけで大丈夫です.この機能により、 Java で書かれたプログラムを Jasp 固有の機能と同じように利用することができます.

また、Fortran や C 言語で書かれたプログラムを Jasp から利用することも できます.これは Java の JNI(Java Native Interface) という機能を用いて実現されています.Fortran プログラム自身にはあまり手を加えることなく Jasp に組み込むことが可能です.これを用いて、Jasp には、これまで統計数理 研究所で開発されたいくつかのプログラムが組み込まれています(例えば、時系 析のための TIMSAC パッケージの中のいくつかのプログラム ).

なぜ、Jasp を作成するか?
現在では、すでに多くの統計パッケージが存在し、簡単に利用できるようになっています.それらのシステムは多くのものがすでに長い歴史を持ち、 そのため信頼性も高く、また、GUI のような使い勝手についても洗練され たものとなっています.それなのに、なぜ、また新しいシステムを作成する必要があるのでしょうか.

その理由の一つは自分たちが完全にコントロールできるシステムがほしい、 というものです.計算機を用いた統計学の研究は現在では大きな流れとなっています.この研究には統計学の手法と計算機の発達の両面から研究を進める必要があり、特に計算機のめざましい発展の成果をとりいれなくてはなりません.新しいアイデアを実現したり、最新のソフトウエアの成果を試したりしたい場合には、システムの内容を完全に把握しておかなくては すばやく対応することができません.他人のシステムを利用するにしても、 新しく作成するのと同じくらいの習熟が要求されるのです.それなら、 いっそのこと新しく作ったほうがよいでしょう.また、他人の作成したシステムはどうしてもオリジナルの作者の意向に従わなくてはなりません.ソースコー ドを自由に利用できるならよいのですが、それが有償化されたりすると、成果の配布についてさえも問題がでてきます.

また、これは心情的なことかも知れません が、アジア発のものを作りたいということもあります.現在、利用されてい る統計ソフトウエアはほとんどが USA 製です.また、ヨーロッパからもいくつかの優れたシステムが規模は小さいながらも流通しています.それに較べて、日本発のソフトウエアは少ないといわざるを得ません.日本にも質の高いソフトウエ アはあるのですが、日本の中で完結してしまい、世界に進出することが できなかったりすることが多いようです.これはひとつは言語の問題が大きいと思 われます.周知のように日本人は英語が苦手であり、多量の英語のマニュアルや入門的な文書を書きにくいのは事実です.ソフトウエアの質ではひけをとらなくて もその文書化の点で先に進めないことが多いようです.したがって、世界に発信するためには、つねに英語で考え、書き続けることが重要なのでしょうが、 そのためには、他国、特に近隣諸国との共同研究の形をとることは、ひとつの手段だと思います.また、このような点に関しては、日本だけではなく、 アジア諸国も多少は似たような状況にあると思われますので、協力を進めることにより、双方にとって得るところが大きいでしょう.

新しいシステムを作成するもう一つの理由は,最初の段階から最新技術を考慮にいれた設計を行ないたいということです.先に述べたように,多 くの既存の統計パッケージは長い歴史を持つものが多いのです.したがって,それらは当初の設計の上に,必要に応じて,新しい技術を導入してきました.も ちろん,基本的な部分の変更も行なわれたところもありますが,当初の設計思 想を引き継いでいるところも多いのです.そしてその設計は計算機が専門家の計算のための道具であった時代のものが多いのです.パーソナルコン ピュータの普及とその性能の目覚しい向上とインターネットの爆発的な普及を経験した現代では,計算機はすべての人のための情報を処理するため のごく普通の道具となっています.これらのことを考えて,統計パッケー ジも最初から設計しなおすことも必要だと思われます.

さらに,もうひとつの理由として,システム作成の経験 を積み重ねたいということがあります.統計数理研究所には多くの研究者がお り,多くのソフトウエアを作成しています.それらはほとんどが Fortran で書かれており,ユーザインタフェースはあまり使いやすいものではありません. これまでは Fortran program のままで希望者に提供してきましたが,これを 簡単に利用したいという要求が多くなってきています.そこで,これまでの蓄積 されたプログラム(時系列解析のための TIMSAC programs など)とこれから開発されるプログラムのためのベースとなるようなシステムが必要で しょう.また,データマイニングの隆盛にも関係しますが,今後は 計算機を用いる統計モデリングが重要です.特に,オブジェクト指向の 考え方による計算機モデルの利用は計算機が数学と同様のモデリングの道 具になりうることを示しており,それに対して統計的な観点から研究を行 なうことも必要です.そのような研究においては,自前のシステムを持 ち,それを作成した経験が重要となると考えられます.
Copyright c 2000 by Project Jasp All Rights Reserved