西日本電信電話株式会社(大阪市中央区、代表取締役社長:森下俊三、以下 NTT西日本)と国立遺伝学研究所(静岡県三島市、所長代行:小原雄治、以下 遺伝学研究所)が平成16年2月から3ヵ月にわたって実施した世界最大の国際DNAデータバンクとフレッツユーザのパソコンを利用した「グリッド」技術の共同実験*1の結果についてお知らせします。 |
1.共同実験の実施内容 |
 | (1)実験の概要および目的 |
|  | ネットワークに接続された複数のコンピュータを連携させ高速で大規模な計算処理を実現する「グリッド」技術を用いて一般家庭のパソコンの余剰能力を活用し、大規模なデータベースに接続し、情報解析研究に応用することの有効性やセキュリティ等の検証などを行いました。
具体的には一般のNTT西日本フレッツユーザの協力を広く公募し、家庭用パソコンの余剰能力を通信ネットワークを介して集約することによって仮想的な超高性能コンピュータを「グリッド」技術により実現し、遺伝学研究所が所有する世界最大の国際DNAデータバンク、日本DNAデータバンク(DDBJ)の公開用データベースをその仮想コンピュータに展開し、データベースへの高速なアクセスと検索アプリケーションの動作実験を実施しました。 |
 | (2)実施期間 |
|  | 平成16年2月16日(月)〜平成16年4月30日(金) |
 | (3)参加モニター数 |
|  | NTT西日本営業エリアのフレッツユーザ 約2,500人 |
2.実験結果 |
 | (1)グリッドシステムについて |
|  | <1>計算処理能力について |
| |  | 「グリッド」技術によりモニターのパソコンの余剰能力*2を集約し、最大約1TFlops*3(理論値)の計算処理能力を実現しました。これは世界最速のトップ500*4にランクインしているスーパーコンピュータの計算処理能力に相当するものです(2004年6月発表値)。 |
|  | <2>データの分散配置および管理方法について |
| |  | 一般のグリッドシステムでは、パソコンが計算処理に必要なデータや計算式等をセンタ側のサーバから取得しており、この方式では、パソコンからの接続がセンタ側のサーバに集中するため、計算処理量が多くなるにしたがってサーバがボトルネックとなりデータの取得に時間を要するため、総計算時間が増大するという問題点がありました。
今回の共同実験では計算処理に必要なデータを細分化し、あらかじめ一般家庭のパソコンに分散配置して、その配置情報をセンタ側で管理する方式を採用し、データが配置されているパソコンに対してハードディスクに保存されているデータに対応する計算処理を依頼したり、一般家庭のパソコン同士で必要なデータを送受信することを可能としました。その結果、センタ側サーバでボトルネックを生じることなく、また処理毎に行っていたデータ取得の削減により、短時間で計算処理を実行することができました。(図1参照)
このように分散配置されたデータを柔軟に利用できる技術は一般に「データグリッド」と呼ばれていますが、今回のような規模において一般家庭のパソコンを利用したデータグリッドの実験は世界でも類のない取組みと思われます。 |
|  | <3>セキュリティの技術について |
| |  | 今回の実験は、セキュリティへの対策状況が確認できない一般家庭のパソコン同士で計算に必要なデータ等が送受信されるため、ウイルスの感染の拡大やインターネット等を経由して家庭のパソコンのセキュリティホールを悪用したデータ改ざん等の不正行為が行われる可能性が懸念されました。本実験では様々なセキュリティ対策を実施した結果、被害に関する報告は受けておらず、システムの安全性について確認できました。 |
 | (2)解析結果ついて |
|  | 生命科学研究の分野における技術革新に伴い、生物種の全ゲノム配列情報の決定が急速に進行する状況において、新規遺伝子の探索やゲノム機能研究に大規模な計算能力が要求されるようになってきました。また、利用可能な情報の増加に伴い、ゲノム同士での比較解析が盛んになってくると共に、今後、より一般的な手法として生物の遺伝子全部を用いた比較研究が用いられると予測されます。
例えば、ヒトゲノム情報を利用し、医薬品を効率的に作り出すことが近年盛んにおこなわれており、相同性検索*5のデータは医薬品開発の分野で有効に活用されることが期待されています。このような目的において、ヒトのゲノムとモデル生物であるマウスやラットのゲノムは、相似性について分析することが非常に重要となります。
そこで、今回の実験ではグリッドシステムを使用して、ヒトゲノムとラットゲノムの類似遺伝子の検索をおこないました。もしヒトゲノムの中で病気の原因となっている既知の遺伝子と類似する遺伝子がラットにも存在した場合には、ラットにも同様の病気の原因となる遺伝子が存在すると考えることができます。このような理由から、動物の病気の原因となる遺伝子を利用してその機能の促進、抑制などの研究を通して医薬品の開発をおこなうことが可能となります。今回はラットデータを用いてグリッドシステムの利用による新規データへの迅速な対応の可能性も検討いたしました。
このようにしてグリッドシステムを使って得られたデータ(図2参照)は、ラットを用いた様々な応用研究を行っていく上での重要な基礎データとなると共に、生物の進化のような基礎科学の分野においても重要な役割を果たすことが期待されます。
以上の成果から増加していくゲノム配列情報を迅速に活用していくためのインフラの一つとしてグリッドシステムの有効性を確認することができました。 |
*1 |
実験開始のニュースリリース http://www.ntt-west.co.jp/news/0402/040203.html
共同実験のホームページ http://www.bioathome.jp/ |
*2 |
CPU、ハードディスクに代表される計算資源や情報資源などのうち、ユーザが使用していないリソース(資源)のこと。 |
*3 |
コンピュータの処理速度を示す単位で、1TFlopsのコンピュータは、1秒間に1兆回の浮動小数点数演算が可能であることを示します。 |
*4 |
http://www.top500.org |
*5 |
遺伝子やタンパク質のデータベースに対して、新しい配列と生物学的に近い配列を検索して機能や構造を推定する手法。本実験では、BLAST(Basic Local Alignment Search Tool)という一部分でも高い類似性を示す配列を見つけ出すアプリケーションを提供しました。 |
|