生物学と情報科学のあいだ

計算システムズ生物学研究室(CSBLab)は,NAISTの情報科学科にありながら,その名に「生物学」を冠する唯一の研究室です.名前は複雑ですが,CSBLabの研究分野は「生物学と情報科学の融合領域」というシンプルな一文に要約することができます.

つまり,CSBLabは生物学の研究室です.生物学というと,情報系や工学系の方々は,CSBLabにとっつきづらい印象をお持ちになるかもしれません.そこで今回,NAIST Edgeの紙面を借りて,主にNAISTへの入学を希望する学生の皆さんに向けて,この研究分野の特徴と面白さを紹介したいと思います.

先に述べたように,CSBLabは生物学と情報科学の融合領域で研究活動を展開しています.この領域での研究は日増しに増えており,それだけその重要性が理解されてきているとも言えます.この領域がどのようなもので,どんな魅力を持っているのか,例を上げて説明してみましょう.

生物学で最も重要な研究対象はDNAです.DNAは,生命の全ての遺伝情報を含む“設計書”のようなもので,親から子へ伝わることで種(しゅ)を存続させています.その情報は,A・T・C・Gと略される4つの物質の並び方で表現されています.DNAの機能が発見されて以来,「ヒトゲノム計画」を号砲に様々な生物のDNA配列が明らかにされてきました.現在の生物学研究では,対象の“設計書”を分析し,他の生物と比較したり分類したりすることが盛んに行われています.

この“設計書”を4文字からなる文書と見立てると,文字列検索・比較アルゴリズムやクラスタリングといった情報科学の成果が容易に適用できます. そして生物学にはDNA以外にも文字列とみなせる対象は多く,同様の発想は一般的になりつつあります.

情報科学を生物学に対して適用する.素朴な発想でありながら,その成果は非常に面白いものです.例えば文字列比較アルゴリズムは,DNAを比較分類することで,人と類人猿との違いを浮き彫りにし,先天性の病気の原因を突き止めるばかりでなく,日本人だけが海苔を効率よく消化できるという意外な事実も教えてくれます.一方,クラスタリングは,生命の系統樹を構成することで,私たち人類がアフリカから全世界へと拡大していった軌跡を描き出し,恐竜は爬虫類でなく鳥類の祖先であることを示唆しつつ,地球最初の生命の素性にまで迫っています.

コンピュータから出力されたにも関わらず,自然そのものと同じくらい豊かで魅力的なこれらの知見は,生物学と情報科学の融合がもたらす結果の一部に過ぎません.今後も両分野の融合は加速し,さらに魅力的な知見が得られることは間違いないでしょう.

この刺激的な融合領域において,CSBLabのある研究成果が重要な役割を果たしています.それは KNApSAcK(ナップサック)という,データベースです.

なぜデータベースが重要なのでしょうか.それは,生物学研究の成果として生成される多様なデータが,データベースとして,再利用できる形で蓄積され公開されていなかったとしたら,情報科学を応用することはできないからです.ナップサックはそのようなデータベースの一つで,著名な論文雑誌(Natureなど)にも紹介され,世界中で利用されています.ナップサックに登録されているのは,植物の代謝物約5万種の詳細なデータと,その代謝物がどの植物に含まれているかを示した10万件のデータです.

KNApSAc

代謝物とは,平たく言えば生物が作り出す化学物質のことです.例えば植物では,花の色や匂い,香辛料の辛さや果物の甘み,薬用植物の薬効成分など,人間が植物に認める特徴のほとんどは代謝物という化学物質で説明することができます.最近,その代謝物の分子量を高速かつ正確に測定する手法が開発されました.それに伴い,生物の中にある様々な代謝物について,それらが作られるメカニズムを解明する研究が盛んになっています.

その際,代謝物のデータベースであるナップサックを利用することで,測定された分子量から代謝物を容易に特定することができるのです.ナップサックの大きな特長は,登録データに必ず根拠文献・論文が記載されていることで,これを用いて利用者はデータの信頼性を検証することができます.

こうして見ると,ナップサックは,生物学の多様な知の集約地点の一つであると同時に,既存の知見を利用した新たな発見の源泉になっていると言えます.そして,ナップサックを擁するCSBLabにおいても,多様なバックグラウンドを持つ人々が知を結集し,新たな発見をすべく研究を進めています.

実は,CSBLabでは生物学的な実験は行なっていません.なので培養皿もスポイトもマウスも要りません.データベースに蓄積されたデータと,共同研究で得た新たなデータに情報科学を適用して,新たな知見を生み出しています.その一部を紹介しましょう.

ある代謝物を一定量作り出すには幾つもの化学反応が協調して進行する必要があります.さらに,この化学反応の複雑なネットワークは,DNA(正確には遺伝子発現量)によって適切に調節されています.このネットワークのメカニズムを解明するために,ナップサックのデータに加え,ネットワーク解析やクラスタリング,シミュレーションなどの手法を組み合わせた研究を行なっています.現在,植物の研究で重要なシロイヌナズナや,バイオ燃料の作り手として期待されるミドリムシについて解析を進めています.また,食文化や伝統医療の形をとりながら,人々の健康に貢献してきた世界中の料理や民間薬にも注目しています.これらを代謝物の組み合わせとみなし,食と健康との関係を分子レベルで明らかにするために,様々なアプローチを試みています.

さらに今年から,CSBLabの研究テーマに生命機能計測分野が加わり,最先端の測定機器とその周辺技術の開発が可能になりました.例えば,光ピンセットと呼ばれる装置は,細胞レベルの対象を自在に動かすことで,そこに働く微弱な力を計測することができます.また,小型で携帯可能な深部体温計は,一日を通して人の体温を記録することで,病気の前兆をいち早く検出できると期待されています.医療機関で行われるCT・MRI検査においては,激しく動く心臓の連続画像から,鮮明な静止画像を抽出したり,診断に関わる重要な部分を自動で検出する新技術が望まれています.CSBLabでは,これらの未だ研究段階にある最新の技術を実現するため,光工学や画像解析などの知識を活かした研究を進めています.

opttw

このように,CSBLabでは「生物学と情報科学の融合領域」で,基礎から応用まで幅広い研究をすることができます.やりたいことがはっきりしているなら,自由にテーマを選んで研究することさえ可能です.この自由こそが,CSBLabの一番の魅力だと思っています.

最後に,生物学の究極の疑問の話をして,紹介を終わりたいと思います.

生物学は全て,突き詰めると「生命とは何か」という,究極の疑問に行きつきます.誰でも,人生で一度は,この疑問を頭の中でもてあそんだことがあると思います.生物学はこの疑問に長年の間挑戦し,その過程で生まれた知見は,人間社会を着実に豊かにしてきました.

この疑問は生物学の面白さの源泉であると同時に,真剣に考える価値のあるものなのです.

今までに何を学んでいたにせよ,「生命とは何か」という疑問に,真剣に取り組むに値する何かを感じるなら,あなたはCSBLabで最高に面白いことができるに違いありません.

この記事を読んで,CSBLabのテーマを少しでも面白く感じてもらえたのなら,一メンバーとしてこれほど嬉しいことはありません.