DNAから得られる情報は、標本よりも限定的
前稿では、DNA情報の活用の可能性を述べた。例えば全長数GBにも及ぶ長大な生命情報のうちのたった数KBであっても、多くの生物の種判定が可能であり、それを我々はINSDというデータベースに登 録して利用している。ほかにも、そのDNA情報が遺伝的な機能(髪を黒くするとか、目が青くなるとか)を有しているのであれば、ほかの種の似た配列に、そのような機能があると推定することもできる。このようにDNA情報は、非常に有用な人類共有の財産である。しかしこれは、生物そのものではなく、「生物の一部」である点には注意が払われるべきだ。
例えば、人類共通の(生物学的な)財産には他に、「標本」が挙げられる。標本とは、例えば動物の場合は、ある動物の実例を示すための個体、またはある動物の化石や仕業(例えば生物の巣穴など)、一部分である。この定義は、動物の学名に関する扱いについて述べた「国際動物命名規約第四版」のものであり、これに則れば、DNAも動物の一部分なので、厳密には標本といえる。ここではそのような広義の意味ではなく、ホルマリンなどの液体で満たされた瓶に入れられた生物の死骸や、昆虫の乾燥標本、植物の押し葉標本、微生物がガラスの板の間に挟まれて封入されたものなどの、生物そのものを「標本」として扱いたい。ちなみに国際動物命名規約には「死んだもの」という表現はないため、おそらく水族館で展示飼育されている生きた個体も「標本」と考えてよいだろう。
このような標本には、当然ながらその生物の外見的な特徴が残されている。したがって、例えばその生物が標本とされた当時は謎の種であったとしても、研究が進んだ時点でもう一度確認してみると、学術的に価値のある生物であることが判明する可能性がある。対してDNAは、普通の顕微鏡ではまずその形状が判別できないほど小さい。また、その配列情報のみが特徴となるため、技術の進歩によって追加で得られる情報は、まだまだ標本と比べると限定的なのである。
例えば、ある地域から得られた生物が標本として残されていたとする。その時点ではその地域でよく見られる生物だったとしても、その後その生物は環境変動によって絶滅してしまうかもしれない。そしてそのような状況に陥った時、標本さえ残っていれば、当時の環境を検証することができる。しかし、もしその生物のDNAだけが残っている状況だったとすると、後から検証できることは少なくなるだろう。その標本にDNAは含まれているが、DNAにはその他の情報が無いからである。
どんな生物由来なのかがわからないと意味がない
生物学では、非常に多くの研究者に扱われる種が存在する。これらはモデル生物と呼ばれ、全生物で共通してみられるような(すなわちそれは教科書に載るような)知見の多くは、このような種から得られたものである。モデル生物は概して飼育しやすく、世代交代が早い(生まれてから成熟するまでの期間が早い)種である。例えばキイロショジョウバエ(Drosophila melanogaster)は飼育が非常に簡単で、手のひらに収まる試験管の中で飼育・繁殖させることができる。遺伝子の違いが顕著にその特徴として現れることも知られており、古くから遺伝学分野のモデル生物として扱われてきた。例えば動物の体に節(体節)を生じさせる遺伝子に発見にも関わっている。
しかしモデル生物はまだまだ数が少なく、現在地球上で名前が付けられている約200万種の生物のうち、おそらく100種を超えるか超えないかという程度だと思われる。しかし飼育技術やDNA解析技術の発達によって、野外から発見されるモデル生物は増えてくると予想される。
そのような種の初期の研究において重要になるのは、その種の境界線を明瞭にすることである。例えば、50年前にA種として記載されたある昆虫が生物学的に有用であることが見いだされつつあり、その分布域から幅広く収集され、遺伝学的な研究が行われたとする。そしてある程度研究が進んだところで、改めてそのDNA配列を比べてみると、複数種に分けるべきであることが判明したとする。この場合、いくら似た種であるとはいえ、それらがあくまでも別種である以上、これまでに行われた研究はすべてこの複数種ごとに分けて考えなければならない。
この時、もし標本が残されていれば、その標本の形態をつぶさに比較することで、DNA配列の情報と形態の差を紐づけることが可能である。DNA情報が簡便に得られるようになってきたのはここ十数年の話なので、A種が発見されてから数十年の研究成果には、形態の情報はあってDNA情報が添えられていないものも多いだろう。その意味で、形態情報に基づいた分類がしっかりとなされていれば、A種記載以降の50年間の研究を問題なく比較でき、複数種が含まれていても、個々の種のものとして整理し、改めて発信することができる。
DNA情報だけでは、過去の研究情報を生かせない
しかしDNAしか残されていない状態であれば、DNAに基づいて認められた複数種のうち、はたしてどの配列をA種のものにすべきなのか、そして他の種にはどのような名前を与えるべきか判定ができなくなってしまう。なぜならば、過去の研究ではDNA情報がほとんどないため、それらの研究情報が複数種に基づくものなのか、判定ができないからである。
この場合、各地からこの生物をもう一度収集し、標本を集め、研究のやり直しを行わなくてはならない。そして各標本のDNA情報を改めて抽出し、形態と比較することでようやく、過去の研究情報との対応がつけられることになる。このように、DNA情報は扱いやすく非常に便利ではあるが、それが果たしてどのような生物から得られているのか、その対応がきっちり付けられていないとならない。
ネット上のDNA情報には「クモヒトデの一種」と登録されている種もいるが、クモヒトデは2,000種以上が存在
さて、前置きが長くなってしまったが、これで、DNA情報と標本情報がしっかりと紐づいていることの重要性をお話ししたつもりである。標本さえ残っていれば、後からその生物の正確な学名情報を、いつでも得ることができる。そして正確な学名情報が付随して初めて、我々はDNA情報を最大限に活用できるのである。
では、インターネット上に登録されているDNA情報は果たしてどうだろうか。前稿でご紹介したINSDは、DNA情報とともに学名の登録が求められる。ではこれでDNA情報活用のための原則が満たされているかといえば、実は必ずしもそうとは言えない。なぜならば、それが「正確な学名」とは限らないからである。
そのようになる一つの要因は、その学名情報の登録者が、必ずしも分類学者ではないという点である。もちろんその生物によってかなり事情は異なるのだが、例えばクモヒトデでは、”Ophiuroidea sp.”と学名が登録されたDNA情報が散見される。これは「クモヒトデの一種」という意味である。現在、クモヒトデには2,000種以上が知られている。ということは、この学名で登録されたDNA情報は、「2,000種以上知られているクモヒトデのうちのいずれか一種のDNAのある一部分の配列」であることを意味している。これは情報としてかなりあいまいなものだ。もちろん、INSD上でさらにDNA情報の蓄積が進み、ある時、”Ophiura kinbergi”という種の配列がこの配列と一致したとすれば、この”Ophiuroidea sp.”の学名をより正確なものに修正できる。しかしそのような修正がなされたDNA情報はあまり多くない。
標本へのアクセスは可能か?
その理由は、そのDNA情報の基になった標本へのアクセスが難しいという点である。先にも述べた話と同じで、INSDに登録された段階では名前が不明であっても、後から標本を調べることができれば、より正確な種名のアップデートは可能である。そしてINSDでは、DNA情報に標本情報を紐づけることは可能である。
しかし、すべての標本が博物館などの標本保管施設に収められているわけではない。博物館であれば、標本を観察したいという申し出があればそれに応ずる義務があるが、実際には研究室単位で保管されている標本もあり、その場合は標本観察に応じてもらえない可能性もある。また、標本番号はあっても標本が残されていない場合や、そもそも標本番号自体がつけられていないDNA情報も多々ある。このような場合、一度DNA情報につけられた学名は修正することができないという点で、場合によってはノイズ情報として残り続けることとなる。
弾力性のあるラベルをつけるべき
では果たして、「望ましい学名情報」とは何なのか?私が考えるにそれは、ただの学名情報ではなく、「再現性のある(=検証可能な)学名」である。DNAに付随する学名情報は、一度DNA情報に紐づけたらそれで終わりではなく、後から検証可能であるようなシステムとすべきと考えられる。
これまでに述べた通り、学名は変わりうる。正確には、「ある生物のまとまりにつけるべき学名は変わりうる」、であるが、DNA情報などの生物の一部を利用する際には、そ のことをよく理解するべきである。あえてラベルという言葉にこだわれば、DNA情報に付随すべきなのは、研究が進み、その生物に与えるべき学名が変わったときに、それを柔軟に修正しうるような「弾力性のあるラベル」である。
ラベルに弾力性を与える方法の一つとしては、そのDNA情報のきっちりとした標本情報(どこに、どのような状態で収められ、どのような標本番号を有しているか)が示され、そしてその標本にアクセスできることが担保されていることが挙げられる。そして、その生物の特徴がわかるような画像が付随されていればさらに望ましい(もちろん生物の外観画像だけでもかなり有用である)。
ラベルを提供するのは?
実際には、INSDにもそのような弾力性を提供するシステムはあるのだが、すべてのDNA情報にそれを厳密に適用するのには多大な労力がかかるし、研究分野によってはそれは研究を進める妨げにすらなるだろう。その場合でも(弾力性が与えられない場合でも)、できればそのラベルの学名情報の「正確性」が与えられていれば、それは非常に有用な情報となるだろう。
そのような正確性を与えるのは、分類学者に他ならない。というよりも、おそらく分類学者がDNA情報を登録する際には、努めて「弾力性のあるラベル」が付随することだろう。分類学者は、「正確な学名」を提供することの難しさをよく知っているからだ。
そして、DNA情報に対してこのような「分類学者のお墨付き」が与えられる(特別にハイライトできる)データベースは、あまり多くない。しかし近年のDNA情報の加速度的な蓄積によって、弾力性のある ラベルはますます重要になると予想できる。