伊藤 希 氏
筑波大学生物科学系講師
GBIF(地球規模生物多様性情報機構)第1回ニールセン賞受賞者
演題:
『名前はなぜ生物情報学の問題になるのか?』
Why does name matter to bioinformatics?
要旨:
-
生物多様性条約にも関連して、地球規模での分類学的データベースの構築が行なわれつつある。
既に記載されている種だけで 150 万種を越えると推定されており、しかも未記載種数は既知種の 100 倍とも言われている。
数だけに着目すればこれらの既知あるいは未記載種の数は中規模の都市やひとつの国家の人口と同程度であり、技術的には既に解決しているべき問題と誤解されがちである。
しかし、住民登録が個体のデータベースであるのに対し、分類学上必要となるのは個体データベースに相当する標本管理システムに加え、分類群の名についてのデータベースである。
分類群の名は生物分類学の基本的語彙であり、命名規約は一種の文法である。したがって、哲学者を悩ませてきた言語にまつわる問題はそのまま分類学にもあてはまる (これは所謂「オントロジー」にもあてはまろう)。
分類学の言語は、通常の言語に比べ語数が多く (たとえば OED の収録語数は数十万語程度であり、既知種の 1/3 程度である)、品詞は名に偏っている。
しかもこの生物学の語彙は、生物学的知見の蓄積に伴って変化してゆく。
学名データベースは、この変化しうる語彙を、過去の履歴も含めて追跡可能でなければならない。
しかも、ある言語の語が単一の単語としてではなく全体として機能するのと同様に、生物の名もまたある分類体系の中のひとつの名として機能する。
したがって、学名の比較と追跡を可能とするには、分類体系に依存しない分類データベースという、一見矛盾したシステムを実現す
る必要がある。この様なシステムについて、その背景、実現上困難な点とその克服、語用論の範囲で (すなわち生物学的知識を使わずに) なにが実現できるのか、を紹介する。
|