化合物の類縁体検索とクラスタリング

 多様で多数の化合物の提供において、化合物群を比較する方法、生物学的評価によるヒット化合物の構造類縁体を検索する方法、多数の化合物群を構造的にグループ分けするクラスタリングの各情報ツールが必要となります。化合物を扱う情報ツールの基本は分子構造の数量的比較です。
 図1に示すように化合物Aと化合物Bの比較を考えるとき、構造を構成する部分フラグメントに分割し、全体のフラグメント数のうち、共通するフラグメント数の割合を計算する谷本係数によって数量的に類似度が求められます。(図2)

図1. 化合物Aと化合物Bの比較


図2. 化合物Aと化合物Bのフラグメント



化合物の類縁体検索

 ヒット化合物の構造をもとにライブラリー化合物に収載されている化合物を類似度の順に提示することができます。図3は部分フラグメントとして母核が一定の類縁体群であることを示しており、図4は類縁体で母核の変化していることが確認できます。

図3. 類縁体検索結果


図4. 類縁体検索結果



化合物のクラスタリング

 化合物間の距離 (類似度)を元に化合物群を階層的なクラスターにグループ分けするクラスタリングが実施できます。階層型クラスタリングの代表的な手法であるWard法では、クラスター形成の過程で、クラスター内の化合物間の距離の分散が最小となるようにクラスターに組み入れる新たな化合物の選択を繰り返します。したがって多数の化合物群が階層的にクラスタリングされていれば、階層の閾値を設定することで、化合物群を距離間の小さい任意のグループに分割することができます。
 この方法を用いて、Pilotライブラリーの組み替え、選択化合物の分類、代表化合物の選定を行います。

図5. クラスタリング



ページトップへ
Design by Megapx  Template by s-hoshino.com