位相的データ解析および統計的因果探索に基づく遺伝子制御ネットワークの推定

Date
2020/01/14 Tue 16:30 - 18:00
Room
6号館809号室
Speaker
井元 佑介
Affiliation
京都大学高等研究院 ヒト生物学高等研究拠点
Abstract

遺伝子制御ネットワーク(Gene Regulatory Network; GRN)は遺伝子発現の制御関係(促進あるいは抑制を表す因果関係)を表すネットワークモデルである.この遺伝子発現の制御関係が,遺伝子情報だけでは説明できない生物の多様性を表現する要因の一つと考えられている.近年では,次世代シーケンサーの開発などによって,細胞から多くの遺伝子発現データを収集できるようになり,そのデータを活用した遺伝子データ解析や遺伝子制御ネットワークの推定が盛んに行われている.その推定は,自然状態の細胞における遺伝子発現データ(非介入データ)とノックアウトや強制発現のような遺伝子操作を施した介入データを比較するランダム化比較試験のような従来型の因果推定が主流である.しかしながら,遺伝子操作は費用が高コストであり,遺伝子の候補も数千~数万個存在するため,数個~数十個の遺伝子に対する遺伝子制御ネットワークを推定するのに膨大な費用と時間がかかってしまう.そのため,比較的低コストで大量に収集可能な非介入データから遺伝子制御ネットワークを推定できる手法の開発が期待されている.
本研究では,遺伝子発現データから位相的データ解析手法"Mapper"を用いて主要な遺伝子群を推定し,統計的因果探索手法"LiNGAM"を応用して主要な遺伝子群に対する遺伝子制御ネットワークを推定することを目的とする.Mapperは次元削減を行わずにデータが持つ位相的特徴量を抽出するという特徴から,遺伝子群が持つ高次元構造を抽出することができる.この高次元構造を用いて,細胞の分化過程における分岐構造を観察することで主要な遺伝子群を推定する.LiNGAMは非介入データから因果ネットワークを一意かつ高速に推定できる手法である.しかしながら,LiNGAMの背景にある数理モデルは線形かつ時間定常の数理モデルとなっているため,一般的に時間非定常かつ非線形な遺伝子発現現象には直接適用できない.そこで,本研究では遺伝子発現現象に用いられている力学系モデル(スイッチングシステム)を導入し,その時間離散モデルがいくらかの仮定のもとでLiNGAMに適用可能であること示す.さらに,その時間離散モデルに基づいて推定される遺伝子制御ネットワークは本来の遺伝子制御ネットワークの部分ネットワークとなり,これらを重ね合わせで遺伝子制御ネットワークを推定する手法を提案する.
本講演は平岡裕章氏,斎藤通紀氏,小島洋児氏(京都大学),清水昌平氏(滋賀大学),前田高志ニコラス氏(理化学研究所)との共同研究(WPI-ASHBiプロジェクト)に基づく.