バイオビッグデータの「見える化」に成功

最終更新日:2019年1月16日

Select Language >>

0120-978-003
月~土 9時~18時 / 夜間・日・祝は受付のみ
臨床検査技師コラム

バイオビッグデータの「見える化」に成功

2018.12.17

九州大学は11月9日、沖真弥氏(同大大学院医学研究院助教)と目野主税氏(教授)が、大田達郎氏(情報システム研究機構・ライフサイエンス統合データベースセンター(DBCLS)特任研究員)などと共同で、世界中から集約した「タンパク質とゲノムDNAの結合情報」を全てデータベース化し、組織や臓器を形成する『司令塔的なタンパク質の探索』にも応用が可能であることを示したと発表した。

同研究成果は、国際学術雑誌「EMBO Reports」(電子版)に掲載されている。

スムーズな情報活用が困難な約10万件のバイオビッグデータ

ヒトの細胞の中には「ゲノムDNA」が存在するが、この「ゲノムDNA」は、ヒストン(タンパク質のひとつ)に巻きつき、クロマチンという構造を形成している。

このクロマチンに、転写因子(約1,000種類のタンパク質)が結合すると、付近の遺伝子発現のオン・オフ制御を行うようになり、組織や臓器を形成し、正常に機能させる役割を担っている。

これらにメカニズムに異常が生じると、遺伝子の制御は乱れてしまい、胎児の奇形、がんや自己免疫疾患などの原因にもなるとされる。

一方で、ゲノムDNAには転写因子が30億塩基対もあることが分かっているものの、それがどこに結合しているのかは明らかにされていなかった。

2007年には、『ChIP-seq法』が開発され、これまで10万件近くもの実験結果が報告されてきたが、そのデータ量は膨大なため、ビッグデータから必要な知識を取り出すことは難しかった

ビッグデータの可視化に成功、Webサービスも公開

同研究グループは、この約10万件の「ChIP-seqビッグデータ」を全て収集・計算。(国立遺伝学研究所のスーパーコンピューターシステムを利用)

ヒストンや転写因子がゲノムDNAのどこに結合しているのかの位置情報を、すべて可視化することに成功。また、実験に使用された試料に関する情報も整理した。

また、全てのデータに実験対象の細胞や転写因子の名前を明記し、2015年12月よりWebサービス『ChIP-Atlas』(https://chip-atlas.org)として公開。(その後、更新や改訂を重ね、今回正式な論文として報告)

国内外から約10万PVアクセス、約50報の論文に引用

「ChIP-seqデータ」は、誰でも使用することが可能。(高校で習う程度の転写因子やゲノムに関する基礎知識のみ)

地図帳をめくるような感覚で遺伝子にアクセスすることが可能で、そこに結合しているヒストンや転写因子の種類、細胞タイプなどを視覚的に理解できる。

この「ChIP-seqビッグデータ」には、世界中から毎月約1,500件もの報告があるが、これらのデータは毎月『ChIP-Atlas』にも追加されている。(利用者は常に最新データを閲覧可能)

毎月、国内外から約10万PVのアクセスがあり、これまで約50報の論文に引用されている。

遺伝子発現を制御するメカニズムに関する研究や薬の作用、がん、老化、生物進化などでの転写因子の研究に応用され、今後も幅広い生命科学研究への発展に寄与できるとしている。

ダイレクト・リプログラミング技術による組織再生への応用に期待

同研究グループは、同ビッグデータを使用し、どの転写因子が組織特異的に発現する複数の遺伝子を制御しているのかを解析。

転写因子(HNF4AやFOXA2など)が肝臓特異的遺伝子の多くに結合し、これらが肝臓で重要な複数の遺伝子の発現をまとめて制御する司令塔的役割を果たしていることを発見した。

さらに、血管内皮細胞特異的遺伝子(転写因子は、TAL1, FOS, JUNなど)、マクロファージ特異的遺伝子群(転写因子は、STAT1やSPI1など)でも高頻度に結合し、それぞれの細胞タイプの司令塔的な転写因子になっていることも示唆されている。

同ビッグデータが免疫細胞、肝臓、血管などを形成する『司令塔的な転写因子の予測』に応用可能であることを示したものといえる。

また、将来的にはダイレクト・リプログラミング技術による組織再生への応用も期待される

■メドフィットが納得の転職を実現します!
⇒臨床検査技師の求人一覧

関連コラム