真核生物の遺伝子発現は,さまざまな刺激や環境変化によってダイナミックに変化する.このような発現調節を司るのがゲノムDNAに結合するさまざま転写因子やヒストンであり,これらの結合パターンや分布を知ることが,発現制御のしくみを解明するための重要な鍵となる.従来は,ある転写因子やヒストンが結合するかどうかを個々の遺伝子について逐一調べなければならなかったが,約10年前に登場したChIP-seq法により,それを一挙にゲノムワイドレベルで解析できるようになった1).以降,世界中でこの実験が行われるようになり,これまでに約10万件もの実験結果が論文などで報告されている.それらのほとんど全てがNCBI,DDBJ,またはENAが運営するレポジトリにデータが寄託されており,これらは公共データとして原則上だれでも自由にダウンロードして利活用してよい.しかし,そこから入手できるのはシーケンサーが読み取った「配列生データのみ」である.それらを可視化して理解するためには参照ゲノムへのアライメントやピークコールが必要で,それらをコマンドラインで実行しなければならない.また,それらをふつうのパソコンで全て解析するには数年を要するほどの膨大なデータ量である.そこで筆者らはこれらをスパコンによる並列計算で一挙にデータ解析し,その結果をすべて公開するためのウェブサービス,ChIP-Atlasを開発した2).本稿ではその使い方について解説することで既報のChIP-seqデータをフル活用し,読者のみなさまの研究にどう役立てられるかについてご提案したい.本稿は「EMBO Reports」誌19号2)に発表した内容をまとめたものである.
「KEY WORDS」転写因子,遺伝子発現制御,noncoding 領域