寺尾知可史チームでは、臨床応用を目標に自己免疫性疾患、血液疾患、悪性腫瘍を代表に幅広い疾患や形質を対象として、遺伝統計学・ゲノム疫学・機械学習(主に深層学習)のアプローチを用いてゲノム解析を行っています。
定性的・定量的に決定されたDNA・RNA配列、SNP/SNVや構造多型を代表とした遺伝子多型、エピゲノムなどのゲノム情報とそれらの解析から得られる膨大かつ多層的な情報をゲノム以外の情報と統合し、疾病や形質のメカニズムの解明・マネジメントの改善・治療法の開発へとつなげ、患者さんや社会に還元することを目指します。
複雑形質(complex traits)は一つだけの原因ではなくさまざまな要因によって生じる疾患や状態などの形質のことで、ヒトの疾患や身長・体重・検査値・行動など多くの表現型が複雑形質にあたります。
特に膠原病や精神疾患、体を形作るさまざまな計測指標は一つの因子では説明できない複雑形質です。
これらの解析には、生まれながらの遺伝子配列の違いをこれら疾患の有無や計測指標に対応させるアプローチが非常に有効です。
疾患発症後の採血結果の値は疾患そのものによる影響を受けるために原因か結果かを判断することは難しいですが、生まれながらの配列の違いは一生涯変わることはない情報なので、疾患発症後の採血から得られた情報であっても、疾患の原因であるということができます。我々は、DNA解析のアプローチを用いて、さまざまな複雑形質の原因を同定してきました。
特に、高安動脈炎においてはIL12Bという遺伝子が主要な役割を果たし、その遺伝子がコードするタンパクが治療標的となることを世界で初めて示しました(寺尾 知可史ら 2013, 2015, 2017, 2019)。
体細胞変異(somatic mutations)は細胞分裂を経ることによって生じた後天的なDNAの変化です。細胞分裂に伴うDNAの変化を修復するメカニズムがさまざまに存在しますが、それらでも修復しきれない場合があります。それらが積み重なると細胞が癌の前段階になったり癌そのものになることがあります。
体細胞変異は癌が代表的ですが、近年、加齢に伴って癌でなくても血中に体細胞変異を持った細胞が増殖している状態(体細胞モザイク mosaic chromosomal alteration/clonal hematopoiesis)が見られることが分かってきました。
我々は、生まれつきのDNA配列の違いを同定するDNAマイクロアレイの情報を用いて後天的な体細胞モザイクを同定可能であることを示し、体細胞モザイクは加齢に伴いほぼ必発で、日本人特異的な体細胞モザイクが存在すること、この特異性が白血病の人種差を説明することを報告しました(寺尾 知可史ら Nature 2020)。
生まれながらのDNA配列の違いの一部が複雑形質の原因になりますが、そのメカニズムとしてDNAからRNAに転写される際の程度の違いが想定されています。
しかし、遺伝子転写は組織や細胞ごと、そして状態(刺激が入った状態やその刺激の種類、分化段階など)ごとに異なります。
よって、DNA配列の違いが効果を発揮する細胞や組織・状態を知ることは容易ではありません。そこで役立つのが機械学習です。
我々は、DNA配列を入力に、組織や細胞種特異的なDNA転写物の予測を可能にする機械学習法を開発しました(小井土 大ら Nature Biomedial Engineering 2022)。
さらに、本手法はタンパクをコードするRNAだけでなく、enhancerと呼ばれるRNAを代表とする非コードRNAの予測も可能であり、本手法を用いた複雑形質の原因多型の同定と重要な組織や細胞の同定が一気に進むことが期待されます。
バイオバンク・ジャパン(BBJ) の主に日本人を対象としたGWASのサマリーデータを公開しています。
FANTOMは、理化学研究所のマウスゲノム百科事典プロジェクトで収集された完全長cDNAのアノテーションを行うことを目的に、林崎良英博士が中心となり2000年に結成された国際研究コンソーシアムです。
バイオバンクとは、一般の方々や患者さんからご提供いただいたDNA、血清などを保管する倉庫とデータベースのことです。
理化学研究所 寺尾研究室のウェブサイトです。
理化学研究所 生命医科学研究センター(IMS)寺尾研究室のウェブサイトです。