機械学習によるゲノム解析で日本人の多様性が明らかに 阪大など

2020年3月31日 08:12

印刷

今回の研究の概要。研究では、日本人集団17万人のゲノムデータに機械学習・次元削減手法を適用した。(画像: 日本医療研究開発機構の発表資料より)

今回の研究の概要。研究では、日本人集団17万人のゲノムデータに機械学習・次元削減手法を適用した。(画像: 日本医療研究開発機構の発表資料より)[写真拡大]

  • 2つのグループによる身長・BMIのPRSと検査値自体の分布と、過去50年間の身長・BMIの平均値の時系列変化。

 機械学習をはじめとする人工知能(AI)の登場により、これまで扱えなかったビッグデータの分析が可能となっている。日本医療研究開発機構は26日、地域ごとのゲノムの多様性を機械学習によって可視化することに成功したと発表。日本人の祖先が2つの地域から流入したことだけでなく、各地域での多様性も判明した。

【こちらも】ゲノム情報の「見える化」、AIが効率的に解析 理研などが新手法開発

■環境への適用で多様化した人類

 人類の共通祖先はアフリカで誕生し、ヨーロッパ、中東、アジアなど多方面に移動することで拡散していった。このような移動の過程で個体は各環境に適応し、多様性を生み出していった。寒冷地に住む個体は脂肪を蓄え、高地に住む個体は酸素を効率的に吸収できるよう、ゲノム配列に多様性が反映されている。

 主成分分析と呼ばれる統計的手法により、ゲノム情報から人種が特定できるようになった。しかし国などの集団内で、地域ごとにゲノムの多様性が存在するかまでは明らかでなかった。遺伝子の配列パターンが数千カ所にも及ぶことが原因だという。

■2つの祖先をもつ日本人集団

 大阪大学、東京大学などの研究者から構成されるグループは、日本の各地域から集めた約17万人のゲノム情報を機械学習することで、地域の多様性を「見える化」する方法を開発した。これにより、本州と琉球を中心とする2つのグループに日本人集団が大別できることが判明した。

 数万年前に東南アジアから移住した集団と、数千年前に朝鮮半島から移住した集団が多様性を生み出した可能性があると、研究グループは推測する。また琉球を中心とするグループに対し本手法を再度適用したところ、さらに詳細な分類が可能だと判明した。

 身長やBMI等の身体的特徴の違いも地域ごとで明らかになった。琉球を中心とするグループのほうが身長の予測値が小さかった一方で、BMIが大きいことが判明した。沖縄を中心とした地域での食生活の欧米化による急速な肥満が原因だと考えられる。

 今後、遺伝子にもとづく個別化医療の実現に本研究が重要な示唆を与えるだろうと、研究グループは期待を寄せている。

 研究の詳細は、オンライン学術誌Nature Communicationsにて26日に掲載されている。(記事:角野未智・記事一覧を見る

関連キーワード

関連記事