DNA学習AI「Evo」が未知のタンパク質生成、創薬に新展開

従来の限界と新アプローチ

アミノ酸でなくDNA全体を学習
スタンフォード大が「Evo」を開発

バクテリアゲノムの活用

バクテリアの遺伝子集約性を利用
機能単位での代謝制御を模倣

生成AI「Evo」の仕組み

LLMと同様の次文字予測で訓練
プロンプトから新規配列を生成
自然界にない未知のタンパク質創出
@takatoh_lifeのXポスト: ゲノム言語モデルEvo1.5の論文がNatureに掲載🧬 微生物ゲノムモデルEvo1を拡張し、遺伝子配置の文脈から、機能は似ているが新規配列の遺伝子を生成。 この研究のから真核生物も含むゲノム言語モデルEvo2が開発され、ファージ全ゲノム生成の研究へと現在では展開されています…
詳細を読む

スタンフォード大学の研究チームは、バクテリアのゲノム全体を学習させたAIモデル「Evo」を開発しました。従来のタンパク質構造解析とは異なり、DNA配列そのものを学習させることで、自然界には存在しない未知のタンパク質生成に成功しています。

従来のAI創薬は、主にアミノ酸配列や立体構造に焦点を当ててきました。しかし、生物学的進化の源泉はDNAにあります。DNAに含まれる非コード領域や複雑な情報をAIが理解できるかは不明でしたが、今回の研究でその有効性が実証されました。

研究チームは、バクテリアの遺伝子が機能ごとに近接している特性に着目しました。「Evo」は大規模言語モデル(LLM)の仕組みを応用し、膨大なゲノムデータからDNAの言語を習得。プロンプト指示により、機能的な新規配列を出力可能です。

この技術は、特定の機能を持つ酵素やバイオ燃料、新薬候補の設計を劇的に加速させる可能性があります。DNAレベルでの生成が可能になったことで、バイオテクノロジーとAIの融合は、新たなフェーズへと突入したと言えるでしょう。