大規模言語モデルを活用した病的スプライシング変異データベースの自律的構築
| 体系的番号 |
JPMJND2501 |
研究代表者 |
白石 友一 国立がん研究センター, 研究所, 分野長
|
| 研究期間 (年度) |
2025 – 2027
|
| 概要 | 公共トランスクリプトームデータからスプライスサイト生成変異(SSCV)を同定・収載した「SSCV DB」を発展させ、大規模言語モデルを用いて病的可能性を予測し、疾患との関連性情報を提供する。また、新たに公開されたトランスクリプトームデータから自動的にSSCVを検出し、データベースを自動更新するパイプラインを開発する。遺伝性疾患やがん発生の原因ともなるSSCVの同定は、従来のゲノム解析では難しく見落とされがちだったが、本データベースによりSSCVと疾患との関連性を明らかにすることで、SSCVの検出による疾患診断法やSSCVを標的とする核酸医薬の研究開発などへの寄与を目指す。
|
| 研究領域 | 統合推進プログラム(育成型) |