Революционная ИИ-модель Evo-2: Новый прорыв в расшифровке и синтезе ДНК

· 1 минут чтения

article picture

Исследователи из Института Arc и Стэнфордского университета совместно с компанией NVIDIA представили революционную модель искусственного интеллекта Evo-2 для работы с биологическими данными. Новая система была обучена на 128 000 геномах различных организмов - от людей до одноклеточных бактерий.

Главное достижение Evo-2 заключается в способности создавать целые хромосомы и небольшие геномы с нуля, а также анализировать существующие последовательности ДНК, включая сложные для интерпретации некодирующие участки, связанные с различными заболеваниями.

Модель доступна учёным через веб-интерфейс, также разработчики открыли исходный код и данные для её воспроизведения. По словам создателей, Evo-2 задумана как платформа, которую другие исследователи смогут адаптировать под свои задачи.

В отличие от предыдущих моделей, работавших только с белковыми последовательностями, Evo-2 обучалась на полных геномных данных, содержащих как кодирующие участки ДНК (отвечающие за синтез белков), так и некодирующие регуляторные области. Общий объем обучающих данных составил 9,3 триллиона нуклеотидов.

Особое внимание разработчики уделили работе со сложными геномами эукариот (организмов с ядром в клетках). Модель способна анализировать взаимосвязи между участками ДНК, удаленными друг от друга на расстояние до 1 миллиона пар оснований.

При тестировании Evo-2 успешно предсказала эффекты известных мутаций в гене BRCA1, связанном с раком молочной железы. Результаты оказались сопоставимы с лучшими существующими моделями для анализа кодирующих участков. В будущем система может помочь в выявлении опасных мутаций в геномах пациентов.

Хотя научное сообщество положительно оценивает потенциал новой разработки, эксперты отмечают необходимость независимой проверки заявленных возможностей модели.