Специалисти на Nvidia, заедно с изследователи от нестопанския биомедицински институт Arc Institute (Пало Алто, САЩ), представиха усъвършенстван модел на изкуствен интелект Evo 2, който е способен не само да идентифицира генетични мутации, свързани със заболявания, но и да създава нови геноми.
Evo 2 е базов модел на изкуствен интелект, предназначен да получи по-задълбочено разбиране на биологичния код. Той е обучен върху генетични данни от повече от 100 000 вида, включително бактерии, археи, вируси, растения, животни и хора. Общо моделът е обработил над 9,3 трилиона нуклеотида от над 128 000 пълни генома и метагеномни данни.
Evo 2 е наследник на модела Evo 1, който се фокусира върху геноми на единични клетки. Новата версия значително разширява обема на данните за обучение, обхващайки цялото дърво на живота – от едноклетъчни до многоклетъчни организми.
Моделът е обучен на платформата NVIDIA DGX Cloud AI чрез AWS, използвайки повече от 2000 графични процесора NVIDIA H100, с участието на инженери на Nvidia и учени от водещи американски университети, включително Станфорд, Бъркли и Сан Франциско.
Според Патрик Сю, съосновател на Института Arc и професор по биоинженерство в Калифорнийския университет в Бъркли, Evo 2 позволява на „машините да четат, пишат и мислят на езика на ДНК “. Учените твърдят, че моделът е способен ефективно да предсказва патогенни мутации и може да се използва и за създаване на изкуствени форми на живот.
Кодът на Evo 2 вече е с отворен код в GitHub на Arc Institute и е интегриран в рамката BioNeMo на Nvidia. Изследователите подчертават, че Evo 2 е най-големият и най-напълно отворен модел с изкуствен интелект в своя клас.
Една от най-впечатляващите демонстрации на възможностите на Evo 2 е неговата точност от над 90% при откриване на доброкачествени и вредни мутации в гена BRCA1, свързани с рак на гърдата. Това отваря пътя към по-евтини и по-бързи генетични изследвания, както и към създаването на нови методи за лечение.