banner
Дом / Блог / ИИ проливает новый свет на «кодекс жизни»
Блог

ИИ проливает новый свет на «кодекс жизни»

Oct 14, 2023Oct 14, 2023

В то время как ChatGPT, Bard и другие инструменты искусственного интеллекта заставляют авторов, учителей и поклонников франшизы «Терминатор» спать по ночам, беспокоясь о различных апокалиптических сценариях, другое использование ИИ предлагает более обнадеживающие результаты.

Исследователи из Колледжа литературы, искусств и наук Университета Южной Калифорнии Дорнсайф используют искусственный интеллект и другие вычислительные методы, чтобы по-новому определить взгляд ученых на ДНК и дать более ясный и всеобъемлющий взгляд на «код жизни».

Эти знания обещают преобразовать научные области, начиная от исследований рака и заканчивая разработкой лекарств и устойчивым развитием.

Проще говоря, генетический код состоит из четырех букв — A, C, G и T. Буквы представляют собой нуклеотиды аденин, цитозин, гуанин и тимин, входящие в состав двойной спирали ДНК. Эти четыре нуклеотидные буквы обозначают генетический код всех живых существ.

Хотя эта простая версия кода десятилетиями выполняла свою полезную работу, она еще не полностью раскрывает сложность ДНК.

«Мы хотели найти новый способ кодирования ДНК, выходящий за рамки линейного буквенного кода», — сказал Ремо Рохс, заведующий кафедрой количественной и вычислительной биологии в USC Dornsife. Ранее в этом году в журнале Proceedings of the National Academy of Sciences он и его коллеги опубликовали важное исследование, в котором использовались крупномасштабные экспериментальные данные. Они также опубликовали аналогичные экспериментальные данные для семейства белков, связанных с раком, называемых факторами транскрипции forkhead box, в журнале Nucleic Acids Research на прошлой неделе.

Эти и другие достижения в области исследований ставят факультет в число тех, кто находится в авангарде новой инициативы USC Frontiers of Computing, целью которой является стимулирование исследований и инноваций в области передовых вычислительных технологий, таких как искусственный интеллект и машинное обучение, наука о данных, блокчейн и квантовая информация.

Рохс, профессор количественной и вычислительной биологии, химии, физики, астрономии и информатики, и его команда стремятся разработать более реалистичное и целостное определение генетического кода, которое включает «все структурные вариации и химические модификации, о которых мы знаем сейчас или это может быть обнаружено в будущем", - сказал он.

Эти химические модификации и структурные вариации, о которых упоминает Рохс, варьируются от небольших изменений в четырех нуклеотидах до серьезных изменений, которые влияют на то, как ДНК скручивается вокруг себя и других молекул, таких как белки.

Эти изменения могут влиять на то, какие гены активны, а какие находятся в состоянии покоя, позволяя или блокируя взаимодействие белков с ДНК или считывание кода.

Подход Роса заменяет простую четырехбуквенную последовательность на последовательность, включающую физико-химические группы в больших и малых бороздках двойной спирали ДНК.

Так что это значит?

Двойная спираль ДНК образует скрученную лестницу. Благодаря повороту лестницы она имеет более широкую главную канавку и более узкую второстепенную канавку. В зависимости от размера и формы клеточным молекулам может быть легче взаимодействовать с ДНК через одну бороздку, а не через другую.

«Физико-химические» относятся как к физическим, так и к химическим свойствам. Метод Роса учитывает различные выступы и выступы нуклеотидов и других компонентов ДНК, а также их физическую доступность внутри двух бороздок. Он также учитывает, как компоненты ДНК могут химически реагировать с белками. В совокупности это дает более четкое представление о том, как клеточный механизм взаимодействует с генетическим кодом и интерпретирует его.

Например, белок обычно может связываться с участком ДНК, кодируемым как AGTCATGGA, но если этот участок спрятан в малой бороздке, белок не сможет подобраться достаточно близко для связывания. Или, если белок и кодируемая часть имеют сильное химическое притяжение, даже если кодированная часть плотно прилегает друг к другу, белок все равно может взаимодействовать, но в меньшей степени.

Именно здесь команда Роса представляет искусственный интеллект, который изучает предпочтение ДНК-связывающего белка к определенным химическим группам в определенных физических местах в каждой бороздке ДНК.