sharpc (sharpc) wrote,
sharpc
sharpc

Categories:
  • Music:

Моя первая научная работа

Поздравляйте меня :) Хотя я в ней выступаю только в качестве соавтора и моя фамилия на последнем месте в списке, ценность чисто моих научных достижений сомнительна, однако, участие несомненно.

Вот ее название: Web-oriented system KeenBase for new drugs design. Авторы: Alexey V. Sulimov, Vladimir B. Sulimov, Alexey N. Romanov, Fedor V. Grigoriev, Olga A. Kondakova, Peter A. Bryzgalov, Denis A.Ostapenko. Учреждения: RCC MSU, CMC MSU, SKIF-GRID project. В данном случае слово drugs означает лекарства.



Вкратце расскажу, о чем работа (надеюсь, моих скромных познаний в химии для этого хватит). Вирусы, сильно надоедающие человеку, на самом деле представляют собой одну или несколько молекул белка (например, в вирусе гриппа 11 белков), «впрыскивающего» в клетку вирусную ДНК (или РНК). Та занимает место легальной ДНК (РНК), и клетка начинает плодить вирусов. Чтобы это безобразие прекратить, химики, биологи и программисты не спят ночами, придумывая новые лекарства. Лекарство — это некоторое относительно простое в синтезе вещество (лекарство против СПИДа со 150-ю асимметричными атомами углерода будет практически бесполезно), такое, что его молекула способна заблокировать некоторый механизм вируса. Белок не является однородной структурой, некоторые его участки влияют на его функциональность очень слабо, а в некоторых достаточно изменить один атом, чтобы почти все его важные свойства утратились. Так же, как на войне, взятие генерального штаба важнее уничтожения целой дивизии. И если подобрать молекулу (далее — лиганд), точно бьющую прямо по активному центру белка, нашествие внутри организма будет остановлено.

К примеру, белок интеграза, входящий в состав вируса СПИДа, имеет очень подвижный активный центр, и подобрать лиганд, который бы его заблокировал, очень сложно (но станет возможно!). Не всегда лиганд должен экранировать именно молекулу, входящую в состав вируса, иногда удобнее заблокировать фермент, участвующий в его размножении. Подобным методом можно бороться не только с вирусами, но и, например, с несворачиваемостью крови. Если заблокировать активный центр человческого белка тромбина, вырабатывающий вещества, препятствующие сворачиванию крови, можно успешно бороться с гемофилией. В списке кандидатов на отстрел присутствует такая давняя проблема медицины, как болезнь Альцгеймера.

[Два абзаца выше вызвали бурную дискуссию между знакомыми биохимиками и другими авторами работы, поэтому были немного переписаны заново :)]

Разумеется, даже двадцатиатомных молекул уже слишком много, чтобы речь шла о полном переборе. Поэтому перед перебором происходит отбор потенциальных кандидатов с использованием различных полуэмпирических формул, экспериментов над некоторыми рассматриваемыми веществами, оценка токсичности и фармакологического эффекта методами QSAR (они напоминают интерполяцию, только в качестве аргументов интерполируемой функции выступают молекулы, а вместо значений — интересующие свойства). Так можно определить достаточно большое количество лигандов (от 100 до 10000), у которых есть хороший шанс продаваться через некоторое время в красивых пластиковых баночках. А после этого этап приближений, угадываний и химической интуиции кончается, нужно начинать сурово считать.

Процесс отбора наилучших лигандов из «кандидатов» называется скрининг. Программе-режиссеру нужно проверить каждую молекулу-актера на роль супергероя, который уничтожит вирусов. Этот процесс состоит из двух частей. Сначала нужно посмотреть, как именно расположится лиганд возле активного центра белка (и сможет ли он вообще туда добраться). Этот этап называется докинг, от английского dock — причал. Затем нужно рассчитать, насколько хорошо засел там этот лиганд, то есть, насколько качественно он будет выполнять свою основную задачу, оборонять организм от злобного активного центра. Такие вычисления объединены под общим названием скоринг, от английского score — оценка. И вот, наконец, найдены 5-10 лучших молекул, и счастливые медики могут приступать к клиническим экспериментам над несчастными добровольцами.

Какую роль здесь играют компьютеры? Важнейшую! Уравнение Шредингера, называемое в релятивистском виде уравнением Дирака, которое описывает все, что происходит с электронами в атомах и молекулах, решено аналитически только в случае одного электрона. Как правило, в средней молекуле их несколько больше, к примеру, в совсем несложной молекуле аспирина (строго говоря, вещество называется «ацетилсалициловая кислота», а «аспирин» даже не тривиальное название, а торговая марка фирмы Байер) электронов 94 штуки. Даже если просто выписать для всех них волновое уравнение, оно получится настолько сложным, что посчитать что-то из него будет почти невозможно. Поэтому и применяют различные хитрые вычислительные методы, которые позволяют получить результат за обозримое количество времени, изрядно, хотя, жертвуя точностью. В случае, когда от результатов точного счета зависит жизнь людей (самолет-то и руками посадить можно!), рисковать нельзя. Поэтому в этой работе вычисления ведет мощный Linux-кластер, позволяющий получить ответ с большой точностью, порядка 1 ккал/моль (меньше десятой доли процента), что воистину удивительно, учитывая, какой сложной системой является даже молекула лиганда, не говоря уж о белках, насчитывающих миллионы и миллионы атомов. Планируется, что после завершения работы над системой, к вычислениям присоединятся сотни тысяч энтузиастов, которые будут помогать искать лекарства на своих домашних ПК (например, как в проекте FightAIDS@Home).

Однако самый могучий Linux-кластер не даст никакого толку, если используется несовершенное программное обеспечение, плохие вычислительные методы или просто код недостаточно оптимизирован. Здесь есть, где развернуться, в частности, в основной счетной программе SOL используются генетические алгоритмы. А теперь мы плавно подходим к тому, чем занимался я, и что упомянуто в названии работы.

Многие из тех, кто работал с unix-like системами, заметили, что их дружелюбный интерфейс весьма разборчив в друзьях, но ввиду их непревзойденной производительности и стабильности, а так же простоты кластеризации (в топ500 суперкомпьютеров серверов и кластеров на основе unix-систем больше 450 из 500), лучшей системы для крупных вычислительных систем просто не существует. Так что же, отрывать специалиста-биолога (или химика) от любимых мышей (пробирок) и заставлять учить команды Linux, разбираться в и без того непростом интерфейсе вычислительной программы (а те, кто работал, например, с Gamess, прекрасно знают, насколько вредным он может быть)? Это, конечно, спасет тысячи мышиных жизней и сотни пробирок, но не приблизит срок появления нового лекарства. Поэтому большому количеству различных специализированных программ, десяткам файлов различного формата, пачкам хитрых скриптов, которые всю эту систему обслуживают, просто позарез нужен простой и понятный web-интерфейс. Пожалуй, не будет преувеличением, что столько PHP и столько AJAX мне не приходилось использовать больше нигде... Но процесс близок к своему логическому завершению (система работает уже сейчас) и это не может не радовать всех любителей фармакологии!

А вот наш стенд:



А вот моя фамилия на нем:



Tags: наука, программирование, работа, фото, химия
Subscribe

  • ML quiz

    Устный вопрос. clf = sklearn.ensemble.AdaBoostClassifier( base_estimator=sklearn.tree.DecisionTreeClassifier(), n_estimators= 50, learning_rate=…

  • Часы и комбинаторика

    Мои электронные часы показывают часы, минуты, секунды в 24-часовом формате, а также день и месяц. Час, день и месяц они показывают без ведущих нулей.…

  • Задача про колокола

    Часто встречаются задачи, в которых нужно найти закономерность, продолжить какой-нибудь ряд. Не буду отставать. Продолжите строку на этом или другом…

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 3 comments