Biomedical Chemistry: Research and Methods 2018, 1(3), e00073
К 40-летию Института физиологически активных веществ РАН

Программа HYBOT 3D MF и её использование в CoMFA

В.С. Скворцов1,2*,А.В. Микурова1,2, О.А. Раевский1

1Институт физиологически активных веществ Российской академии наук 142432 Черноголовка Московской обл., Северный проезд, 1; *e-mail: vladlen@ibmh.msk.su
2Научно-исследовательский институт биомедицинской химии имени В. Н. Ореховича, 119121, Москва, Погодинская ул. 10

Ключевые слова: QSAR; CoMFA; HYBOT; молекулярные поля

DOI: 10.18097/BMCRM00073

ВВЕДЕНИЕ

Использование различных подходов в области QSAR стало неотъемлемой частью современной вычислительной медицинской химии. Среди них особенно интенсивно развивается группа так называемых 3D методов, когда корреляции с активностями (свойствами) строят на основе определенных характеристик химических соединений, распределённых в пространстве. К таким характеристикам можно отнести различные молекулярные поля, такие как электростатическое и стерическое, используемые в одном из самых первых методов 3D QSAR - методе сравнительного анализа молекулярных полей (Comparative Molecular Field Analysis, CoMFA) [1], имеющем 30-летнюю историю. В данном методе для каждой молекулы согласно общепринятой методике (рис. 1) описывается дискретное молекулярное поле с установленными значениями в узлах трёхмерной решётки, которая описывает либо всё пространство вокруг выровненного набора молекул, либо его отдельную часть. В качестве дескрипторов используются суммы значений для выделенных групп узлов (компонент). Метод CoMFA широко используется и развивается и поныне [2]. На базе аналогичных полей построена также программа GRID (Graphic Retrieval and Information Display) [3,4], в которой есть отличия в определении стерических полей и включены потенциалы водородной связи и гидрофобный потенциал. Потенциалы водородной связи впоследствии появились и в CoMFA, а гидрофобный потенциал можно было добавить как внешнее поле. Метод сравнительного анализа индексов молекулярного подобия (Comparative Molecular Similarity Indices Analysis, CoMSIA) [5,6] представляет собой дальнейшее развитие CoMFA. В данном методе изменена методология расчёта молекулярного поля, когда в узлах решётки рассчитывают индексы молекулярного подобия, и в стандартной версии [SYBYL] имеется возможность использовать электростатические, стерические, гидрофобные поля, а также поля водородных связей. Потенциалы в CoMSIA более плавные. Для поиска корреляций и в CoMFA, и в CoMSIA используется один и тот же стандартный метод статистического анализа PLS (Partial Least Squares или метод частичных наименьших квадратов).

Рисунок 1. Пример формирования стерического поля для CoMFA и определение переменных (компонент).

Следует отметить, что наряду с методами описания молекул как набора дискретных дескрипторов, существуют и альтернативные способы, использующие наборы непрерывных гладких функций от пространственных координат и методы машинного обучения с использованием статистических ядер (kernels) [7], но рассматриваемые в работе молекулярные поля были адаптированы и испытаны только для дискретных подходов.

В программе GRID для описания водородного связывания используется потенциал «6-8» [8], где изменения энергии при образовании водородной связи описываются следующим набором уравнений:

$$\triangle E=\triangle E_rf\left(p\right)f\left(t\right) $$
(1),
$$E_r={{C}\over {r^8}}-{{D}\over {r^8}}$$
(2),
$$C=-3E_mr^8_m $$
(3),
$$D=-4E_mr^6_m $$
(4),

где Em - оптимальная свободная энергия (ккал/моль), r - расстояние между донором и акцептором водорода (rm – оптимальное, Å).

$$f\left(t\right)={cos}^2\left(t\right) $$
(5),

где t – угол между линиями водород/донор и акцептор/донор (°).

$$f\left(p\right)={cos}^2\left(p\right) $$
(6),

где p – угол между линиями неподелённая пара/акцептор и акцептор/донор (°).

При этом устанавливался ограниченный набор пар атомов донор/акцептор для которых были определены оптимальные значения свободной энергии водородной связи и оптимальные расстояния.

В работе [9] нами была предложена модификация потенциала «6-8», основанная на факторах водородной связи, рассчитанных программой HYBOT [10]. При этом значения оптимальной свободной энергии водородной связи и оптимального расстояния зависели от произведения акцепторного (Ea) и донорного (Ed) факторов водородного связывания:

$$E_m=1.33E_aE_d $$
(7),
$$r_m=k_7{log ({{k_4-E_m}\over {E_m}})\ }+k_8 $$
(8).

Коэффициенты k4, k7 и k8 были подобраны для каждой пары донор/акцептор сгруппированных по типу химических элементов. Например,    k4 = −15,    k7 = 0.58,    k8 = 2.43 для варианта ‘OH...O’; k4 = −12, k7 = 0.69, k8 = 2.73 для ‘OH...N’; k4 = −10, k7 = 0.94, k8 = 2.80 для ‘NH...N’ и т.д.

Используя предложенную модификацию потенциала водородного связывания и молекулу воды в качестве «идеального» зонда можно рассчитать 2 типа молекулярных полей, описывающих акцепторную и донорную способности молекулы соответственно, и использовать эти поля в CoMFA. Соответствующее программное обеспечение, названное «HYBOT 3D MF» было создано и доступно по адресу http://www.ibmc.msk.ru/HYBOT3D.

ВОЗМОЖНОСТИ ПРОГРАММЫ «HYBOT 3D MF»

Программа «HYBOT 3D MF» написана на языке C++ в виде приложения, исполняемого из командной строки. Тестовая версия не имеет ограничений и доступна для операционной системы Windows 7 и старше. Для интеграции с модулем «QSAR and Advanced CoMFA» пакета SYBYL-Х [11] имеется набор макросов, написанных на SPL (SYBYL Programming Language). Макросы работоспособны и в более старых версиях программы SYBYL. После инсталляции модуля «HYBOT 3D MF» в SYBYL-Х в списке добавления «Computed column» для таблиц появляется опция «HYBOT 3D MF», загружающая окно с параметрами для расчёта молекулярного поля (рис. 2).

Рисунок 2. Внешний вид окна, вызываемого при добавлении к таблице SYBYL-Х молекулярного поля, описывающего донорную или акцепторную способность молекулы.

Пользователь может выбрать тип поля. Если в качестве пробы используется молекула воды как донор водородного связывания, то поле описывает акцепторную способность молекулы, если же проба трактуется как акцептор водородного связывания – то донорную способность. В качестве параметров поля можно задать варианты расчётов факторов водородного связывания:

  1. с использованием корректирующих молекулярных фрагментов или без них (только по подобию с молекулами в базе данных);
  2. рассчитывать ли факторы для слабых –СH доноров (например, в ароматических системах);
  3. определить список атомов - акцепторов водородных связей. CLASSIC – N, O; EXTENDED – N, O, S; FULL - N, O, S, галогены;
  4. 4. использовать ли «деформированное» поле, когда в качестве значения в узле решётки берётся не вычисленное в данной точки значение потенциала водородной связи, а минимальное значение, вычисленное в некоторой окрестности (бокс или сфера) на расстоянии в половину шага решетки.

Пользователь может установить уровень, ниже которого значение потенциала водородного связывания обнуляется. Данный уровень устанавливается либо в абсолютных значениях в ккал/моль, либо в процентах от максимально возможного. Также пользователь должен определить регион, для которого рассчитывается поле. Автоматически поле рассчитывается для бокса, включающего все молекулы таблицы плюс 4Å по каждой из координат в обоих направлениях. Можно также подгрузить уже имеющийся файл SYBYL, описывающий нужный регион.

Помимо описанного способа настройку расчёта поля можно скорректировать через специфический набор переменных TAILOR. Вдобавок к уже описанным опциям имеется возможность определить шаг решётки по умолчанию, а также изменить штрафы, налагаемые за отклонение от идеальных углов (формулы 5 и 6). В стандартном варианте программы GRID эти штрафы пропорциональны квадрату косинуса угла (cos2). В нашей программе допускаются также cos и cos4.

После того как колонка с соответствующим полем загружена в таблицу, дальнейший анализ проводится по стандартной для CoMFA процедуре. При загрузке полей имеются некоторые ограничения., а именно: при изменении молекул в ассоциированной с таблицей базе данных автоматический перерасчёт полей HYBOT 3D MF не производится, т.е. процедуру следует запускать по новой. Если ячейка не заполняется, то это может быть связано с тем, что в молекуле имеются незаполненные валентности, либо программа не может привести структуру к стандартному описанию. Последнее можно проверить, записав проблемную молекулу в формате MACCS, отключив возможность записи ароматических связей (тип AR). Если молекула не будет преобразована правильно, то, вероятнее всего, поле HYBOT 3D MF также не будет вычислено. Данный вариант был выбран для того, чтобы избежать ложных результатов.

ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ ПРОГРАММЫ «HYBOT 3D MF»

Следует отметить, что для того чтобы акцепторные и донорные поля помогли улучшить предсказательную силу QSAR моделей, в наборе молекул не только должны присутствовать потенциальные доноры и/или акцепторы водородного связывания, но и данные группы должны иметь при себе различные химические заместители. Если в группе молекул существует область, в которой у части из них имеется группировка С=O, но при этом в ближайшем окружении данной группы нет других различий (т.е. акцепторная способность не изменяется от молекулы к молекуле), то выигрыша по сравнению с использованием стандартных донорно-акцепторных полей, вероятнее всего, не будет.

Закрыть окно
Таблица 1. Статистические параметры CoMFA моделей для различных комбинаций переменных (стандартный пример SYBYL, таблица JACS,
21 стероид).

В таблице 1 приведен пример использования поля HYBOT 3D MF на выборке из 21 стероида с известной аффинностью к тестостерон связывающему глобулину (стандартный пример SYBYL [1]). Модель 9, использующая оба варианта полей HYBOT 3D MF, демонстрирует наилучшие показатели. Другой пример (табл. 2) – предсказание ингибиторной активности флавоноидов для альдозоредуктазы (EC 1.1.1.21) [12]. Отличительной особенностью данного исследования является то, что были использованы как CoMFA поля, так и CoMSIA. Поскольку эти два метода различаются только на стадии вычисления молекулярного поля, то использование их комбинации в одной модели вполне оправдано. В данном случае явного преимущества полей HYBOT 3D MF при обучении не наблюдается, но имеется выигрыш в предсказательной силе моделей, демонстрируемой на тестовой выборке. Кроме того, при обучении модели без использования полей HYBOT 3D MF дают наилучшие результаты при большем значении параметра «число компонент модели», что может быть причиной переобучения модели.

Закрыть окно
Таблица 2. Набор моделей, использующих CoMFA и CoMSIA для предсказания ингибиторной активности флаваноидов для альдозоредуктазы (EC 1.1.1.21) [12].

ЗАКЛЮЧЕНИЕ

Подводя итог можно отметить, что для ряда наборов химических соединений, имеющих выраженные различия в части групп с потенциальной возможностью образовывать водородные связи, использование полей HYBOT 3D MF позволяет улучшить предсказательную силу моделей. Несмотря на то, что программа «HYBOT 3D MF» тестировалась, в первую очередь, в составе комплекса SYBYL, её можно применять и в других программах QSAR, использующих для анализа различные молекулярные поля, т.к. по сути это приложение, выполняемое из командной строки, особенности вызова которого описаны в руководстве пользователя. Полноценная версия программы «HYBOT 3D MF» для ОС WINDOWS доступна по адресу http://www.ibmc.msk.ru/HYBOT3D.

БЛАГОДАРНОСТИ

Работа выполнена в рамках государственного задания на 2018 год (тема № 0090-2017-0020).

ЛИТЕРАТУРА

  1. Cramer, R. D., Patterson, D. E., & Bunce, J. D. (1988). Comparative molecular field analysis (CoMFA). 1. Effect of shape on binding of steroids to carrier proteins. Journal of the American Chemical Society, 110(18), 5959-5967. DOI
  2. Ansari, S.M. and David S. Palmer, D.S. (2018). Comparative Molecular Field Analysis Using Molecular Integral Equation Theory. Journal of Chemical Information and Modeling 2018 58 (6), 1253-1265. DOI
  3. Goodford, P. J. (1985). A computational procedure for determining energetically favorable binding sites on biologically important macromolecules. Journal of medicinal chemistry, 28(7), 849-857. DOI
  4. Cruciani, G., & Watson, K. A. (1994). Comparative molecular field analysis using GRID force-field and GOLPE variable selection methods in a study of inhibitors of glycogen phosphorylase b. Journal of medicinal chemistry, 37(16), 2589-2601. DOI
  5. Klebe, G., Abraham, U., & Mietzner, T. (1994). Molecular similarity indices in a comparative analysis (CoMSIA) of drug molecules to correlate and predict their biological activity. Journal of medicinal chemistry, 37(24), 4130-4146. DOI
  6. Klebe, G., & Abraham, U. (1999). Comparative molecular similarity index analysis (CoMSIA) to study hydrogen-bonding properties and to score combinatorial libraries. Journal of computer-aided molecular design, 13(1), 1-10. DOI
  7. Zhokhova, N. I., Baskin, I. I., Bakhronov, D. K., Palyulin, V. A., & Zefirov, N. S. (2009, November). Method of continuous molecular fields in the search for quantitative structure-activity relationships. In Doklady Chemistry (Vol. 429, No. 1, p. 273). SP MAIK Nauka/Interperiodica.
  8. Boobbyer, D. N., Goodford, P. J., McWhinnie, P. M., & Wade, R. C. (1989). New hydrogen-bond potentials for use in determining energetically favorable binding sites on molecules of known structure. Journal of medicinal chemistry, 32(5), 1083-1094. DOI
  9. Raevsky, O. A., & Skvortsov, V. S. (2002). 3D hydrogen bond thermodynamics (HYBOT) potentials in molecular modelling. Journal of computer-aided molecular design, 16(1), 1-10. DOI
  10. Raevsky, O.A., Grigor’ev, V.Ju., Trepalin, S.V., HYBOT program package, Registration by Russian State Patent Agency No. 990090 of 26.02.99.
  11. SYBYL-X 2.1. Certara, Princeton, NJ, USA
  12. Caballero, J. (2010). 3D-QSAR (CoMFA and CoMSIA) and pharmacophore (GALAHAD) studies on the differential inhibition of aldose reductase by flavonoid compounds. Journal of Molecular Graphics and Modelling, 29(3), 363-371. DOI