К 40-летию Института физиологически активных веществ РАН
QSAR моделирование острой нейротоксичности ряда органических растворителей по отношению к грызунам
Институт физиологически активных веществ Российской академии наук
142432, Черноголовка, Московской обл., Северный проезд, 1; e-mail:
*beng@ipac.ac.ru
Ключевые слова: острая нейротоксичность; QSAR; HYBOT DOI: 10.18097/BMCRM00019 ВВЕДЕНИЕ Важным этапом при разработке новых физиологически активных веществ является оценка их токсичности и, в частности, нейротоксичности [1]. Исследованию данного явления уделяется определенное внимание, в том числе, с использованием такого междисциплинарного подхода, как анализ количественных взаимосвязей «структура – активность» (QSAR) [2-5]. В опубликованных источниках практически отсутствуют данные по острой нейротоксичности, которые по своему количественному и качественному составу соответствуют требованиям QSAR. Одним из немногих примеров является массив из 48 органических растворителей [6], на основе которого был создан ряд линейных регрессионных моделей [7,8]. Однако, этим разработкам присущи некоторые недостатки, связанные, главным образом, или с невысокими статистическими показателями качества полученных моделей, или с относительно большим числом неясно интерпретируемых параметров. Целью настоящей работы было конструирование линейных и нелинейных QSAR моделей нейротоксичности с удовлетворительными статистическими характеристиками на основе дескрипторов с ясным физико-химическим содержанием. МАТЕРИАЛЫ И МЕТОДЫ В литературе описаны различные нейротоксические эффекты и используемые для их изучения тесты, которые могут быть использованы для количественной оценки нейротоксичности соединений [9], включая величину ТД50 (доза, вызывающая нейротоксический эффект у 50% животных) по тесту вращающегося стержня в исследованиях на мышах при внутрибрюшинном введении вещества [1]. В настоящей работе использованы литературные данные [6,7] по острой сублетальной токсичности (EC30, мкМ/л, ингаляционно) 47 органических растворителей по отношению к мышам и крысам. Оценку токсичности (по данным вышеуказанных авторов) проводили на основе установленного ранее нейротоксического эффекта, который проявляется в появлении электрически вызываемых судорог у животных в условиях эксперимента. Для количественной оценки токсичности исследовали зависимости «концентрация – эффект» (скорость удлинения конечностей для мышей и продолжительность удлинения конечностей для крыс), на основе которых определяли величину EC30 (эффективная концентрация, оказывающая нейротоксическое действие у 30% животных). Для описания структуры соединений использованы 15 физико-химических дескрипторов, включая поляризуемость, парциальные атомные заряды, дескрипторы водородной связи, рассчитанные на основе программы HYBOT [10], липофильность [11] и дипольный момент [12]. Названия соединений, CAS номера, данные по нейротоксичности и физико-химические дескрипторы приведены в Приложении. При создании регрессионных моделей использовали следующие статистические методы: линейная регрессия (ЛР), случайный лес (СЛ), опорные вектора (ОВ), реализованные в соответствующих компьютерных программах: SVD [13], rrforest [14] и flssvm [15]. В качестве статистических характеристик моделей фигурировали: n – число молекул, m – число дескрипторов, r2 – квадрат коэффициента линейной корреляции, s – стандартное отклонение, q2 и scv – квадрат коэффициента линейной корреляции и стандартное отклонение в условиях перекрестного контроля по k-блокам (k=10, 100 итераций), соответственно. Для оценки погрешности коэффициентов модели ЛР использовали стандартные ошибки. Расчет регрессионных моделей выполняли путем перебора всех возможных комбинаций от 1 до 5 дескрипторов. Лучшие модели определяли по минимальной величине s. При близких значениях s предпочтение отдавалось моделям с меньшей величиной m. Для определения области применимости (ОП) моделей использовали простой подход, который заключался в определении интервалов изменения зависимых и независимых переменных. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ В таблице 1 представлены результаты расчетов регрессионных моделей нейротоксичности соединений по отношению к крысам. При исследовании всех 47 соединений лучшие результаты показала модель случайного леса № 2. Регрессионные зависимости, полученные на основе методов ЛР и ОВ (№ 1 и № 3 соответственно), имели более низкие величины r2 (q2) и более высокие значения s(scv). Дальнейшее улучшение качества моделей было достигнуто путем анализа Y-выбросов. При этом из обучающей выборки удалялись соединения, у которых абсолютная разность между экспериментальными и рассчитанными величинами превышала 2s. Полученные модели (№ 4 ÷ № 6) закономерно имели более высокие статистические характеристики. С помощью метода СЛ были сконструированы модели с наиболее высокими показателями описательной статистики (r2 = 0.851; s = 0.19). Однако (что более важно) при этом была получена более плохая предсказательная статистика по сравнению с ЛР (q2 = 0.662 / 0.777 и scv = 0.28 / 0.26 соответственно). Анализируя состав дескрипторов, на основе которых получены регрессионные зависимости, можно отметить следующее. Всего для конструирования использовали 7 молекулярных дескрипторов. При этом дескриптор ∑(Ca), характеризующий Н-акцепторную способность молекул, встречался во всех моделях. Вторым по частоте использования являлся дипольный момент μ. Остальные молекулярные характеристики встречались реже.
Относительно Y-выбросов можно констатировать, что н-пентан фигурировал в таком качестве во всех моделях. Это свидетельствует о систематическом характере наблюдаемого явления, связанного, например, с несоответствием данного соединения области применимости моделей (учитывая, что н-пентан имеет минимальную токсичность log(1/EC30) = -2.94 и минимальную величину ∑(Ca) = 0.00 среди исследованных 47 соединений). Таким образом, в качестве наилучшей была выбрана модель № 4, которая в явном виде выглядит следующим образом:
Разработанное регрессионное уравнение вполне соответствует требованиям, которые предъявляются в настоящее время к количественным моделям «структура–активность» [16,17]: r2 > 0.6 и q2 > 0.5. Входящие в состав уравнения (1) дескрипторы имеют четкий физико-химический смысл. Они отражают способность исследованных соединений к межмолекулярному взаимодействию, которое лежит в основе проявления нейротоксичности. При этом увеличению нейротоксичности способствует рост поляризуемости, Н-акцепторной способности и дипольного момента молекул. И, наоборот, токсичность соединений падает с ростом суммы положительных атомных зарядов. Как отмечалось выше, для исследуемого ряда органических соединений ранее уже был получен ряд линейных регрессионных уравнений. Так, в работе [7] была разработана модель на основе трех дескрипторов: температуры кипения, молекулярной связности нулевого и второго порядка. Однако, при этом были получены достаточно низкие статистические характеристики качества модели (n = 44; r2 = 0.503; s = 0.388). Улучшение статистики (r2 = 0.667; s = 0.280) было достигнуто, в основном, путем значительного уменьшения числа анализируемых соединений (n = 37). Гораздо лучшие показатели (n = 45; r2 = 0.814; s= 0.252; q2 = 0.814; scv = 0.273) были достигнуты на основе уравнения с использованием шести дескрипторов, включая различные спектральные моменты, температуру кипения и число водородных связей [8]. С помощью уравнения (1) удалось получить аналогичные статистические характеристики, которые, однако, были достигнуты с использованием меньшего числа независимых переменных (4 против 6). Представленные в таблице 2 результаты расчетов нейротоксичности исследованных соединений по отношению к мышам свидетельствуют о том, что метод случайного леса оказался лучшим по сравнению с методами линейной регрессии и опорных векторов в случае полного набора из 47 соединений. Однако после проведения анализа данных на Y-выбросы выявилась конкуренция между СЛ и ЛР. При этом было установлено преимущество по предсказательной способности (при одинаковых величинах scv) модели № 10 (q2 = 0.670) по сравнению с моделью № 11 (q2 = 0.633). В состав полученных моделей входит от двух до четырех дескрипторов. Единственным дескриптором, который фигурировал во всех моделях, была сумма свободноэнергетических протоноакцепторных дескрипторов ∑(Ca). Что касается Y-выбросов, то необходимо отметить, что соединение 23 (тетрагидрофуран) встречалось во всех моделях (10) ÷ (12). При этом нейротоксичность этого соединения (log(1/EC30) = -1.08) была близка к максимальному значению в исследуемом ряду (log(1/EC30) = -0.82; 1,1,2-трихлорэтан). В качестве гипотезы для объяснения этого Y-выброса можно предположить существование отклонения анализируемого соединения от ОП моделей.
С учётом предсказательной статистики, в качестве лучшей нами была выбрана модель № 10:
Полученная модель по своему качественному и количественному составу мало отличается от уравнения (1). Поэтому она обладает всеми теми достоинствами, которые были отмечены ранее: высокими статистическими характеристиками и относительно небольшим числом хорошо интерпретируемых физико-химических параметров. Следует отметить важную роль водородной связи в формировании нейротоксичности исследованных соединений, а именно протоноакцепторную способность ∑(Ca), которая встречается в качестве молекулярного дескриптора во всех сконструированных моделях (1) ÷ (12). В ранее проведенном исследовании нейротоксичности 47 органических растворителей [8], также в качестве дескриптора фигурировало число образуемых соединением водородных связей. подчеркнуть, что одним из желательных требований, предъявляемым к современным QSAR моделям, является их механистическая интерпретируемость [16,17]. Токсический эффект является сложным по своей природе явлением. Это связано как с большим числом биологических мишеней в организме, так и с различными типами их взаимодействия с молекулами веществ. Существуют различные схемы классификации химических соединений по типу токсического действия [18]. Учет этих типов и использование соответствующих дескрипторов приводит к получению наиболее качественных QSAR моделей. В отдельную обширную группу можно выделить соединения с неспецифической токсичностью (наркоз). В настоящее время этот эффект рассматривается как результат обратимого межмолекулярного взаимодействия токсикантов с биологическими мембранами клеток [19]. В литературе опубликовано большое количество QSAR моделей неспецифической токсичности, где в качестве механистического (то есть отражающего механизм действия) молекулярного дескриптора выступает коэффициент распределения вещества в системе н-октанол – вода (logP) [18,20]. Этот дескриптор был использован и при конструировании регрессионной модели для изучаемого ряда органических растворителей [7]. Ранее [21] нами было показано, что logP является сложным составным дескриптором, который может быть заменен на комбинацию двух других молекулярных характеристик: α и ∑(Ca). Использование этих и других (∑(Q+) и μ) дескрипторов позволило, с одной стороны, расширить ряд анализируемых соединений по сравнению с ранее опубликованной моделью [7], а, с другой стороны, подтвердить неспецифический характер токсичности исследованных органических растворителей и выявить количественный вклад различных типов межмолекулярных взаимодействий. В качестве основного метода валидации разработанных в настоящей работе регрессионных моделей использован перекрестный контроль. Другим методом проверки предсказательной способности моделей является валидация на основе прогноза для внешней выборки. Для ее реализации необходимо наличие независимых данных, которые не были использованы в обучающей выборке. В качестве иллюстративного примера мы использовали этиловый спирт, который обладает выраженным нейротоксическим эффектом [22]. Для оценки нейротоксичности использовали модель (4) со следующими характеристиками этанола: α = 5.08 Å3; ∑(Q+) = 0.32; ∑(Ca) = 1.66; μ = 1.69 Д. Полученная величина log(1/EC30) = -2.32 вполне соответствует величинам нейротоксичности других спиртов, например, 1-пропанола (log(1/EC30) = -2.71) и 1-бутанола (log(1/EC30) = -2.15). образом, в настоящей работе установлено, что при моделировании острой нейротоксичности ряда органических растворителей по отношению к крысам и мышам с помощью трех статистических методов самые лучшие результаты показывает линейная регрессия. Близкие показатели демонстрирует метод случайного леса. Полученные линейные регрессионные уравнения имеют более высокие статистические показатели и/или меньшее число хорошо интерпретируемых физико-химических дескрипторов по сравнению с описанными в литературе моделями. Выявлена важная роль протоноакцепторной способности исследованных соединений в формировании их нейротоксичности. Следует отметить, что использованный в настоящей работе простой метод расчета области применимости моделей не гарантирует возможность оценки активности новых соединений. Этот вопрос требует дальнейших исследований. Кроме того, такая оценка может быть осуществлена только на основе величин физико-химических дескрипторов, рассчитанных с помощью компьютерной программы HYBOT. Авторы настоящей работы могут провести необходимые расчеты для количественной оценки нейротоксического эффекта новых неисследованных соединений. ДОПОЛНИТЕЛЬНЫЕ МАТЕРИАЛЫ К данной статье приложены дополнительные материалы, свободно доступные в электронной версии (http://dx.doi.org/10.18097/BMCRM00019) на сайте журнала. БЛАГОДАРНОСТИ Работа выполнена в рамках государственного задания на 2018 год (тема № 0090-2017-0020). ЛИТЕРАТУРА
|