Отбор и исследование контрольной группы сим-триазинов и создание базы молекулярных дескрипторов
Первоначальный этап моделирования количественной зависимости «структура – активность» с использованием любого математического аппарата представляет собой создание базы объектов исследования, из которой в дальнейшем будут сформированы обучающая и контрольные выборки для проверки прогнозирующей способности полученных моделей.
База данных для создания необходимых выборок была сформирована на основании литературных источников из 31 структурно родственного гербицида, включающего триазиновый фрагмент с заместителями в 1, 3 и 5 положениях [1-15]. Наименования, молекулярная структура, значения острой токсичности, температура плавления и значения растворимости представлены в таблице 1.
Значения токсодоз приведены для всех 31 соединений, температуры плавления – лишь для 25 веществ.
Таблица 1 – Наименование, молекулярная структура и основные свойства сим-триазиновых гербицидов общей формулы
№ п/п | Наименование | Формула | Раств-ть в воде | Тпл, °С | LD50, перорально мг/кг | |||
Эмпирическая | R1 | R2 | R3 | |||||
2-Азидо-4-метилтио-6-изопропиламино-сим-триазин, азипротрин, бразоран, мезоран, мезоранил, мезурон, Ц 7019 | C7H11N7S | SCH3 | N=N=N | NHCH(CH3)2 | 91-93 | |||
2 | 2-Азидо-4-этиламино-6-трет-бутиламино-сим-триазин ВЛ 9385 | C9H16N8 | NHC(CH3)3 | 101-104 | ||||
4,6-Бис(диэтиламино)-2-метокси-сим-триазин Г 30044 | C12H23ON5 | N(CH2CH3)2 | OCH3 | N(CH2CH3)2 | 3,2 | 92-94 | ||
4,6-Бис(изопропиламино)-2-метокси-сим-триазин Г 31435, метокипропазин, приматол, прометон | C10H19N5O | NHCH(CH3)2 | NHCH2CH3 | N=N=N | 91-92 | |||
2,4-Бис(3´-метоксипропиламино)-6-метилтио-сим-триазин Ламбаст, СР 17029 | C12H23O2N5S | SCH3 | NH(CH2)3OCH3 | NH(CH2)3OCH3 | н. |
Продолжение таблицы 1
2,4-Дихлор-6-(2´-хлорфениламино)-сим-триазин В 622, дирен, кемат | C9H5N4Cl3 | NH[2-(C6H4)] | Cl | Cl | н. | 159-160 | ||
4-Диэтиламино-6-изопропиламино-2-метокси-сим-триазин Ипатон | C11H21ON5 | N(CH2CH3)2 | OCH3 | NHCH(CH3)2 | н. | - | ||
2-Метилтио-4,6-бис-(изопропиламино)-сим-триазин Ангелон, гезагард, гексазол, капарол, мерказин, прометрин, селактин | C10H19N5S | NHCH(CH3)2 | SCH3 | NHCH(CH3)2 | 0,005 | 118-120 | 3150-3750 | |
9 | 2-Метилтио-4,6-бис(этиламино)-сим-триазин Г 32911, Ги-бон, симетрин | C8H15N5S | NHCH2CH3 | SCH3 | NHCH2CH3 | 0,05 | 81-82,5 | |
2-Метилтио-4-изопропиламино-6-(3-метоксипропилмамино)-сим-триазин Гезаран 3617 (метопротрин + симазин), люметон, метопротрин, метотрин | C11H21ON5S | NHCH(CH3)2 | SCH3 | OCH2NH(CH2)2 CH3 | 0,03 | 68-70 | ||
2-Метилтио-4-метиламино-6-изопропиламино-сим-триазин Г 34360, десметрин, семерон, топусин | C8H15N5S | NHCH3 | SCH3 | NHCH(CH3)2 | 0,06 | 84-86 | ||
2-Метилтио-4-этиламино-6-трет-бутиламино-сим-триазин Гезаприм-комби, игран, пребан, тербутрин, топоград 3623 (А3623) (игран + ГС 13529) | C10H19N5S | NHCH2CH3 | SCH3 | NHC(CH3)3 | 0,006 | 104-105 |
Продолжение таблицы 1
2-Метилтио-4-этиламино-6-изопентиламино-сим-триазин С 18898 | C11H21N5S | NHCH2CH3 | SCH3 | NH(CH2)2CH(CH3)2 | тр. р. | - | ||
2-Метилтио-4-этиламино-6-изопропиламино-сим-триазин Аметрин, Г 34162, гезапакс, эвик | C9H17N5S | NHCH2CH3 | SCH3 | NHCH(CH3)2 | 0,18 | 84-86 | ||
2-Хлор-4,6-бис(диэтиламино)-сим-триазин Г 25804, хлоразин | C11H20N5Cl | N(CH2CH3)2 | Cl | NHCH(CH3)2 | тр. р. | 27-29 | ||
16 | 2-Хлор-4,6-бис(изопропиламино)-сим-триазин Г 30028, гезамин, гексазин, милоград, приматол-П, пробанил, пропазин | C9H16N5Cl | NHCH(CH3)2 | Cl | NHCH(CH3)2 | тр. р. | 212-214 | |
2-Хлор-4,6-бис(этиламино)-сим-триазин, Битемол S-500, бладекс, В 6658, видазин, видекс, Г 27692, гезаприм, гезаран 3617, гезатоп, гербазин, гербекс, люметон, приматол С, приматол-форте, радокоп, самикол, симазин, тетразин, хунгазин ДТ. | C7H12N5Cl | NHCH2CH3 | Cl | NHCH2CH3 | 227-228 | |||
2-Хлор-4-диэтиламино-6-изопропиламино-сим-триазин Г 30031, гезабал, ипазин, продизин | C10H18N5Cl | N(CH2CH3)2 | Cl | NHCH(CH3)2 | 0,04 | 112-114 | ||
2-Хлор-4-изопропиламино-6-циклопропиламино-сим-триазин Префокс, утрофокс, ципразин | C9H14N5Cl | NHCH(CH3)2 | Cl | NHC3H5-цикло | - | 410-1200 |
Продолжение таблицы 1
2-Хлор-4-этиламино-6-трет-бутиламино-сим-триазин, ГС 13528, приматол-М, топоград 3623 (А 3623), топоград-3587 (А 3587) (ГС 13529 + ГС 14259) | C9H16N5Cl | NHCH2CH3 | Cl | NHC(CH3)3 | 8,5 | 178-179 | ||
2-Хлор-4-этиламино-6-диэтиламино-сим-триазин Г 27901, гезофлок, триэтазин | C9H16N5Cl | NHCH2CH3 | Cl | N(CH2CH3)2 | 0,02 | 102-104 | ||
22 | 2-Хлор-4-этиламино-6-изопропиламино-сим-триазин Агелон (атразин + прометрин), анокс веедекс, видазин (атразин + симазин), Г-30027, гезаприм-комби (атразин + игран-50), зеазин, изаприм, пентазин, приматол Д-43(2,4,5-Т + мекопроп+атразин), приматол-форте (2,4,5-Т+2,4-Д+далапон+атразин+симазин), семпарол, хунгазин ПК | C8H14N5Cl | NHCH(CH3)2 | Cl | NHCH2CH3 | 0,003 | 173-175 | |
2-Хлор-4-этиламино-6-(цианопропиламино)-сим-триазин Блайдекс, ВЛ 19805, СД 15418, цианазин | C9H13N6Cl | NHCH2CH3 | Cl | NHCCN(CH3)2 | 0,02 | 167,5-169 | ||
2-Этилтио-4,6-бис-(изопропиламино)-сим-триазин Котофор, санкап | C11H21N5S | NHCH(CH3)2 | SCH2CH3 | NHCH(CH3)2 | 8,6 | 104-106 |
Продолжение таблицы 1
Эглиназин-этил | C9H14ClN5O2 | NHCH2CH3 | Cl | NHCH2COOC2H5 | 228-230 | |||
Проциазин | C10H13ClN6 | NHCCN(CH3)2 | Cl | NHC3H5-цикло | ||||
Хлорсульфурон | C12H12ClN5O4S | CH3 | OCH3 | NHCONHS [2-ClC6H4]O2 | 174-178 | 5545-6293 | ||
28 | Метсульфуронметил | C14H15N5O6S | CH3 | OCH3 | NHCONHS [2-COOCH3C6H4] | |||
Атратон, гезатамин | C9H17N5O | NHCH2CH3 | OCH3 | NHCH(CH3)2 | ||||
Секбумитон, сумитон | C10H19N5O | NHCH2CH3 | OCH3 | NHCHCH3C2H5 | ||||
Тербумитон | C10H19N5O | NHCH2CH3 | OCH3 | NHC(CH3)3 | 482-651 |
При выборе способа описания структуры мы исходили из условий, указанных в работах [66-70]:
- количество и тип используемых дескрипторов одинаковы для всех описываемых структур;
- каждому дескриптору соответствует определенная компонента в векторе параметров;
- разным молекулам соответствуют различные вектора параметров.
Для вычисления дескрипторов использован программный комплекс DRAGON 6.0 [64, 67], с помощью которого были рассчитаны 3224 дескриптора, относящихся к 22 классам: Constitutional descriptors (дескрипторы состава), Topological descriptors (топологические дескрипторы), Walk and path counts (число путей в графе), Connectivity descriptors (дескрипторы связности), Information indices (информационные индексы), 2D autocorrelations (двумерные автокорреляции), Edge adjacency indices (индексы смежности рёбер), Burden eigenvalue descriptors (индексы бёрденовских собственных значений), Topological charge indices (топологические зарядовые индексы), Eigenvalue-based indices (индексы, основанные на собственных значениях), Randic molecular profiles (молекулярные профили по Рандичу), Geometrical descriptors (геометрические дескрипторы), RDF descriptors (дескрипторы RDF), 3D-MoRSE descriptors(дескрипторы 3D-MoRSE), WHIM descriptors (дескрипторы WHIM), GETAWAY descriptors (дескрипторы GETAWAY), Functional group counts (подсчет числа функциональных групп), Atom-centered fragments (фрагменты, центрированные на атомах), Charge descriptors (дескрипторы, характеризующие заряд), Molecular properties (молекулярные свойства), 2D binary fingerprints (двумерные двоичные отпечатки), 2D frequency fingerprints (двумерные отпечатки частот), а также квантовые параметры – энергии HOMO (Highest Occupied Molecular Orbital– высшей занятой орбитали) и LUMO (Lowest Unoccupied Molecular Orbital– низшей незанятой орбитали) [71].
Расчет физико-химических дескрипторов выполнен на базе программы Cambridge Soft Chem&BioDraw 12.0. с объемной оптимизацией топологической структуры молекул методом молекулярной механики (MM2) [65].
Выбор наиболее информативных дескрипторов из полученного множества описателей производили путем нахождения коэффициента линейной корреляции (коэффициента корреляции Пирсона). Однако при отклонении парной статистической зависимости от линейной данный коэффициент теряет свой смысл как характеристика тесноты связи. Чтобы учесть возможность наличия нелинейной зависимости различного характера между прогнозируемыми параметрами и рассчитанными дескрипторами, нами была проведена линеаризация с помощью преобразования входных и выходных переменных. Линеаризующие преобразования проводили для наиболее часто встречающихся зависимостей, приведенных в таблице 2 [72].
Таблица 2 – Линеаризующие преобразования для поиска коэффициента корреляции между параметрами токсичности и вычисленными дескрипторами
Тип зависимости | Вид преобразования | Линеаризованная зависимость |
Степенная | X=logx, Y=logy | Y=loga+bX |
Показательная 1 | x, Y=lny | Y=lna+bx |
Показательная 2 | X=1/x, Y=lny | Y=lna+bX |
Гиперболическая 1 | X=1/x, y | y=a+bX |
Гиперболическая 2 | X=1/x, Y=1/y | Y=a+bX |
Гиперболическая 3 | x, Y=1/y | Y=a+bx |
Квадратного корня по x | X=x1/2, y | y=a+bX |
Квадратного корня по y | x, Y=y1/2 | Y=a+bx |
Логистическая | X=e-x, Y=1/y | Y=a+bX |
Произведенные преобразования показывают, что для некоторых дескрипторов при определенном виде линеаризации значения коэффициента корреляции увеличиваются, что свидетельствует о том, что линеаризованные функции точнее соответствуют характеру регрессионной зависимости между данными дескрипторами и исследуемыми параметрами токсичности. Особенно это характерно для степенного и квадратичных преобразований в случае корреляции значений токсодоз, а также гиперболического и квадратичного (по аргументу) преобразований в случае корреляции значений температуры плавления.
Дата добавления: 2016-07-09; просмотров: 688;