Отбор и исследование контрольной группы сим-триазинов и создание базы молекулярных дескрипторов

 

Первоначальный этап моделирования количественной зависимости «структура – активность» с использованием любого математического аппарата представляет собой создание базы объектов исследования, из которой в дальнейшем будут сформированы обучающая и контрольные выборки для проверки прогнозирующей способности полученных моделей.

База данных для создания необходимых выборок была сформирована на основании литературных источников из 31 структурно родственного гербицида, включающего триазиновый фрагмент с заместителями в 1, 3 и 5 положениях [1-15]. Наименования, молекулярная структура, значения острой токсичности, температура плавления и значения растворимости представлены в таблице 1.

Значения токсодоз приведены для всех 31 соединений, температуры плавления – лишь для 25 веществ.


Таблица 1 – Наименование, молекулярная структура и основные свойства сим-триазиновых гербицидов общей формулы

№ п/п Наименование Формула Раств-ть в воде Тпл, °С LD50, перорально мг/кг
Эмпирическая R1 R2 R3
2-Азидо-4-метилтио-6-изопропиламино-сим-триазин, азипротрин, бразоран, мезоран, мезоранил, мезурон, Ц 7019 C7H11N7S SCH3 N=N=N NHCH(CH3)2 91-93
2 2-Азидо-4-этиламино-6-трет-бутиламино-сим-триазин ВЛ 9385 C9H16N8     NHC(CH3)3 101-104
4,6-Бис(диэтиламино)-2-метокси-сим-триазин Г 30044 C12H23ON5 N(CH2CH3)2 OCH3 N(CH2CH3)2 3,2 92-94
4,6-Бис(изопропиламино)-2-метокси-сим-триазин Г 31435, метокипропазин, приматол, прометон C10H19N5O NHCH(CH3)2 NHCH2CH3 N=N=N 91-92
2,4-Бис(3´-метоксипропиламино)-6-метилтио-сим-триазин Ламбаст, СР 17029 C12H23O2N5S SCH3 NH(CH2)3OCH3 NH(CH2)3OCH3 н.

Продолжение таблицы 1

2,4-Дихлор-6-(2´-хлорфениламино)-сим-триазин В 622, дирен, кемат C9H5N4Cl3 NH[2-(C6H4)] Cl Cl н. 159-160
4-Диэтиламино-6-изопропиламино-2-метокси-сим-триазин Ипатон C11H21ON5 N(CH2CH3)2 OCH3 NHCH(CH3)2 н. -
2-Метилтио-4,6-бис-(изопропиламино)-сим-триазин Ангелон, гезагард, гексазол, капарол, мерказин, прометрин, селактин C10H19N5S NHCH(CH3)2 SCH3 NHCH(CH3)2 0,005 118-120 3150-3750
9 2-Метилтио-4,6-бис(этиламино)-сим-триазин Г 32911, Ги-бон, симетрин C8H15N5S NHCH2CH3 SCH3 NHCH2CH3 0,05 81-82,5
2-Метилтио-4-изопропиламино-6-(3-метоксипропилмамино)-сим-триазин Гезаран 3617 (метопротрин + симазин), люметон, метопротрин, метотрин C11H21ON5S NHCH(CH3)2 SCH3 OCH2NH(CH2)2 CH3 0,03 68-70
2-Метилтио-4-метиламино-6-изопропиламино-сим-триазин Г 34360, десметрин, семерон, топусин C8H15N5S NHCH3 SCH3 NHCH(CH3)2 0,06 84-86
2-Метилтио-4-этиламино-6-трет-бутиламино-сим-триазин Гезаприм-комби, игран, пребан, тербутрин, топоград 3623 (А3623) (игран + ГС 13529) C10H19N5S NHCH2CH3 SCH3 NHC(CH3)3 0,006 104-105


Продолжение таблицы 1

2-Метилтио-4-этиламино-6-изопентиламино-сим-триазин С 18898 C11H21N5S NHCH2CH3 SCH3 NH(CH2)2CH(CH3)2 тр. р. -
2-Метилтио-4-этиламино-6-изопропиламино-сим-триазин Аметрин, Г 34162, гезапакс, эвик C9H17N5S NHCH2CH3 SCH3 NHCH(CH3)2 0,18 84-86
2-Хлор-4,6-бис(диэтиламино)-сим-триазин Г 25804, хлоразин C11H20N5Cl N(CH2CH3)2 Cl NHCH(CH3)2 тр. р. 27-29
16 2-Хлор-4,6-бис(изопропиламино)-сим-триазин Г 30028, гезамин, гексазин, милоград, приматол-П, пробанил, пропазин C9H16N5Cl NHCH(CH3)2 Cl NHCH(CH3)2 тр. р. 212-214
2-Хлор-4,6-бис(этиламино)-сим-триазин, Битемол S-500, бладекс, В 6658, видазин, видекс, Г 27692, гезаприм, гезаран 3617, гезатоп, гербазин, гербекс, люметон, приматол С, приматол-форте, радокоп, самикол, симазин, тетразин, хунгазин ДТ. C7H12N5Cl NHCH2CH3 Cl NHCH2CH3 227-228
2-Хлор-4-диэтиламино-6-изопропиламино-сим-триазин Г 30031, гезабал, ипазин, продизин C10H18N5Cl N(CH2CH3)2 Cl NHCH(CH3)2 0,04 112-114
2-Хлор-4-изопропиламино-6-циклопропиламино-сим-триазин Префокс, утрофокс, ципразин C9H14N5Cl NHCH(CH3)2 Cl NHC3H5-цикло - 410-1200


Продолжение таблицы 1

2-Хлор-4-этиламино-6-трет-бутиламино-сим-триазин, ГС 13528, приматол-М, топоград 3623 (А 3623), топоград-3587 (А 3587) (ГС 13529 + ГС 14259) C9H16N5Cl NHCH2CH3 Cl NHC(CH3)3 8,5 178-179
2-Хлор-4-этиламино-6-диэтиламино-сим-триазин Г 27901, гезофлок, триэтазин C9H16N5Cl NHCH2CH3 Cl N(CH2CH3)2 0,02 102-104
22 2-Хлор-4-этиламино-6-изопропиламино-сим-триазин Агелон (атразин + прометрин), анокс веедекс, видазин (атразин + симазин), Г-30027, гезаприм-комби (атразин + игран-50), зеазин, изаприм, пентазин, приматол Д-43(2,4,5-Т + мекопроп+атразин), приматол-форте (2,4,5-Т+2,4-Д+далапон+атразин+симазин), семпарол, хунгазин ПК C8H14N5Cl NHCH(CH3)2 Cl NHCH2CH3 0,003 173-175
2-Хлор-4-этиламино-6-(цианопропиламино)-сим-триазин Блайдекс, ВЛ 19805, СД 15418, цианазин C9H13N6Cl NHCH2CH3 Cl NHCCN(CH3)2 0,02 167,5-169
2-Этилтио-4,6-бис-(изопропиламино)-сим-триазин Котофор, санкап C11H21N5S NHCH(CH3)2 SCH2CH3 NHCH(CH3)2 8,6 104-106


Продолжение таблицы 1

Эглиназин-этил C9H14ClN5O2 NHCH2CH3 Cl NHCH2COOC2H5 228-230
Проциазин C10H13ClN6 NHCCN(CH3)2 Cl NHC3H5-цикло
Хлорсульфурон C12H12ClN5O4S CH3 OCH3 NHCONHS [2-ClC6H4]O2 174-178 5545-6293
28 Метсульфуронметил C14H15N5O6S CH3 OCH3 NHCONHS [2-COOCH3C6H4]
Атратон, гезатамин C9H17N5O NHCH2CH3 OCH3 NHCH(CH3)2  
Секбумитон, сумитон C10H19N5O NHCH2CH3 OCH3 NHCHCH3C2H5  
Тербумитон C10H19N5O NHCH2CH3 OCH3 NHC(CH3)3   482-651

 

 
 

При выборе способа описания структуры мы исходили из условий, указанных в работах [66-70]:

- количество и тип используемых дескрипторов одинаковы для всех описываемых структур;

- каждому дескриптору соответствует определенная компонента в векторе параметров;

- разным молекулам соответствуют различные вектора параметров.

Для вычисления дескрипторов использован программный комплекс DRAGON 6.0 [64, 67], с помощью которого были рассчитаны 3224 дескриптора, относящихся к 22 классам: Constitutional descriptors (дескрипторы состава), Topological descriptors (топологические дескрипторы), Walk and path counts (число путей в графе), Connectivity descriptors (дескрипторы связности), Information indices (информационные индексы), 2D autocorrelations (двумерные автокорреляции), Edge adjacency indices (индексы смежности рёбер), Burden eigenvalue descriptors (индексы бёрденовских собственных значений), Topological charge indices (топологические зарядовые индексы), Eigenvalue-based indices (индексы, основанные на собственных значениях), Randic molecular profiles (молекулярные профили по Рандичу), Geometrical descriptors (геометрические дескрипторы), RDF descriptors (дескрипторы RDF), 3D-MoRSE descriptors(дескрипторы 3D-MoRSE), WHIM descriptors (дескрипторы WHIM), GETAWAY descriptors (дескрипторы GETAWAY), Functional group counts (подсчет числа функциональных групп), Atom-centered fragments (фрагменты, центрированные на атомах), Charge descriptors (дескрипторы, характеризующие заряд), Molecular properties (молекулярные свойства), 2D binary fingerprints (двумерные двоичные отпечатки), 2D frequency fingerprints (двумерные отпечатки частот), а также квантовые параметры – энергии HOMO (Highest Occupied Molecular Orbital– высшей занятой орбитали) и LUMO (Lowest Unoccupied Molecular Orbital– низшей незанятой орбитали) [71].

Расчет физико-химических дескрипторов выполнен на базе программы Cambridge Soft Chem&BioDraw 12.0. с объемной оптимизацией топологической структуры молекул методом молекулярной механики (MM2) [65].

Выбор наиболее информативных дескрипторов из полученного множества описателей производили путем нахождения коэффициента линейной корреляции (коэффициента корреляции Пирсона). Однако при отклонении парной статистической зависимости от линейной данный коэффициент теряет свой смысл как характеристика тесноты связи. Чтобы учесть возможность наличия нелинейной зависимости различного характера между прогнозируемыми параметрами и рассчитанными дескрипторами, нами была проведена линеаризация с помощью преобразования входных и выходных переменных. Линеаризующие преобразования проводили для наиболее часто встречающихся зависимостей, приведенных в таблице 2 [72].

 

Таблица 2 – Линеаризующие преобразования для поиска коэффициента корреляции между параметрами токсичности и вычисленными дескрипторами

Тип зависимости Вид преобразования Линеаризованная зависимость
Степенная X=logx, Y=logy Y=loga+bX
Показательная 1 x, Y=lny Y=lna+bx
Показательная 2 X=1/x, Y=lny Y=lna+bX
Гиперболическая 1 X=1/x, y y=a+bX
Гиперболическая 2 X=1/x, Y=1/y Y=a+bX
Гиперболическая 3 x, Y=1/y Y=a+bx
Квадратного корня по x X=x1/2, y y=a+bX
Квадратного корня по y x, Y=y1/2 Y=a+bx
Логистическая X=e-x, Y=1/y Y=a+bX

 

Произведенные преобразования показывают, что для некоторых дескрипторов при определенном виде линеаризации значения коэффициента корреляции увеличиваются, что свидетельствует о том, что линеаризованные функции точнее соответствуют характеру регрессионной зависимости между данными дескрипторами и исследуемыми параметрами токсичности. Особенно это характерно для степенного и квадратичных преобразований в случае корреляции значений токсодоз, а также гиперболического и квадратичного (по аргументу) преобразований в случае корреляции значений температуры плавления.

 








Дата добавления: 2016-07-09; просмотров: 682;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.008 сек.