主办单位: 共青团中央   中国科协   教育部   中国社会科学院   全国学联  

承办单位: 贵州大学     

基本信息

项目名称:
应用决策树建立和表征环境污染物的分类模型
小类:
能源化工
简介:
本文基于定量结构-活性关系,总结分类规律,结合决策树数学方法,发展出可以有效分类的毒理树方法,建立模型对未知化合物进行毒性分类。
详细介绍:
在环境风险预测中逐渐发展出定量结构活性关系方法,前人探索出一系列的机理用来预测水生有机污染物的毒性。本文以大型蚤致毒化合物作为数据集,物理化学参数辛醇水分配系数、结构描述符和电化学描述符作为预测变量,外部毒性值和非氢原子最负电荷数被用作分类标准变量,应用多元线性回归和偏最小二乘法得到了模型方程,并进行了应用域分析和模型验证,最优的模型组成了分类模型树。发展出适合对有毒水生有机化合物分类的毒理树,第一类化合物预测精度和第二类化合物预测精度均大于平均预测水平,分类方法经过验证有良好的稳定性和可信度。文章模型可以用来预测化学品的风险同时进行生态风险管理。

作品图片

  • 应用决策树建立和表征环境污染物的分类模型

作品专业信息

撰写目的和基本思路

目前,有超过5800万种化学品,很多有三致效应(致畸、致癌、致突变),它们对于环境的污染已经成为影响人类生存和发展的重大环境问题。化学品毒性实验测定的方法耗费高时间长不能满足要求,需要模型预测的方法,为了提高预测的准确性需要将化合物毒性进行分类。本文在前人基础上,总结分类规律,结合决策树数学方法,发展出可以有效分类的毒理树方法,建立的模型具有良好的稳定性和对未知化合物分类的精确性。

科学性、先进性及独特之处

本文总结毒性分类的规律,通过模型建立——应用域表征——模型验证三位一体的方法形成了一套科学的研究方案。将决策树数学方法应用于环境毒理学的研究刚刚兴起,并不成熟,本文在前人的基础上进一步发展,提出了大胆的预测分类方法,并依靠着应用域表征和模型验证保证了所建立模型的可靠性。

应用价值和现实意义

人们日常生活中使用的化学品有十万种之多,但是只有少量了解它们的环境毒理学效应,给生态环境和人类的健康带来威胁。如何有效的管理和评估这些化学品成为一个重要的课题,本文的研究可以有效的将化学品进行毒性分类,模型的应用域表征和验证工作确保了模型的可信度,为化学品管理提供了一种行之有效的方法,为人类生存环境的改善做出了贡献。

学术论文摘要

在环境风险预测中逐渐发展出定量结构活性关系方法,前人探索出一系列的机理用来预测水生有机污染物的毒性。本文以大型蚤致毒化合物作为数据集,物理化学参数辛醇水分配系数、结构描述符和电化学描述符作为预测变量,外部毒性值和非氢原子最负电荷数被用作分类标准变量,应用多元线性回归和偏最小二乘法得到了模型方程,并进行了应用域分析和模型验证,最优的模型组成了分类模型树。发展出适合对有毒水生有机化合物分类的毒理树,第一类化合物预测精度和第二类化合物预测精度均大于平均预测水平,分类方法经过验证有良好的稳定性和可信度。文章模型可以用来预测化学品的风险同时进行生态风险管理。

获奖情况

鉴定结果

参考文献

陈景文, 李雪花, 于海瀛, 等. 面向毒害有机物生态风险评价的QSAR 技术: 进展与展望. 中国科学B 辑: 化学, 2008, 38(6): 461~474

同类课题研究水平概述

美国在2005年成立了国家计算毒理学研究中心(NCCT)的一个重要内容就是进行(Q)SAR模型研究[2]。在欧盟的REACH法规要求下,(Q)SAR模型也成为一项重要的研究内容[3] 现在研究的大多数(Q)SAR模型只是针对特殊类别的有机化合物,例如针对多氯联苯(PCB)系列物,阐明其物理化学性质的一致性[4]。但是有些化合物可能无法精确归类,这就造成无法对其进行有效计算。这样,化合物的分类也成为一个值得研究的问题。1992年Vahaar等人[5]在文章中最早提出了对化合物的毒性进行分类问题,他们将毒性分为四类:inert (第一类),less inert (第二类),reactive (第三类),specifically acting (第四类)。对于第一、二类化合物有较好的预测精度。 随后,又发展了一些新的分类方法。Shijin Ren[6]等人将水生毒性分为两类:narcosis和reactive。其中narcosis类又可以分为non-polar narcosis,polar narcosis和ester narcosis;reactive类又可分为respiratory uncoupling,electrophilicity和central nervous system seizure,通过他们的工作,对于narcosis预测的误差在5%左右。 后来,Enoch等人[7]基于Vahaar的分类方法和决策树理论提出毒理树,这种方法可以解决复杂情况下的分类,但是决策树判断过程不够精确,很难实际应用。
建议反馈 返回顶部