交叉参照
计算机名词
交叉参照是表面你程序中已经使用的点,而在程序制作使用交叉参照来确定是否重复使用已使用的点,避免程序错误。
交叉参照方法在毒理学领域的应用
交叉参照已日趋作为非测试方法的一种,被应用于化学品安全评估中。 欧盟化学品管理署公布的物质卷宗和美国环保署公布的高产量物质危害报告中,有相当一部分物质均采用交叉参照方法。交叉参照,即由一个(或多个)化合物的节点信息预测另一个(或多个)具有相似特性的化合物的同一节点,从而替代测试数据 。科学合理的假说是交叉参照应用的前提条件,建立假说的基本原则。
建立假说的基本原则
科学合理的假说是交叉参照应用的前提条件,建立假说的基本原则包括:
化学结构相似性
具有相同的官能团,如醛基 、 环氧化物 、 酉旨键 、 特殊的金属离子等; 规律性变化,如碳链的依次增加或缩短等,主要是一 些碳氢化合物的溶剂 、 石油产物 、 天然复合物; 额外增加或缺失官能团不会影响物质最终的毒性表征。其判断主要依赖于现有的毒理学数据,考虑该结构基团可能产生的毒性差异。用于预测类似物的软件AIM(Analog ldentifieation Methodology),可基于化学结构初步筛选类似物,但不能直接代替交叉参照。
性质相似性
具有相似的理化特性包括,分子量 、 溶解性 、 辛醇/水分配系数 、 蒸汽压 、粒径等; 基本的毒代动力学特性 、 代谢途径 、 作用机制等信息; 具有相同的前体或分解产物 。
物质鉴定
物质的组分 、 纯度和杂质特性需要进行评估。其中一些杂质可能会影响整体毒性,有必要确定杂质的成分和水平,明确杂质的危害特性,判断该差异是否会产生额外的影响。
类似物数据质量
合理假说建立的重要因素之一是类似物数据的相关性和可靠性。只有先保证现有的试验数据质量相关且可靠,交叉参照方法的结果才有效,才可能被接受。
其他支撑数据
分组法中,如筛选到的相似物质数量越多,得到的趋势越显著,评估的完整性越高。 单节点的评估中,一些分子相关效应有利于增加可信度,如分子表现出亲电子,则皮肤致敏和致突变的概率将增加。 有些缺失的相关信息,可尝试采用(O)SAR模型预测,如下。Toxtree,OECD toolbox等。
科学上的限制和实际情况的影响
交叉参照应用的限制因素主要包括科学上的限制和实际情况的影响。
科学上的限制
1、相似程度无法量化,只能主观描述;
2、作用机制相似性无法获得 。
实际情况的影响
1、类似物的数据质量不受控制;
2、目标物质和类似物的物质表征无法比较。因此,交叉参照假说的建立可能存在不确定性,这往往取决于论据的充分性和可靠性,如试验数据的质量是否足够可靠,相似性假说建立是否合理,证据权衡结果是否明确等综合因素考虑 。
多媒体交叉参照检索系统
描述并实现了一个面向数字图书馆的多媒体交叉参照检索系统。该系统将对多模态数据的检索无缝地融合到一个系统中,基于交叉参照图模型,多模态交叉参照搜索引擎综合计算媒体对象与查询之间在语义和内容层上的相似度;系统还支持用户相关反馈调整交叉参照图模型。实验结果表明,该系统能够比较有效地进行多模态交叉参照检索。
多模态交叉参照搜索引擎处理
在交叉参照图模型的辅助下,可以进行多模态交叉参照检索。多模态交叉参照检索是一种全新的检索模式,目标是把多模态数据融合到一个检索系统中。它允许用户提交同种或者不同模态的媒体对象作为查询例子,在一次查询过程中返回多种模态的媒体对象,并且可以根据检索结果,使用用户感兴趣的另一种模态的媒体对象继续进行检索。
首先通过预处理模块,提取多媒体文档中的媒体对象以及它们的底层特征并存入相应的媒体库中,同时建立交叉参照图模型。用户查询由多模态交叉参照搜索引擎处理。为了提高检索的准确率,该搜索引擎具有两个功能:
(1)基于交叉参照图模型计算媒体对象与查询在语义层上的相似度;
(2)通过支持向量聚类引发各个单模态搜索引擎进行基于内容的检索。最后通过结果融合模块把查询结果反馈给用户。用户的相关反馈被语义学习和结果修正模块处理,用于更新交叉参照图模型并且改进各个搜索引擎的查询结果。多媒体交叉参照检索系统的查询过程分为如下几个步骤:
Step1、用户提交一组查询例子(可以是多个不同模态的媒体对象)给多模态交叉参照搜索引擎,基于建立的交叉参照图模型对查询进行语义相似检索,检索返回的结果是语义层上最为相似的多模态对象集合;
Step2、将Step1返回的结果集合分解成单模态对象集合,然后采用支持向量聚类分别对每个单模态对象集合进行聚类,根据聚类结果选择某个聚类的质心作为查询输入到各个单模态搜索引擎,引发基于内容的检索;
Step3、对多模态交叉参照搜索引擎和各个单模态搜索引擎返回的结果进行融合,这个过程实际上是对查询结果 在语义层和底层感知特征上的相似度进行融合;
Step4、根据用户相关反馈更新图模型,同时对本次查询的结果进行修正。
多模态交叉参照搜索引擎
首先用户提交一组查询例子,然后基于交叉参照图模型,采用Dijkstra最短路径算法对查询例子进行扩展,生成一个候选集合,候选集合中的媒体对象被认为与查询例子在语义上具有一定的相似性,需要对其进行排序。候选媒体对象与查询例子之间的相似度和以下三个条件有关:
(1)与大量的相关候选媒体对象有关联;
(2)通过高权重的边和相关候选媒体对象有关联;
(3)与大量高权重的相关候选媒体对象有关联。假设候选集中有n个媒体对象,可以用一个n维的相似度矢量SV=〈sv1,sv2,…,svn〉表示候选集中媒体对象与查询例子之间的相似度,其中对象oi与查询例子之间的相似度用svi表示。首先,把SV初始化为单位矢量,然后根据无向的邻接矩阵进行迭代计算,直到SV收敛为止(文献已经证明这种算法是收敛的)。对候选集中的媒体对象按svi降序排序,得到最终的查询结果。
支持向量聚类
由于交叉参照图模型是基于多媒体文档的语义框架建立的,多媒体文档创建时具有一定的主观性,初始的交叉参照图模型不能完全反映媒体对象的真实语义信息,因此多媒体交叉参照检索系统还必须结合基于内容的检索。为了引发各个单模态搜索引擎进行基于内容的检索,需要利用多模态交叉参照搜索引擎返回的查询结果。但是这个查询结果集是一个多模态数据集合Q,不同模态的媒体对象在底层感知特征上具有很大的差别,必须把Q分解成单模态对象集合Q-S,然后分别对单模态集合聚类,选择一个合适的聚类质心作为单 模态搜索引擎的输入,进行基于视觉 、听觉或几何特征的多媒体检索。采用支持向量聚类算法对每个单模态检索得到的结果进行聚类,它能够将特征数据映射到高维空间去处理任意分布数据的聚类,并且通过Mercer核函数来处理异常点,而且在其特征空间中不需要进行精确的运算,具有较好的聚类效果。假设对单模态对象集合Q-S进行聚类后形成m个聚类集合{C1,C2,…,Cm},可以选择一个最优的聚类。其中Ci表示聚类集合包含的元素个数。采用聚类质心而不是查询例子去引发基于内容的检索有两个原因:
(1)单模态查询例子集合有可能为空,这种情况下就只能采用聚类质心;
(2)在基于内容的检索过程中,初始的查询例子往往不能完全表达用户的查询需求,需要用户的相关反馈对初始查询进行调整,采用聚类质心作为初始查询可以达到这个目的。
参考资料
最新修订时间:2022-12-29 10:09
目录
概述
交叉参照方法在毒理学领域的应用
参考资料