诊断试验与循证医学

王吉耀

复旦大学循证医学中心
复旦大学附属中山医院消化科

    临床医师每天接触大量的病人，在为病人诊治中需要解决的一个重要问题是病人是否有病、患的是什么病，在肯定和排除诊断中，就需要合理地选用诊断试验；另外在筛检无症状的病人、随访疾病、判断疾病的严重性、估计预后和对治疗的反应都需要根据诊断试验的精确性、准确性、病人的可接受性、安全性和化费等方面对其进行选择，还要合理地解释试验的结果。这些都是临床实践中最易碰到的问题，在实施有关诊断试验的循证医学(evidence based medicine, EBM)时可参照下述步骤[1]。
    一、提出临床上需要解决的问题, 寻找最恰当的相关资料：
    首先将临床实践中有关的诊断试验问题以一个可以回答的方式加以提问。例：一位十二指肠溃疡病人，胃镜检查已证实溃疡并发现幽门螺杆菌阳性，在给予一周三联的抗菌治疗后，病人又来求诊，并问医生幽门螺杆菌是否已经根除。考虑到病人并不一定需要再做胃镜了解根除情况，一位医生提出了做13C呼吸试验，另一位医师了解到在粪便中检查幽门螺杆菌抗原更方便而且价格便宜。根据这个临床问题，可以提出这样的问题“用13C呼吸试验和粪便幽门螺杆菌抗原的检测来诊断幽门螺杆菌感染哪一个更有效？它们的敏感度和特异度各是多少？”
    二、用恰当的主题词进行计算机资料的检索：
    大多数教科书都是3～4年出版一次，从教科书上常常不能发现最新的资料。对于上述例子，在教科书上虽然已提到13C呼吸试验可用于检查幽门螺杆菌感染，但尚未提到检查粪便中幽门螺杆菌抗原的试验。因此可以到Internet上去查找，输入的关键词为“H.pylori感染”和“诊断试验”和“人类”。在诊断试验一项中可进一步输入“13C呼吸试验”或“粪便检测幽门螺杆菌抗原”来进一步限制找到的文章数。
    三、评价文章的科学性
    当收集到了相关的文章及资料后必须按照下述标准对文章进行评价。符合这些条件的文章才可被认为在设计上合理，具有科学性，其结果才是可信的。
    1. 该试验是否与金标准试验进行“盲法”比较？
    判断诊断试验真实性的最好方法，是将所考核的诊断试验结果与“真实”情况进行比较。真实情况是由当前为临床医学界公认的诊断疾病最可靠的标准诊断方法来确定的，又称为“金标准”。常用的金标准有病理学诊断（组织活检或尸体解剖）、外科手术发现、特殊的影像诊断（如冠状动脉造影诊断冠心病）。长期随访获得的肯定诊断也可作为参照标准。因此，当找到相关文章后，首先要检查文章的作者是否对每一位被研究对象在进行所考核的诊断试验时，都采用了合适的金标准。上述例子中金标准应该是胃镜时取的胃粘膜活组织进行病理切片及幽门螺杆菌培养的结果。
    2. 是否每个被检者都经过金标准试验检查？
    研究者常常将被考核试验结果阳性者，都送去做金标准试验，而阴性者只抽一部分人去做金标准试验，再根据这样的结果计算试验的敏感度和特异度，结果夸大了试验的敏感度，使其正确性受到影响, 这样的文章其科学性就会受到很大的影响。
    3. 所研究病人的样本是否包括临床实践中将使用该诊断试验的各种病人？
    即被考核的诊断试验中所检查的疾病谱是否与目前待测该试验的对象疾病谱相同[2]。病人的样本应包括病变轻的、重的、治疗过的和未治疗过的。众所周知，终末期病人检查时，试验结果常有明显的异常，因此被考核(或新的)诊断试验很容易将晚期病人与正常人区分开来。但是诊断试验实际上最有价值的是区分有病变的早期病人和易与该病混淆(症状、体征相同)的其他病。因此，对照组往往包括正常人及临床表现与该病相同需要与该病作鉴别诊断的其他病人。如不按照此标准报道的新的诊断试验，往往会夸大其敏感度和特异度，在开始时被寄予较大希望，经过多年临床实践后被冷落。
    4. 诊断试验的精确性：
    诊断试验的精确性(precision)又称可重复性(reproducible)。是指诊断试验在完全相同条件下，进行重复操作获得相同结果的稳定程度。为了增加诊断试验的可重复性，作者应详细介绍诊断试验的具体实施操作方法，使达到相同的实验条件。
    四、估计临床应用的指标
    1.估计疾病的验前概率：
    验前概率是指病人在作该项试验或检查前，患这种病的概率，即患病率。不同患者不同情况下的验前概率是不相同的，医生对验前概率的估计是根据病人的病史、体格检查和他们的临床实践中遇到此类病人的概率来确定的。
    2.说明和应用关于敏感度和特异度的资料：
    寻找、应用诊断试验中有关敏感度和特异度的资料在循证医学实施中是十分重要的一步。敏感度和特异度是用来说明诊断试验准确度的两个基本特性。临床医师常常在临床上应用敏感度和特异度，有些医师用一个敏感度很高的试验去肯定疾病，而用特异度高的试验去排除疾病，这种用法是不正确的。敏感度高的试验不能用作肯定或划入(rule in)疾病的诊断，因为敏感度高时虽然有病的病人大多数为阴性，而没有病的人也有许多人试验结果阳性(假阳性率也高)。特异性高的试验常用于肯定某病的存在。特异度高的试验在没有病的人群中几乎是阴性的，因此高特异度试验在试验结果阳性肯定疾病诊断时最有意义[3]。
    Sackett教授制订的高敏感度阴性结果排除疾病(SnNout)和高特异度阳性试验可诊断疾病(SpPin)有利于临床医师做床边决策[4]。
    3.应用似然比
    似然比(likelihood ratio,LR)表达了在患某种病的病人中进行某项诊断试验所得到的数值的范围。似然比的含义是试验的结果使验前概率提高或降低的多少，似然比为1，表示验前与验后概率相同，没有必要做此试验。似然比>1表示在做试验后，患该病的可能性增大。似然比越大，患病可能性越大。
    五、将临床研究结果用于自己的病人
    在我们找到一篇有科学性关于诊断试验的系统综述或报告后，又经过上述标准评估认为其有足够的正确性可供使用。下一个问题就是我们如何将它与我们碰到的病人的验前概率结合起来考虑应用于我们自己的病人。具体应从以下三个方面去实施。
    1. 试验结果是否适用于并可提供给我的病人：
    首先要确定在本单位是否已开展或能开展该项检查，“可供使用”这是在将试验用于自己病人时首先要解决的一个问题。因此，在将文献上的试验用于自己病人前，应该先考虑到本单位是否具备开展该项试验的条件，包括仪器、设备、试剂、人员的配备。还要考虑将该试验搬过来用于自己病人的测定时，是否会产生相同的结果即准确性和精确性的程度。
    在考虑寻找到的系统综述或文献报道的研究结果是否适用于我的病人时，要考虑到所报道的病例组病人的地理位置、文化背景、个人人口统计学上特点是否与我所在单位病人的情况相同。两者的情况越接近和相配，在应用该文章结果时，就会得到与所报告文章相同的准确性。如果两者研究对象中病情的严重度不相同，或临床情况的分布不同，诊断试验的特性也会发生变化。当被检查对象都是重病人时，试验的敏感度会增加，似然比会远远大于1（向>1的方向偏离）；如果轻病人较多时，试验的敏感度降低，似然比会向1靠近。
    我们可以根据个人临床经验、地区性和全国性流行病学统计资料合理估计自己病人的验前概率, 也根据以前见到的具有相同临床症状和体征、相同临床问题的病人得到的临床经验，从最后确诊情况回顾性地估计其验前概率。
    2. 验后概率的结果是否改变了对病人的处理：
    确定了验前概率，了解某项诊断试验的似然比，根据试验结果，可以计算出验后概率，然后决定是否需要做进一步的试验，是否需要立即进行治疗，还是基本上排除了该病的可能性，既不需要进一步检查，也不需要治疗。验后概率如在诊断阈值以下（也就是当诊断试验的结果为阴性，或者似然比接近0.1）此时临床医师将否定该病诊断，并不再对这病人做进一步检查，当然也不需要对病人进行治疗。验后概率如大于治疗阈值，（也就是诊断试验结果为阳性或者似然比十分高）即验后概率十分高，据此可以肯定诊断，并不再对这患者做进一步试验，而开始对病人进行治疗。如果验后概率落在诊断阈值与治疗阈值之间，我们要考虑作进一步检查来决定排除或肯定诊断，则需要做联合试验。此时前一个试验的验后概率就是下一项试验的验前概率。通过一系列试验计算总的验后概率，我们就能做出肯定的或否定的诊断帮助决策。
    只有当某一项诊断试验能使验前和验后概率发生较大变化，而且这种变化会对是否要继续进行另一项检查或对治疗计划的改变有影响时，才能认为这项诊断试验的确对病人是有帮助的。因此一项诊断试验的实用价值在很大程度上受到研究对象中LR很高或很低者所占比例的影响，具有这种LR值的诊断试验结果将使患者的验后概率移动幅度超过诊断阈值和治疗阈值。我们进行诊断试验的目的是为了决定对病人的治疗，因此不仅要了解该诊断试验的有效性，更重要的是评估通过该项试验的确诊或否定带来的对病人治疗方案决策的结果如何。如果做了该试验后，能增加已有的信息导致治疗措施的改变，从而最后给病人带来益处，这项试验就是有价值的。
    综上所述，循证医学在诊断试验方面的实施包括① 为了肯定或排除某一诊断提出临床问题；② 文献检索；③ 评价该试验的科学性；④ 将试验用于临床实践。在应用后评估总结该项试验对诊断、治疗和健康结局的影响，以改进临床实践或在此基础上提出新的问题 [5]。有资料表明，目前循证医学在诊断试验范围内的应用仍不够广泛，较特出的例子是对于同一种临床表现在各个不同医院采用的诊断步骤和检查项目各不相同，差异很大，其中有许多是由于诊断试验应用不当或选用不合理，因此必须注意合理选用诊断试验[6]。总之，我们在开出医嘱做某项试验前应考虑① 验前概率是多少？对病人诊断还有多大疑问？是否需要做这项检查？② 该项检查如果漏诊或误诊会对病人带来多大危害？③ 这项检查的似然比能否改变进一步临床决策。当然还应考虑到做该项检查的危险性、费用以及做该项检查的迫切性。循证医学通过实施上述步骤使医生对病人的处理更具科学性。

参考文献
    1. 王吉耀: 诊断试验. 在王吉耀主编: 循证医学与临床实践. 科学出版社. 2002; P.122-141.
    2. Richardson WS, Wilson MC, Guyatt G, Cook DJ & Nishikawa J. XV. How to use an article about disease probability for differential diagnosis. JAMA, 1999, 281(13):1214～1219
    3. Goldman L. Quantitatiive aspects of clinical reasoning, in Harrison TR. Fauci AS. Isselbacher KJ ed. Harrison's principles of internal medicine. 14th International Editions. Singapore, McGraw-Hill companies Inc, 1998,9～14
    4. Sackett DL, Straus SE,. Richardson WS, Rosenberg W, Haynes RB, Evidence based medicine. 2nd edition: Diagnosis and screening New York: Churchill Livingstone, 2000, 72～76
    5. Price CP. Evidence-based laboratoey medicine: Supporting decision -making, Clin chem 2000; 46: 1041-1050
    6. Wong ET:Improving laboratory testing:Can we get physicians to focus on ontcome? Clin Chem 1995;41(8pt2):1241-7