口腔颌面外科杂志

图/表详细信息

深度学习在检测牙周放射学骨丧失中的应用——系统评价与Meta分析

段晖, 鲁嘉韦, 贺梦柯, 罗礼君

《口腔颌面外科杂志》, 2025, 35(6): 438-447. DOI: 10.12439/kqhm.1005-4979.2025.06.003

第一作者(发表年份)	国家		数据集		形式	算法		主要结果
Alotaibi G (2022) ^[10]	沙特阿拉伯		1 724张根尖片，将其划分为训练集（n=1 206，70%）、验证集（n=345，20%）和测试集（n=173，10%）		根尖片	CNN		AI检测牙周炎的诊断准确率为73.00%，骨丧失严重程度分类的准确率为59.00%，AI检测是否存在骨吸收的灵敏度为73.00%，特异度为79.10%
Kurt S (2020) ^[11]	土耳其		2 276张全景片（1 137例为骨丧失病例，1 139例为牙周健康病例），训练集（n=1 856，927例为骨丧失病例，929例为健康病例)、验证集（n=210，105例为骨丧失病例，105例为健康病例)和测试集（n=210，105例为骨丧失病例，105例为健康病例）		全景片	CNN		判断是否存在牙周骨吸收，TP为99，TN为93，FP为12，FN为6；灵敏度、特异度、精确率、准确率，F1评分分别为0.94、0.88、0.89、0.91和0.91
Chang HJ (2020) ^[12]	韩国		340张全景片，使用图像增强以增加数据，图像数量比原来增加了64倍，划分为训练集（90%）和测试集（10%）		全景片	CNN		自动方法与放射科医生诊断的Pearson相关系数为0.73（P<0.01），整个颌骨的组内相关系数为0.91（P<0.01）
Chang J (2022) ^[13]	美国		236例患者的全口根尖片（1 836张），交叉验证，将收集到的数据集分为5组，使用3组作为训练集，1组作为验证集，其余1组用作测试集；数据增强：以15°的步长旋转获得5个副本		根尖片	InceptionV3 (CNN)		经5-fold交叉实验评估，该模型对于轻度（<15%）与重度（≥15%）骨丧失的分类平均准确率为0.87±0.01；该模型的灵敏度、特异度、阳性预测和阴性预测值分别为0.86±0.03、0.88±0.03、0.88±0.03和0.86±0.02
Chen IH (2024) ^[14]	中国		台湾数据集：训练集（n=82，牙齿：123）和测试集（n=336，牙齿：390）；以15°的步长旋转，获得原图像的5个副本		根尖片	CNN		该模型与3位牙周病学医生评估的真实PBL程度之间的偏差为6.5%。对牙周炎分期的总Pearson相关系数为0.828 (P<0.01)，总诊断准确率为72.80%；阈值=0.15时，灵敏度为97.00%，特异度为63.80%，阈值=0.33时，灵敏度为95.20%，特异度为89.60%
Danks RP (2021) ^[15]	英国		63例患者（340张根尖片），包含463、115和56颗单根、双根和三根牙齿；3-fold交叉实验验证，前2个子集被分为训练集和验证集，而第3个子集不可见，作为测试集		根尖片	Hourglass network		与临床医生对射线片的视觉评估相比，PBL的平均误差为10.69%，分期的准确率为58.00%
Dujic H (2023) ^[16]	德国		21 819张，训练集（n=18 819），测试集（n=3 000）		根尖片	CNN		使用和评估了5个视觉转换器网络，所有评估的变压器网络总体诊断准确率为83.40%~85.20%；根据RBL将牙齿分成4类，整体灵敏度为0.87~0.91，特异度为0.70~0.75
Hoss P (2023) ^[17]	德国		21 819张根尖片，划分为训练集（n=18 819）和测试集（n=3 000）；通过随机旋转、调整亮度等增强图像数据		根尖片	CNN		5个CNN分别进行训练，灵敏度为0.89~0.91，特异度为0.66~0.71
Jiang LH (2022) ^[18]	中国		640张全景片，通过数据增强将DL的数据量增加到原来的4倍；划分为训练集（80%）和测试集（20%）		全景片	CNN		根据牙周骨吸收的百分比（<15.00%；15.00%~33.00%；>33.00%）分类，模型的整体分期准确率为0.77，灵敏度为0.77，特异度为0.88
Kim J (2019) ^[19]	韩国		12 179张全景片，划分为训练集（n=11 189）、验证集（n=190）、测试集（n=800）；采用随机旋转、水平和垂直平移等增强图像数据		全景片	DeNTNet (CNN)		与专家评估结果（RBL存在与否）相比，DeNTNet灵敏度为0.77，特异度为0.95，F1评分为0.75，口腔临床医生F1评分为0.69，DeNTNet F1评分高于口腔临床医生
Kim SH (2022) ^[20]	韩国		11例患者（500张OCT），7例（400张图像）为训练集、2例（50张图像）为验证集、2例（50张图像）为测试集；训练图像水平翻转增加了2倍		OCT	CNN		所有CNN模型显示，牙槽嵴顶和釉牙骨质界在X和Y坐标系中的平均绝对误差均小于0.25 mm，在0.50 mm时的成功检测率均大于90.00%
Kong ZM (2023) ^[21]	中国		1 747张全景片，按7∶1∶2的比例随机拆分为训练集、验证集和测试集		全景片	基于卷积神经网络的牙周炎诊断模型（periodontitis detection convolutional neural network，PDCNN）		PDCNN在全景片数据集上的4类RBL（健康、轻度、中度、重度）分类精度为0.76
Kurt-Bayrakdar S (2024) ^[22]	土耳其		1 121张全景片，划分为训练集（80%）、验证集（10%）和测试集（10%）		全景片	CNN		识别总牙周骨丧失、水平骨丧失、垂直骨丧失和根分叉病变区域；总牙槽骨丧失的灵敏度、精确率、F1评分和准确率分别为1.00、0.99、0.99、0.99
Lee CT (2022)^[23]	美国		693张根尖片，分别随机分为训练集（70%）、验证集（10%）和测试集（20%）		根尖片	根尖片CNN		模型在无骨质丧失、Ⅰ期、Ⅱ期和Ⅲ期的RBL 分期分配的受试者工作特征曲线下面积分别为0.98、0.89、0.90 和0.90
Li HY (2021)^[24]	中国		苏州数据集：共302张，训练集（n=241，80%），测试集（n=61，20%）；中山数据集：204张，训练集（n=163，80%），测试集（n=41，20%）		全景片	全景片Deetal-Perio		Deetal Perio在苏州数据集上牙周炎预测任务的Macro F1评分和准确率分别达到0.89和0.90，在中山数据集上分别达到0.82和0.82
Liu Q (2023)^[25]	中国		中国南昌大学附属第二医院数据集：1 924张，训练集1 276例，验证376例；测试集272例。江西中医药大学附属医院数据集：351张（作为第二组测试集）		全景片	PAR-CNN		模型的灵敏度为79.5%，特异度为78.4%；模型、牙周专家和普通牙科医师的准确率分别为0.80、0.81 和0.69
Uzun Saylan BC (2023)^[26]	土耳其		685张划分为训练集（80%）、验证集（10%）和测试集（10%）		全景片	CNN		于8个区域（上切牙、上尖牙、上前磨牙、上磨牙、下切牙、下尖牙、下前磨牙、下磨牙）预测牙周骨丧失，总牙周骨丧失区域的检测灵敏度、精确率和F1评分为最低（0.75、0.76、0.76），而上颌切牙区获得最大值
Shon HS (2022)^[27]	韩国		韩国CBNUH数据集（源自韩国忠北大学医院）：原始87张，图像增强后得1 044张，训练集为70%，测试集为30%，用于RBL和釉牙骨质界检测；AIHub数据集（源自AIHub平台）：4 010张，训练集为70%，测试集为30%，用于识别牙齿编号和长度		全景片	全景片U-Net和YOLOv5		根据RBL水平和牙周炎分期分为4个阶段；该框架在所有4个阶段的平均准确率为0.92，召回率和精确率分别为0.81和0.72
Tsoromokos N (2022)^[28]	荷兰		荷兰54例患者共446张下颌根尖片，划分为训练集（n=327张）、验证集（n=49张）和测试集（n=70张）		根尖片	CNN		对下颌根尖片进行手动注释（manually annotated，MA）关键点，对RBL占根长的百分比进行分析，测试集中CNN预测的平均值为（23.10±11.80）% RBL，而MA的相应值为（27.80±13.80）% RBL；组内相关系数（intraclass correlation coefficient，ICC）为0.60（P<0.001），可靠性为中等

表2 纳入研究的一般特征

本文的其它图/表