图/表 详细信息

深度学习在检测牙周放射学骨丧失中的应用——系统评价与Meta分析
段晖, 鲁嘉韦, 贺梦柯, 罗礼君
《口腔颌面外科杂志》, 2025, 35(6): 438-447.   DOI: 10.12439/kqhm.1005-4979.2025.06.003

第一作者(发表年份) 国家 数据集 形式 算法 主要结果
Alotaibi G (2022) [10] 沙特阿拉伯 1 724张根尖片,将其划分为训练集(n=1 206,70%)、验证集(n=345,20%)和测试集(n=173,10%) 根尖片 CNN AI检测牙周炎的诊断准确率为73.00%,骨丧失严重程度分类的准确率为59.00%,AI检测是否存在骨吸收的灵敏度为73.00%,特异度为79.10%
Kurt S (2020) [11] 土耳其 2 276张全景片(1 137例为骨丧失病例,1 139例为牙周健康病例),训练集(n=1 856,927例为骨丧失病例,929例为健康病例)、验证集(n=210,105例为骨丧失病例,105例为健康病例)和测试集(n=210,105例为骨丧失病例,105例为健康病例) 全景片 CNN 判断是否存在牙周骨吸收,TP为99,TN为93,FP为12,FN为6;灵敏度、特异度、精确率、准确率,F1评分分别为0.94、0.88、0.89、0.91和0.91
Chang HJ (2020) [12] 韩国 340张全景片,使用图像增强以增加数据,图像数量比原来增加了64倍,划分为训练集(90%)和测试集(10%) 全景片 CNN 自动方法与放射科医生诊断的Pearson相关系数为0.73(P<0.01),整个颌骨的组内相关系数为0.91(P<0.01)
Chang J (2022) [13] 美国 236例患者的全口根尖片(1 836张),交叉验证,将收集到的数据集分为5组,使用3组作为训练集,1组作为验证集,其余1组用作测试集;数据增强:以15°的步长旋转获得5个副本 根尖片 InceptionV3 (CNN) 经5-fold交叉实验评估,该模型对于轻度(<15%)与重度(≥15%)骨丧失的分类平均准确率为0.87±0.01;该模型的灵敏度、特异度、阳性预测和阴性预测值分别为0.86±0.03、0.88±0.03、0.88±0.03和0.86±0.02
Chen IH (2024) [14] 中国 台湾数据集:训练集(n=82,牙齿:123)和测试集(n=336,牙齿:390);以15°的步长旋转,获得原图像的5个副本 根尖片 CNN 该模型与3位牙周病学医生评估的真实PBL程度之间的偏差为6.5%。对牙周炎分期的总Pearson相关系数为0.828 (P<0.01),总诊断准确率为72.80%;阈值=0.15时,灵敏度为97.00%,特异度为63.80%,阈值=0.33时,灵敏度为95.20%,特异度为89.60%
Danks RP (2021) [15] 英国 63例患者(340张根尖片),包含463、115和56颗单根、双根和三根牙齿;3-fold交叉实验验证,前2个子集被分为训练集和验证集,而第3个子集不可见,作为测试集 根尖片 Hourglass network 与临床医生对射线片的视觉评估相比,PBL的平均误差为10.69%,分期的准确率为58.00%
Dujic H (2023) [16] 德国 21 819张,训练集(n=18 819),测试集(n=3 000) 根尖片 CNN 使用和评估了5个视觉转换器网络,所有评估的变压器网络总体诊断准确率为83.40%~85.20%;根据RBL将牙齿分成4类,整体灵敏度为0.87~0.91,特异度为0.70~0.75
Hoss P (2023) [17] 德国 21 819张根尖片,划分为训练集(n=18 819)和测试集(n=3 000);通过随机旋转、调整亮度等增强图像数据 根尖片 CNN 5个CNN分别进行训练,灵敏度为0.89~0.91,特异度为0.66~0.71
Jiang LH (2022) [18] 中国 640张全景片,通过数据增强将DL的数据量增加到原来的4倍;划分为训练集(80%)和测试集(20%) 全景片 CNN 根据牙周骨吸收的百分比(<15.00%;15.00%~33.00%;>33.00%)分类,模型的整体分期准确率为0.77,灵敏度为0.77,特异度为0.88
Kim J (2019) [19] 韩国 12 179张全景片,划分为训练集(n=11 189)、验证集(n=190)、测试集(n=800);采用随机旋转、水平和垂直平移等增强图像数据 全景片 DeNTNet (CNN) 与专家评估结果(RBL存在与否)相比,DeNTNet灵敏度为0.77,特异度为0.95,F1评分为0.75,口腔临床医生F1评分为0.69,DeNTNet F1评分高于口腔临床医生
Kim SH (2022) [20] 韩国 11例患者(500张OCT),7例(400张图像)为训练集、2例(50张图像)为验证集、2例(50张图像)为测试集;训练图像水平翻转增加了2倍 OCT CNN 所有CNN模型显示,牙槽嵴顶和釉牙骨质界在XY坐标系中的平均绝对误差均小于0.25 mm,在0.50 mm时的成功检测率均大于90.00%
Kong ZM (2023) [21] 中国 1 747张全景片,按7∶1∶2的比例随机拆分为训练集、验证集和测试集 全景片 基于卷积神经网络的牙周炎诊断模型(periodontitis detection convolutional neural network,PDCNN) PDCNN在全景片数据集上的4类RBL(健康、轻度、中度、重度)分类精度为0.76
Kurt-Bayrakdar S (2024) [22] 土耳其 1 121张全景片,划分为训练集(80%)、验证集(10%)和测试集(10%) 全景片 CNN 识别总牙周骨丧失、水平骨丧失、垂直骨丧失和根分叉病变区域;总牙槽骨丧失的灵敏度、精确率、F1评分和准确率分别为1.00、0.99、0.99、0.99
Lee CT (2022)[23] 美国 693张根尖片,分别随机分为训练集(70%)、验证集(10%)和测试集(20%) 根尖片 根尖片CNN 模型在无骨质丧失、Ⅰ期、Ⅱ期和Ⅲ期的RBL 分期分配的受试者工作特征曲线下面积分别为0.98、0.89、0.90 和0.90
Li HY (2021)[24] 中国 苏州数据集:共302张,训练集(n=241,80%),测试集(n=61,20%);中山数据集:204张,训练集(n=163,80%),测试集(n=41,20%) 全景片 全景片Deetal-Perio Deetal Perio在苏州数据集上牙周炎预测任务的Macro F1评分和准确率分别达到0.89和0.90,在中山数据集上分别达到0.82和0.82
Liu Q (2023)[25] 中国 中国南昌大学附属第二医院数据集:1 924张,训练集1 276例,验证376例;测试集272例。江西中医药大学附属医院数据集:351张(作为第二组测试集) 全景片 PAR-CNN 模型的灵敏度为79.5%,特异度为78.4%;模型、牙周专家和普通牙科医师的准确率分别为0.80、0.81 和0.69
Uzun Saylan BC (2023)[26] 土耳其 685张划分为训练集(80%)、验证集(10%)和测试集(10%) 全景片 CNN 于8个区域(上切牙、上尖牙、上前磨牙、上磨牙、下切牙、下尖牙、下前磨牙、下磨牙)预测牙周骨丧失,总牙周骨丧失区域的检测灵敏度、精确率和F1评分为最低(0.75、0.76、0.76),而上颌切牙区获得最大值
Shon HS (2022)[27] 韩国 韩国CBNUH数据集(源自韩国忠北大学医院):原始87张,图像增强后得1 044张,训练集为70%,测试集为30%,用于RBL和釉牙骨质界检测;AIHub数据集(源自AIHub平台):4 010张,训练集为70%,测试集为30%,用于识别牙齿编号和长度 全景片 全景片U-Net和YOLOv5 根据RBL水平和牙周炎分期分为4个阶段;该框架在所有4个阶段的平均准确率为0.92,召回率和精确率分别为0.81和0.72
Tsoromokos N (2022)[28] 荷兰 荷兰54例患者共446张下颌根尖片,划分为训练集(n=327张)、验证集(n=49张)和测试集(n=70张) 根尖片 CNN 对下颌根尖片进行手动注释(manually annotated,MA)关键点,对RBL占根长的百分比进行分析,测试集中CNN预测的平均值为(23.10±11.80)% RBL,而MA的相应值为(27.80±13.80)% RBL;组内相关系数(intraclass correlation coefficient,ICC)为0.60(P<0.001),可靠性为中等
表2 纳入研究的一般特征
本文的其它图/表