| Alotaibi G (2022) [10] | 沙特阿拉伯 | | 1 724张根尖片,将其划分为训练集(n=1 206,70%)、验证集(n=345,20%)和测试集(n=173,10%) | | 根尖片 | CNN | | AI检测牙周炎的诊断准确率为73.00%,骨丧失严重程度分类的准确率为59.00%,AI检测是否存在骨吸收的灵敏度为73.00%,特异度为79.10% |
| Kurt S (2020) [11] | 土耳其 | | 2 276张全景片(1 137例为骨丧失病例,1 139例为牙周健康病例),训练集(n=1 856,927例为骨丧失病例,929例为健康病例)、验证集(n=210,105例为骨丧失病例,105例为健康病例)和测试集(n=210,105例为骨丧失病例,105例为健康病例) | | 全景片 | CNN | | 判断是否存在牙周骨吸收,TP为99,TN为93,FP为12,FN为6;灵敏度、特异度、精确率、准确率,F1评分分别为0.94、0.88、0.89、0.91和0.91 |
| Chang HJ (2020) [12] | 韩国 | | 340张全景片,使用图像增强以增加数据,图像数量比原来增加了64倍,划分为训练集(90%)和测试集(10%) | | 全景片 | CNN | | 自动方法与放射科医生诊断的Pearson相关系数为0.73(P<0.01),整个颌骨的组内相关系数为0.91(P<0.01) |
| Chang J (2022) [13] | 美国 | | 236例患者的全口根尖片(1 836张),交叉验证,将收集到的数据集分为5组,使用3组作为训练集,1组作为验证集,其余1组用作测试集;数据增强:以15°的步长旋转获得5个副本 | | 根尖片 | InceptionV3 (CNN) | | 经5-fold交叉实验评估,该模型对于轻度(<15%)与重度(≥15%)骨丧失的分类平均准确率为0.87±0.01;该模型的灵敏度、特异度、阳性预测和阴性预测值分别为0.86±0.03、0.88±0.03、0.88±0.03和0.86±0.02 |
| Chen IH (2024) [14] | 中国 | | 台湾数据集:训练集(n=82,牙齿:123)和测试集(n=336,牙齿:390);以15°的步长旋转,获得原图像的5个副本 | | 根尖片 | CNN | | 该模型与3位牙周病学医生评估的真实PBL程度之间的偏差为6.5%。对牙周炎分期的总Pearson相关系数为0.828 (P<0.01),总诊断准确率为72.80%;阈值=0.15时,灵敏度为97.00%,特异度为63.80%,阈值=0.33时,灵敏度为95.20%,特异度为89.60% |
| Danks RP (2021) [15] | 英国 | | 63例患者(340张根尖片),包含463、115和56颗单根、双根和三根牙齿;3-fold交叉实验验证,前2个子集被分为训练集和验证集,而第3个子集不可见,作为测试集 | | 根尖片 | Hourglass network | | 与临床医生对射线片的视觉评估相比,PBL的平均误差为10.69%,分期的准确率为58.00% |
| Dujic H (2023) [16] | 德国 | | 21 819张,训练集(n=18 819),测试集(n=3 000) | | 根尖片 | CNN | | 使用和评估了5个视觉转换器网络,所有评估的变压器网络总体诊断准确率为83.40%~85.20%;根据RBL将牙齿分成4类,整体灵敏度为0.87~0.91,特异度为0.70~0.75 |
| Hoss P (2023) [17] | 德国 | | 21 819张根尖片,划分为训练集(n=18 819)和测试集(n=3 000);通过随机旋转、调整亮度等增强图像数据 | | 根尖片 | CNN | | 5个CNN分别进行训练,灵敏度为0.89~0.91,特异度为0.66~0.71 |
| Jiang LH (2022) [18] | 中国 | | 640张全景片,通过数据增强将DL的数据量增加到原来的4倍;划分为训练集(80%)和测试集(20%) | | 全景片 | CNN | | 根据牙周骨吸收的百分比(<15.00%;15.00%~33.00%;>33.00%)分类,模型的整体分期准确率为0.77,灵敏度为0.77,特异度为0.88 |
| Kim J (2019) [19] | 韩国 | | 12 179张全景片,划分为训练集(n=11 189)、验证集(n=190)、测试集(n=800);采用随机旋转、水平和垂直平移等增强图像数据 | | 全景片 | DeNTNet (CNN) | | 与专家评估结果(RBL存在与否)相比,DeNTNet灵敏度为0.77,特异度为0.95,F1评分为0.75,口腔临床医生F1评分为0.69,DeNTNet F1评分高于口腔临床医生 |
| Kim SH (2022) [20] | 韩国 | | 11例患者(500张OCT),7例(400张图像)为训练集、2例(50张图像)为验证集、2例(50张图像)为测试集;训练图像水平翻转增加了2倍 | | OCT | CNN | | 所有CNN模型显示,牙槽嵴顶和釉牙骨质界在X和Y坐标系中的平均绝对误差均小于0.25 mm,在0.50 mm时的成功检测率均大于90.00% |
| Kong ZM (2023) [21] | 中国 | | 1 747张全景片,按7∶1∶2的比例随机拆分为训练集、验证集和测试集 | | 全景片 | 基于卷积神经网络的牙周炎诊断模型(periodontitis detection convolutional neural network,PDCNN) | | PDCNN在全景片数据集上的4类RBL(健康、轻度、中度、重度)分类精度为0.76 |
| Kurt-Bayrakdar S (2024) [22] | 土耳其 | | 1 121张全景片,划分为训练集(80%)、验证集(10%)和测试集(10%) | | 全景片 | CNN | | 识别总牙周骨丧失、水平骨丧失、垂直骨丧失和根分叉病变区域;总牙槽骨丧失的灵敏度、精确率、F1评分和准确率分别为1.00、0.99、0.99、0.99 |
| Lee CT (2022)[23] | 美国 | | 693张根尖片,分别随机分为训练集(70%)、验证集(10%)和测试集(20%) | | 根尖片 | 根尖片CNN | | 模型在无骨质丧失、Ⅰ期、Ⅱ期和Ⅲ期的RBL 分期分配的受试者工作特征曲线下面积分别为0.98、0.89、0.90 和0.90 |
| Li HY (2021)[24] | 中国 | | 苏州数据集:共302张,训练集(n=241,80%),测试集(n=61,20%);中山数据集:204张,训练集(n=163,80%),测试集(n=41,20%) | | 全景片 | 全景片Deetal-Perio | | Deetal Perio在苏州数据集上牙周炎预测任务的Macro F1评分和准确率分别达到0.89和0.90,在中山数据集上分别达到0.82和0.82 |
| Liu Q (2023)[25] | 中国 | | 中国南昌大学附属第二医院数据集:1 924张,训练集1 276例,验证376例;测试集272例。江西中医药大学附属医院数据集:351张(作为第二组测试集) | | 全景片 | PAR-CNN | | 模型的灵敏度为79.5%,特异度为78.4%;模型、牙周专家和普通牙科医师的准确率分别为0.80、0.81 和0.69 |
| Uzun Saylan BC (2023)[26] | 土耳其 | | 685张划分为训练集(80%)、验证集(10%)和测试集(10%) | | 全景片 | CNN | | 于8个区域(上切牙、上尖牙、上前磨牙、上磨牙、下切牙、下尖牙、下前磨牙、下磨牙)预测牙周骨丧失,总牙周骨丧失区域的检测灵敏度、精确率和F1评分为最低(0.75、0.76、0.76),而上颌切牙区获得最大值 |
| Shon HS (2022)[27] | 韩国 | | 韩国CBNUH数据集(源自韩国忠北大学医院):原始87张,图像增强后得1 044张,训练集为70%,测试集为30%,用于RBL和釉牙骨质界检测;AIHub数据集(源自AIHub平台):4 010张,训练集为70%,测试集为30%,用于识别牙齿编号和长度 | | 全景片 | 全景片U-Net和YOLOv5 | | 根据RBL水平和牙周炎分期分为4个阶段;该框架在所有4个阶段的平均准确率为0.92,召回率和精确率分别为0.81和0.72 |
| Tsoromokos N (2022)[28] | 荷兰 | | 荷兰54例患者共446张下颌根尖片,划分为训练集(n=327张)、验证集(n=49张)和测试集(n=70张) | | 根尖片 | CNN | | 对下颌根尖片进行手动注释(manually annotated,MA)关键点,对RBL占根长的百分比进行分析,测试集中CNN预测的平均值为(23.10±11.80)% RBL,而MA的相应值为(27.80±13.80)% RBL;组内相关系数(intraclass correlation coefficient,ICC)为0.60(P<0.001),可靠性为中等 |