Grazas por visitar Nature.com. A versión do navegador que está a usar ten soporte CSS limitado. Para obter os mellores resultados, recomendamos usar unha versión máis recente do seu navegador (ou desactivar o modo de compatibilidade en Internet Explorer). Mentres tanto, para garantir o apoio continuo, mostramos o sitio sen estilo nin JavaScript.
Os dentes considéranse o indicador máis preciso da idade do corpo humano e adoitan usarse na avaliación da idade forense. Pretendemos validar as estimacións de idade dental baseadas na minaría de datos comparando o rendemento de precisión e clasificación de estimación do limiar de 18 anos con métodos tradicionais e estimacións de idade baseadas na minaría de datos. Recolléronse un total de 2657 radiografías panorámicas de cidadáns coreanos e xaponeses de 15 a 23 anos. Dividíronse nun conxunto de adestramento, cada un con 900 radiografías coreanas e un conxunto de probas interno que contén 857 radiografías xaponesas. Comparamos a precisión da clasificación e a eficiencia dos métodos tradicionais con conxuntos de probas de modelos de minería de datos. A precisión do método tradicional no conxunto de probas interno é lixeiramente superior á do modelo de minería de datos, e a diferenza é pequena (erro absoluto medio <0,21 anos, erro cadrado medio raíz <0,24 anos). O rendemento de clasificación para o corte de 18 anos tamén é similar entre métodos tradicionais e modelos de minería de datos. Así, os métodos tradicionais pódense substituír por modelos de minería de datos ao realizar unha avaliación de idade forense usando a madurez dos segundos e terceiros molares en adolescentes coreanos e adultos novos.
A estimación da idade dental é amplamente utilizada en medicina forense e odontoloxía pediátrica. En particular, debido á alta correlación entre a idade cronolóxica e o desenvolvemento dental, a avaliación por idade por etapas de desenvolvemento dental é un criterio importante para avaliar a idade de nenos e adolescentes1,2,3. Non obstante, para os mozos, estimar a idade dental baseada na madurez dental ten as súas limitacións porque o crecemento dental é case completo, coa excepción dos terceiros molares. O propósito legal de determinar a idade dos mozos e adolescentes é proporcionar estimacións precisas e evidencias científicas de se alcanzaron a maioría de idade. Na práctica medico-legal de adolescentes e adultos novos en Corea, a idade estímase mediante o método de Lee, e un limiar legal de 18 anos foi previsto en base aos datos reportados por Oh et al 5.
A aprendizaxe automática é un tipo de intelixencia artificial (AI) que aprende repetidamente e clasifica grandes cantidades de datos, resolve problemas por si só e impulsa a programación de datos. A aprendizaxe automática pode descubrir patróns útiles no oculto en grandes volumes de datos6. En contraste, os métodos clásicos, que son intensivos no traballo e que levan moito tempo, poden ter limitacións ao tratar con grandes volumes de datos complexos difíciles de procesar manualmente7. Polo tanto, moitos estudos realizáronse recentemente utilizando as últimas tecnoloxías informáticas para minimizar os erros humanos e procesar de xeito eficiente os datos multidimensionais 8,9,10,11,12. En particular, a aprendizaxe profunda foi moi utilizada na análise de imaxes médicas, e informouse diversos métodos para a estimación de idade analizando automaticamente radiografías para mellorar a precisión e a eficiencia da estimación de idade13,14,15,16,17,18,19,20 . Por exemplo, Halabi et al 13 desenvolveron un algoritmo de aprendizaxe de máquinas baseado en redes neuronais convolutivas (CNN) para estimar a idade esquelética mediante radiografías das mans dos nenos. Este estudo propón un modelo que aplica a aprendizaxe automática a imaxes médicas e demostra que estes métodos poden mellorar a precisión diagnóstica. Li et al14 estimou a idade a partir de imaxes de raios X pélvicos usando un CNN de aprendizaxe profunda e comparounos cos resultados da regresión mediante a estimación da fase de osificación. Descubriron que o modelo CNN de aprendizaxe profunda mostrou o mesmo rendemento de estimación de idade que o modelo de regresión tradicional. O estudo de Guo et al. [15] evaluou o rendemento de clasificación de tolerancia á idade da tecnoloxía CNN baseada en ortofos dentais, e os resultados do modelo CNN demostraron que os humanos superaron o seu rendemento de clasificación de idade.
A maioría dos estudos sobre estimación de idade mediante aprendizaxe de máquinas utilizan métodos de aprendizaxe profunda13,14,15,16,17,18,19,20. A estimación de idade baseada na aprendizaxe profunda é máis precisa que os métodos tradicionais. Non obstante, este enfoque ofrece pouca oportunidade para presentar a base científica para as estimacións de idade, como os indicadores de idade empregados nas estimacións. Tamén hai unha disputa legal sobre quen realiza as inspeccións. Polo tanto, a estimación de idade baseada na aprendizaxe profunda é difícil de aceptar por parte das autoridades administrativas e xudiciais. A minería de datos (DM) é unha técnica que pode descubrir non só a información, senón tamén información inesperada como método para descubrir correlacións útiles entre grandes cantidades de datos 6,21,22. A aprendizaxe automática úsase a miúdo na minería de datos e tanto a minería de datos como a aprendizaxe automática usan os mesmos algoritmos clave para descubrir patróns nos datos. A estimación de idade mediante o desenvolvemento dental baséase na avaliación do examinador da madurez dos dentes diana, e esta avaliación exprésase como un escenario para cada dente de destino. DM pódese usar para analizar a correlación entre a etapa de avaliación dental e a idade real e ten o potencial de substituír a análise estatística tradicional. Polo tanto, se aplicamos técnicas de DM á estimación de idade, podemos implementar a aprendizaxe automática na estimación de idade forense sen preocuparse pola responsabilidade legal. Publicáronse varios estudos comparativos sobre posibles alternativas aos métodos manuais tradicionais empregados na práctica forense e os métodos baseados en EBM para determinar a idade dental. Shen et al23 demostraron que o modelo DM é máis preciso que a fórmula tradicional do Camerer. Galibourg et al24 aplicaron diferentes métodos DM para predecir a idade segundo o criterio Demirdjian25 e os resultados demostraron que o método DM superou os métodos Demirdjian e Willems na estimación da idade da poboación francesa.
Para estimar a idade dental de adolescentes coreanos e adultos novos, o método 4 de Lee é moi utilizado na práctica forense coreana. Este método usa análises estatísticas tradicionais (como a regresión múltiple) para examinar a relación entre suxeitos coreanos e idade cronolóxica. Neste estudo, os métodos de estimación de idade obtidos mediante métodos estatísticos tradicionais defínense como "métodos tradicionais". O método de Lee é un método tradicional e a súa precisión foi confirmada por OH et al. 5; Non obstante, a aplicabilidade da estimación de idade baseada no modelo DM na práctica forense coreana segue sendo cuestionable. O noso obxectivo era validar científicamente a potencial utilidade da estimación de idade baseada no modelo DM. O propósito deste estudo foi (1) comparar a precisión de dous modelos DM na estimación da idade dental e (2) para comparar o rendemento de clasificación de 7 modelos DM á idade de 18 anos cos obtidos usando métodos estatísticos tradicionais madurez do segundo e terceiros molares en ambas as mandíbulas.
Os medios e as desviacións estándar da idade cronolóxica por etapa e o tipo de dentes móstranse en liña na táboa complementaria S1 (conxunto de adestramento), na táboa complementaria S2 (proba interna) e na táboa complementaria S3 (conxunto de probas externas). Os valores Kappa para a fiabilidade intra e interobserver obtidos do conxunto de adestramento foron 0,951 e 0,947, respectivamente. Os valores P e os intervalos de confianza do 95% para os valores de Kappa móstranse na táboa complementaria en liña S4. O valor kappa interpretouse como "case perfecto", consistente cos criterios de Landis e Koch26.
Ao comparar un erro absoluto medio (MAE), o método tradicional supera lixeiramente o modelo DM para todos os sexos e no conxunto de probas masculinas externas, con excepción do perceptrón multicapa (MLP). A diferenza entre o modelo tradicional e o modelo DM no conxunto de probas MAE interno foi de 0,12-0,19 anos para homes e 0,17-0,21 anos para as mulleres. Para a batería de proba externa, as diferenzas son máis pequenas (0,001-0,05 anos para homes e 0,05-0,09 anos para as mulleres). Ademais, o erro cadrado medio da raíz (RMSE) é lixeiramente inferior ao método tradicional, con diferenzas máis pequenas (0,17-0,24, 0,2-0,24 para o conxunto de probas interno masculino e 0,03-0,07, 0,04-0,08 para o conxunto de probas externas). ). MLP mostra un rendemento lixeiramente mellor que o perceptron dunha soa capa (SLP), excepto no caso do conxunto de probas externas femininas. Para MAE e RMSE, o conxunto de probas externo é superior ao conxunto de probas interno para todos os sexos e modelos. Todos os MAE e RMSE móstranse na táboa 1 e na figura 1.
MAE e RMSE de modelos de regresión tradicional e de minería de datos. Medio Erro absoluto MAE, Erro cadrado medio de raíz RMSE, única capa Perceptron SLP, MLP de perceptron multicapa, método tradicional CM.
O rendemento de clasificación (cun corte de 18 anos) dos modelos tradicionais e DM demostrouse en termos de sensibilidade, especificidade, valor preditivo positivo (PPV), valor preditivo negativo (NPV) e área baixo o receptor que opera curva característica (AUROC) 27 (Táboa 2, Figura 2 e Figura complementaria 1 en liña). En termos da sensibilidade da batería de proba interna, os métodos tradicionais realizados mellor entre os homes e peor entre as mulleres. Non obstante, a diferenza de rendemento de clasificación entre os métodos tradicionais e a SD é do 9,7% para os homes (MLP) e só o 2,4% para as mulleres (xgboost). Entre os modelos DM, a regresión loxística (LR) mostrou unha mellor sensibilidade nos dous sexos. Respecto á especificidade do conxunto de probas interno, observouse que os catro modelos SD funcionaban ben nos machos, mentres que o modelo tradicional funcionaba mellor nas mulleres. As diferenzas no rendemento de clasificación para homes e mulleres son do 13,3% (MLP) e do 13,1% (MLP), respectivamente, o que indica que a diferenza de rendemento de clasificación entre os modelos supera a sensibilidade. Entre os modelos DM, a máquina vectorial de soporte (SVM), a árbore de decisións (DT) e os modelos de bosque aleatorio (RF) realizáronse mellor entre os homes, mentres que o modelo LR foi mellor entre as mulleres. O AUROC do modelo tradicional e todos os modelos SD foi superior a 0,925 (veciño K-Nearest (KNN) en homes), demostrando un excelente rendemento de clasificación na discriminación de mostras de 18 anos28 de 18 anos. Para o conxunto de probas externas, houbo unha diminución do rendemento de clasificación en termos de sensibilidade, especificidade e AUROC en comparación co conxunto de probas interno. Ademais, a diferenza de sensibilidade e especificidade entre o rendemento de clasificación dos mellores e peores modelos oscilou entre o 10% e o 25% e foi maior que a diferenza no conxunto de probas interno.
Sensibilidade e especificidade dos modelos de clasificación de minería de datos en comparación cos métodos tradicionais cun corte de 18 anos. KNN K veciño máis próximo, máquina vectorial de soporte SVM, regresión loxística LR, árbore de decisións DT, RF Random Forest, XGB XGBOOST, MLP Multianapa Perceptron, método tradicional CM.
O primeiro paso neste estudo foi comparar a precisión das estimacións de idade dental obtidas de sete modelos DM cos obtidos usando a regresión tradicional. MAE e RMSE foron avaliados en conxuntos de probas internas para ambos sexos, e a diferenza entre o método tradicional e o modelo DM oscilou entre os 44 e os 77 días para MAE e de 62 a 88 días para RMSE. Aínda que o método tradicional foi lixeiramente máis preciso neste estudo, é difícil concluír se unha diferenza tan pequena ten importancia clínica ou práctica. Estes resultados indican que a precisión da estimación da idade dental usando o modelo DM é case a mesma que a do método tradicional. A comparación directa cos resultados de estudos anteriores é difícil porque ningún estudo comparou a precisión dos modelos DM cos métodos estatísticos tradicionais empregando a mesma técnica de gravar dentes no mesmo rango de idade que neste estudo. Galibourg et al24 compararon MAE e RMSE entre dous métodos tradicionais (Demirjian Method25 e Willems Method29) e 10 modelos DM nunha poboación francesa de 2 a 24 anos. Informaron de que todos os modelos DM eran máis precisos que os métodos tradicionais, con diferenzas de 0,20 e 0,38 anos en MAE e 0,25 e 0,47 anos en RMSE en comparación cos métodos Willems e Demirdjian, respectivamente. A discrepancia entre o modelo SD e os métodos tradicionais mostrados no estudo de Halibourg ten en conta numerosos informes 30,31,32,33 de que o método Demirdjian non estima con precisión a idade dental en poboacións distintas dos canadenses franceses en que se baseou o estudo. Neste estudo. Tai et al 34 utilizaron o algoritmo MLP para predecir a idade do dente de 1636 fotografías ortodontas chinesas e comparou a súa precisión cos resultados do método Demirjian e Willems. Informaron de que o MLP ten maior precisión que os métodos tradicionais. A diferenza entre o método Demirdjian e o método tradicional é <0,32 anos, e o método Willems é de 0,28 anos, o que é similar aos resultados do presente estudo. Os resultados destes estudos anteriores24,34 tamén son consistentes cos resultados do presente estudo, e a precisión de estimación de idade do modelo DM e do método tradicional son similares. Non obstante, en función dos resultados presentados, só podemos concluír con cautela que o uso de modelos DM para estimar a idade pode substituír os métodos existentes debido á falta de estudos anteriores comparativos e de referencia. Son necesarios estudos de seguimento que utilizan mostras máis grandes para confirmar os resultados obtidos neste estudo.
Entre os estudos que proban a precisión da SD na estimación da idade dental, algúns mostraron unha maior precisión que o noso estudo. Stepanovsky et al 35 aplicaron 22 modelos SD a radiografías panorámicas de 976 residentes checos de 2,7 a 20,5 anos e probaron a precisión de cada modelo. Avaliaron o desenvolvemento dun total de 16 dentes permanentes superiores e baixos utilizando os criterios de clasificación propostos por Moorrees et al 36. O MAE oscila entre 0,64 e 0,94 anos e o RMSE oscila entre 0,85 e 1,27 anos, que son máis precisos que os dous modelos DM empregados neste estudo. Shen et al23 usaron o método Cameriere para estimar a idade dental de sete dentes permanentes na mandíbula esquerda en residentes chineses do leste de 5 a 13 anos e comparárono con idades estimadas usando regresión lineal, SVM e RF. Demostraron que os tres modelos DM teñen maior precisión en comparación coa fórmula tradicional de Cameriere. O MAE e o RMSE no estudo de Shen foron inferiores aos do modelo DM neste estudo. A maior precisión dos estudos de Stepanovsky et al. 35 e Shen et al. 23 pode deberse á inclusión de suxeitos máis novos nas súas mostras de estudo. Debido a que as estimacións de idade para os participantes con dentes en desenvolvemento fanse máis precisas a medida que o número de dentes aumenta durante o desenvolvemento dental, a precisión do método de estimación de idade resultante pode verse comprometido cando os participantes no estudo son máis novos. Ademais, o erro de MLP na estimación de idade é lixeiramente menor que o SLP, o que significa que o MLP é máis preciso que o SLP. MLP considérase lixeiramente mellor para a estimación de idade, posiblemente debido ás capas ocultas en MLP38. Non obstante, hai unha excepción para a mostra externa de mulleres (SLP 1,45, MLP 1,49). A constatación de que o MLP é máis preciso que o SLP na avaliación da idade require estudos retrospectivos adicionais.
Tamén se comparou o rendemento de clasificación do modelo DM e o método tradicional nun limiar de 18 anos. Todos os modelos SD probados e métodos tradicionais no conxunto de probas interno mostraron niveis de discriminación practicamente aceptables para a mostra de 18 anos. A sensibilidade para homes e mulleres foi superior ao 87,7% e o 94,9%, respectivamente, e a especificidade foi superior ao 89,3% e o 84,7%. O AUROC de todos os modelos probados tamén supera o 0,925. Segundo o noso coñecemento, ningún estudo probou o rendemento do modelo DM para a clasificación de 18 anos baseado na madurez dental. Podemos comparar os resultados deste estudo co rendemento de clasificación de modelos de aprendizaxe profunda en radiografías panorámicas. Guo et al.15 calcularon o rendemento de clasificación dun modelo de aprendizaxe profunda baseado en CNN e un método manual baseado no método de Demirjian para un certo limiar de idade. A sensibilidade e especificidade do método manual foron do 87,7% e do 95,5%, respectivamente, e a sensibilidade e especificidade do modelo CNN superaron o 89,2% e o 86,6%, respectivamente. Concluíron que os modelos de aprendizaxe profunda poden substituír ou superar a avaliación manual na clasificación dos limiares de idade. Os resultados deste estudo mostraron un rendemento de clasificación similar; Crese que a clasificación mediante modelos DM pode substituír os métodos estatísticos tradicionais para a estimación de idade. Entre os modelos, DM LR foi o mellor modelo en termos de sensibilidade para a mostra masculina e a sensibilidade e a especificidade para a mostra feminina. LR ocupa o segundo posto en especificidade para os homes. Ademais, considérase que LR é un dos modelos DM35 máis fácil de usar e é menos complexo e difícil de procesar. Con base nestes resultados, LR foi considerado o mellor modelo de clasificación de corte para nenos de 18 anos na poboación coreana.
En xeral, a precisión da estimación de idade ou o rendemento de clasificación no conxunto de probas externas foi deficiente ou inferior en comparación cos resultados do conxunto de probas interno. Algúns informes indican que a precisión ou eficiencia da clasificación diminúe cando as estimacións de idade en función da poboación coreana se aplican á poboación xaponesa 5,39, e un patrón similar atopouse no presente estudo. Esta tendencia de deterioro tamén se observou no modelo DM. Polo tanto, para estimar con precisión a idade, incluso cando se usa DM no proceso de análise, deberían preferirse métodos derivados de datos de poboación autóctona, como métodos tradicionais ,5,39,40,41,42. Dado que non está claro se os modelos de aprendizaxe profunda poden mostrar tendencias similares, estudos que comparan a precisión e eficiencia da clasificación mediante métodos tradicionais, modelos DM e modelos de aprendizaxe profunda nas mesmas mostras son necesarios para confirmar se a intelixencia artificial pode superar estas disparidades raciais en idade limitada. avaliacións.
Demostramos que os métodos tradicionais poden ser substituídos por estimación de idade baseada no modelo DM na práctica de estimación de idade forense en Corea. Tamén descubrimos a posibilidade de implementar a aprendizaxe automática para a avaliación da idade forense. Non obstante, hai limitacións claras, como o número insuficiente de participantes neste estudo para determinar definitivamente os resultados e a falta de estudos anteriores para comparar e confirmar os resultados deste estudo. No futuro, os estudos de DM deberían realizarse con maior número de mostras e poboacións máis diversas para mellorar a súa aplicabilidade práctica en comparación cos métodos tradicionais. Para validar a viabilidade de usar a intelixencia artificial para estimar a idade en múltiples poboacións, son necesarios estudos futuros para comparar a precisión da clasificación e a eficiencia de DM e modelos de aprendizaxe profunda con métodos tradicionais nas mesmas mostras.
O estudo empregou 2.657 fotografías ortográficas recollidas de adultos coreanos e xaponeses de 15 a 23 anos. As radiografías coreanas dividíronse en 900 conxuntos de adestramento (19,42 ± 2,65 anos) e 900 conxuntos de probas internas (19,52 ± 2,59 anos). O conxunto de formación foi recollido nunha institución (Hospital de Seúl St. Mary), e o propio conxunto de probas foi recollido en dúas institucións (Hospital Dental da Universidade Nacional de Seúl e Hospital Dental da Universidade de Yonsei). Tamén recollemos 857 radiografías doutros datos baseados na poboación (IWATE Medical University, Xapón) para probas externas. Seleccionáronse radiografías de suxeitos xaponeses (19,31 ± 2,60 anos) como conxunto de probas externas. Os datos foron recollidos retrospectivamente para analizar as etapas do desenvolvemento dental en radiografías panorámicas tomadas durante o tratamento dental. Todos os datos recollidos foron anónimos, excepto o xénero, a data de nacemento e a data da radiografía. Os criterios de inclusión e exclusión foron os mesmos que os estudos 4, 5 publicados anteriormente. A idade real da mostra calculouse restando a data de nacemento desde a data na que se tomou a radiografía. O grupo de mostras dividiuse en nove grupos de idade. As distribucións de idade e sexo móstranse na táboa 3 Este estudo realizouse de acordo coa Declaración de Helsinki e aprobado polo Consello de Revisión Institucional (IRB) do Hospital de Santa María da Universidade Católica de Corea (KC22WISI0328). Debido ao deseño retrospectivo deste estudo, non se puido obter o consentimento informado de todos os pacientes sometidos a un exame radiográfico con fins terapéuticos. O Hospital de Santa María da Universidade de Seúl) renunciou ao requisito de consentimento informado.
As etapas de desenvolvemento dos segundos e terceiros molares bimaxilares foron avaliadas segundo os criterios Demircan25. Só se seleccionou un dente se se atopaba o mesmo tipo de dente nos lados esquerdo e dereito de cada mandíbula. Se os dentes homólogos por ambos os dous lados estivesen en diferentes etapas de desenvolvemento, o dente coa fase de desenvolvemento inferior foi seleccionado para dar conta da incerteza na idade estimada. Dous observadores experimentados foron marcados por cen radiografías seleccionadas ao azar do conxunto de adestramento para probar a fiabilidade do interobserver despois da precalibración para determinar a etapa de madurez dental. O observador primario avaliou dúas veces a fiabilidade intraobserver en intervalos de tres meses.
A etapa de sexo e desenvolvemento da segunda e terceira molares de cada mandíbula no conxunto de adestramento foi estimada por un observador primario adestrado con diferentes modelos DM, e a idade real estableceuse como valor obxectivo. Os modelos SLP e MLP, que son moi utilizados na aprendizaxe de máquinas, probáronse con algoritmos de regresión. O modelo DM combina funcións lineais empregando as etapas de desenvolvemento dos catro dentes e combina estes datos para estimar a idade. SLP é a rede neuronal máis sinxela e non contén capas ocultas. SLP funciona baseado na transmisión de limiares entre nodos. O modelo SLP en regresión é matematicamente similar á regresión lineal múltiple. A diferenza do modelo SLP, o modelo MLP ten varias capas ocultas con funcións de activación non lineais. Os nosos experimentos usaron unha capa oculta con só 20 nodos ocultos con funcións de activación non lineais. Use o descenso de gradiente como método de optimización e MAE e RMSE como función de perda para adestrar o noso modelo de aprendizaxe de máquinas. O modelo de regresión mellor obtido aplicouse aos conxuntos de probas internas e externas e estimouse a idade dos dentes.
Desenvolveuse un algoritmo de clasificación que usa a madurez de catro dentes no conxunto de adestramento para predicir se unha mostra ten 18 anos ou non. Para construír o modelo, derivamos sete algoritmos de aprendizaxe de máquinas de representación6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST e (7) MLP . LR é un dos algoritmos de clasificación máis utilizados44. É un algoritmo de aprendizaxe supervisado que usa a regresión para predecir a probabilidade de datos pertencentes a unha determinada categoría de 0 a 1 e clasifica os datos como pertencentes a unha categoría máis probable baseada nesta probabilidade; usado principalmente para a clasificación binaria. KNN é un dos algoritmos de aprendizaxe de máquinas máis sinxelas45. Cando se lles dá novos datos de entrada, atopa k datos K próximos ao conxunto existente e logo clasifícaos na clase con maior frecuencia. Establecemos 3 para o número de veciños considerados (k). SVM é un algoritmo que maximiza a distancia entre dúas clases empregando unha función do núcleo para ampliar o espazo lineal nun espazo non lineal chamado Fields46. Para este modelo, empregamos sesgo = 1, potencia = 1 e gamma = 1 como hiperparametros para o núcleo polinomial. A DT aplicouse en varios campos como algoritmo para dividir un conxunto de datos enteiro en varios subgrupos representando as regras de decisión nunha estrutura da árbore47. O modelo está configurado cun número mínimo de rexistros por nodo de 2 e usa o índice Gini como medida de calidade. RF é un método de conxunto que combina varios DTs para mellorar o rendemento mediante un método de agregación de arranque que xera un clasificador débil para cada mostra debuxando de xeito aleatorio mostras do mesmo tamaño varias veces a partir do conxunto de datos orixinal48. Usamos 100 árbores, 10 profundidades de árbores, 1 tamaño mínimo do nodo e índice de mestura de gini como criterios de separación de nodos. A clasificación de novos datos está determinada por un voto maioritario. XGBoost é un algoritmo que combina as técnicas de impulso empregando un método que leva como datos de formación o erro entre os valores reais e os previstos do modelo anterior e aumenta o erro usando gradientes49. É un algoritmo moi utilizado debido ao seu bo rendemento e eficiencia dos recursos, así como a alta fiabilidade como función de corrección de exceso. O modelo está equipado con 400 rodas de soporte. MLP é unha rede neuronal na que un ou varios perceptróns forman varias capas cunha ou varias capas ocultas entre as capas de entrada e saída38. Usando isto, pode realizar unha clasificación non lineal onde cando engades unha capa de entrada e obter un valor de resultado, o valor de resultado previsto compárase co valor de resultado real e o erro é propagado de volta. Creamos unha capa oculta con 20 neuronas ocultas en cada capa. Cada modelo que desenvolvemos aplicouse a conxuntos internos e externos para probar o rendemento da clasificación calculando a sensibilidade, especificidade, PPV, NPV e AUROC. A sensibilidade defínese como a relación dunha mostra que se estima a 18 anos ou máis a unha mostra que se estima a 18 anos ou máis. A especificidade é a proporción de mostras menores de 18 anos e as que se estiman menores de 18 anos.
As etapas dentais avaliadas no conxunto de adestramento convertéronse en etapas numéricas para a análise estatística. Realizáronse a regresión lineal e loxística multivariante para desenvolver modelos predictivos para cada sexo e derivar fórmulas de regresión que se poden usar para estimar a idade. Utilizamos estas fórmulas para estimar a idade do dente tanto para conxuntos de probas internas como externas. A táboa 4 mostra os modelos de regresión e clasificación empregados neste estudo.
A fiabilidade intra e interobserver calculouse mediante a estatística Kappa de Cohen. Para probar a precisión de DM e modelos de regresión tradicional, calculamos MAE e RMSE usando as idades estimadas e reais dos conxuntos de probas internas e externas. Estes erros úsanse normalmente para avaliar a precisión das predicións do modelo. Canto menor sexa o erro, maior será a precisión da previsión24. Compara o MAE e RMSE de conxuntos de probas internas e externas calculadas mediante DM e regresión tradicional. O rendemento de clasificación do corte de 18 anos nas estatísticas tradicionais avaliouse mediante unha táboa de continxencia 2 × 2. Comparáronse a sensibilidade calculada, especificidade, PPV, NPV e AUROC do conxunto de probas cos valores medidos do modelo de clasificación DM. Os datos exprésanse como media ± desviación estándar ou número (%) dependendo das características dos datos. Os valores P de dúas caras <0,05 consideráronse estatísticamente significativos. Todas as análises estatísticas rutineiras realizáronse usando a versión 9.4 de SAS (SAS Institute, Cary, NC). O modelo de regresión DM foi implementado en Python usando KERAS50 2.2.4 Backend e TensorFlow51 1.8.0 específicamente para operacións matemáticas. O modelo de clasificación DM foi implementado no ambiente de análise de coñecemento Waikato e na plataforma de análise de Konstanz Information Miner (KNIME) 4.6.152.
Os autores recoñecen que os datos que apoian as conclusións do estudo pódense atopar no artigo e nos materiais complementarios. Os conxuntos de datos xerados e/ou analizados durante o estudo están dispoñibles do autor correspondente por solicitude razoable.
Ritz-Timme, S. et al. Avaliación da idade: estado da arte para cumprir os requisitos específicos da práctica forense. Internacionalidade. J. Medicina Xurídica. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., e Olze, A. Estado actual da avaliación da idade forense dos suxeitos vivos con fins de acusación penal. Forenses. medicina. Patoloxía. 1, 239-246 (2005).
Pan, J. et al. Un método modificado para avaliar a idade dental de nenos de 5 a 16 anos no leste de China. Clínico. Enquisa oral. 25, 3463–3474 (2021).
Lee, SS etc. Cronoloxía do desenvolvemento de segundos e terceiros molares en coreanos e a súa aplicación para a avaliación da idade forense. Internacionalidade. J. Medicina Xurídica. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy e Lee, precisión da estimación de idade e estimación do limiar de 18 anos baseándose na madurez do segundo e terceiro molar en coreanos e xaponeses. PLoS ONE 17, E0271247 (2022).
Kim, JY, et al. A análise de datos baseada na aprendizaxe automática preoperatoria pode predicir o resultado do tratamento da cirurxía do sono en pacientes con OSA. a ciencia. Informe 11, 14911 (2021).
Han, M. et al. Estimación de idade precisa da aprendizaxe automática con ou sen intervención humana? Internacionalidade. J. Medicina Xurídica. 136, 821–831 (2022).
Khan, S. e Shaheen, M. Da minería de datos ata a minería de datos. J.información. a ciencia. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. e Shaheen, M. Wisrule: O primeiro algoritmo cognitivo para a minería de regras de asociación. J.información. a ciencia. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. e Abdullah U. Karm: Minería de datos tradicional baseada en regras de asociación baseadas no contexto. Calcula. Matt. Continuar. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. e Habib M. Detección de semellanza semántica baseada en aprendizaxe profunda mediante datos de texto. informar. tecnoloxías. control. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., e Shahin, M. Un sistema para recoñecer a actividade en vídeos deportivos. multimedia. Aplicacións de ferramentas https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge en idade ósea pediátrica. Radioloxía 290, 498–503 (2019).
Li, Y. et al. Estimación de idade forense a partir de raios X pélvicos mediante aprendizaxe profunda. Euro. radiación. 29, 2322–2329 (2019).
Guo, YC, et al. Clasificación de idade precisa mediante métodos manuais e redes neuronais convolutivas profundas a partir de imaxes de proxección ortográfica. Internacionalidade. J. Medicina Xurídica. 135, 1589–1597 (2021).
Alabama Dalora et al. Estimación da idade ósea mediante diferentes métodos de aprendizaxe de máquinas: unha revisión sistemática da literatura e metaanálise. PLoS One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., e Yang, J. Estimación de idade específica da poboación de afroamericanos e chineses baseándose nos volumes da cámara de celulosa de primeiros molares mediante tomografía computarizada con feixe cono. Internacionalidade. J. Medicina Xurídica. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK e OH KS Determinando grupos de idade de persoas vivas usando imaxes baseadas na intelixencia artificial de primeiros molares. a ciencia. Informe 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., e Urschler, M. Estimación de idade automática e clasificación de idade maioritaria a partir de datos de resonancia magnética multivariante. IEEE J. Biomed. Alertas de saúde. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. e Li, G. Estimación de idade baseada na segmentación da cámara de pulpa 3D de primeiros molares da tomografía computada de feixe de cono ao integrar conxuntos de aprendizaxe profunda e nivel. Internacionalidade. J. Medicina Xurídica. 135, 365–373 (2021).
Wu, Wt, et al. Minería de datos en big data clínica: bases de datos comúns, pasos e métodos. Mundo. medicina. recurso. 8, 44 (2021).
Yang, J. et al. Introdución a bases de datos médicas e tecnoloxías de minería de datos na era Big Data. J. Avid. Medicina básica. 13, 57–69 (2020).
Shen, S. et al. Método do Camerer para estimar a idade dos dentes mediante aprendizaxe de máquinas. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Comparación de diferentes métodos de aprendizaxe de máquinas para predecir a idade dental mediante o método de escenificación Demirdjian. Internacionalidade. J. Medicina Xurídica. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. e Tanner, JM Un novo sistema para avaliar a idade dental. Snort. Bioloxía. 45, 211–227 (1973).
Landis, JR e Koch, GG medidas de acordo de observador sobre datos categóricos. Biometría 33, 159-174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK e Choi HK. Análise textual, morfolóxica e estatística de imaxes de resonancia magnética bidimensional mediante técnicas de intelixencia artificial para a diferenciación de tumores cerebrais primarios. Información sanitaria. recurso. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Tempo de publicación: xaneiro-04-2024