Introdução
As fraturas da extremidade proximal do fêmur causam grande morbidade e mortalidade
a curto e médio prazo nos idosos,[1]
[2]
[3] sendo que um terço dos pacientes evolui para óbito em um ano, e metade se torna
dependente para locomoção.[4]
[5] Estas fraturas também podem acometer pacientes jovens vitimados por trauma de alta
energia.[4] O tratamento destas lesões requer a atuação de uma equipe multidisciplinar.[6] Estas lesões têm tratamento eminentemente cirúrgico e, para que se defina o melhor
tratamento, entre outros dados, é necessário que se classifique a fratura.
Um sistema ideal de classificação deve permitir a comunicação entre médicos, padronizar
a terminologia para pesquisa e guiar a decisão do tratamento.[6] Muitas tentativas de se criar um sistema de classificação de fraturas do fêmur proximal
foram descritas, sendo as classificações de Garden,[7] Evans,[8] Boyd e Griffin,[9] Tronzo[10] e do Arbeitsgemeinschaft für Osteosynthesefragen/Orthopaedic Trauma Association
(AO/OTA),[11] as mais conhecidas. A classificação AO/OTA tem evidência favorável de confiabilidade
na região trocantérica[12]
[13]
[14] e no colo do fêmur[15] quando comparada as outras classificações comumente utilizadas. Porém, suas ramificações
adicionais tendem a diminuir a confiança interobservadores[13]
[16] e requerem grande prática.[16]
[17]
A validação de uma classificação ocorre com a demonstração de alguns critérios: boa
correlação clínica, adequação em termos de concordância e acurácia e também validação
construtiva (relevância).[18] Preocupações com a terminologia e linha de fluxo complexa da classificação AO/OTA
prévia[19] motivaram a modernização da classificação. Entretanto, não localizamos estudos na
literatura sobre a confiabilidade desta nova versão.
Nesse sentido, este estudo teve como objetivos avaliar o grau de concordância intra
e interobservadores em cada subdivisão sequencial da nova classificação AO/OTA para
fraturas da extremidade proximal do fêmur, em observadores considerados experientes
(cirurgiões de quadril) e observadores inexperientes (residentes de ortopedia).
Materiais e Métodos
Este estudo retrospectivo incluiu registros radiográficos de pacientes que sofreram
fraturas da extremidade proximal do fêmur entre os anos de 2015 e 2019, tratados em
um centro de referência em trauma ortopédico. Foram selecionados 100 casos consecutivos
para esta avaliação. O tamanho da amostra foi arbitrado com base em estudos prévios[4]
[5]
[6]
[12]
[13]
[18] que utilizaram amostras menores para validação de classificações (entre 40–70 casos).
O projeto foi previamente submetido e aprovado pela Comissão de Ética em Pesquisa
da Instituição (CAAE: 30754120.7.0000.5226).
Os critérios de inclusão foram: presença de fratura da extremidade proximal do fêmur
(osso 3, região anatômica 1), da região trocantérica (grupo A) ou do colo do fêmur
(grupo B), em indivíduos esqueleticamente maduros. Fraturas da cabeça do fêmur (que
são melhor avaliadas por tomografia axial computadorizada) e fraturas patológicas
não foram incluídas neste estudo.
Cada participante recebeu as imagens digitalizadas de radiografia nas incidências
em anteroposterior e perfil para análise. Não havia nenhuma informação do paciente
ou do tratamento nas imagens utilizadas para classificação. Quatro ortopedistas especializados
em cirurgia do quadril e 4 médicos residentes do 2° ano de ortopedia e traumatologia
classificaram todos os casos (de maneira sequencial e ininterrupta, sem limitação
de tempo) em 2 momentos distintos, com intervalo de 4 semanas. No início das avaliações,
a descrição detalhada da nova classificação e suas imagens ilustrativas foram disponibilizadas
aos avaliadores para aprendizagem do sistema. Cada avaliação foi realizada individualmente
e não foi permitida a guarda das respostas ou a discussão dos resultados entre os
mesmos.
A confiabilidade interobservador foi determinada através da primeira resposta entre
os avaliadores e a intra observador através de nova avaliação quatro semanas após
a inicial. Este intervalo foi utilizado para se reduzir o risco de viés de memória.
Os dados foram coletados e armazenados em planilhas para análise estatística. Para
avaliar a concordância intraobservador foi calculado o coeficiente kappa de Cohen e para avaliar a concordância interobservadores foi calculado o coeficiente
kappa de Fleiss. Para as análises foram usados o software SPSS Statistics for Windows, Version 20.0 (IBM Corp., Armonk, NY, EUA) e a Online kappa Calculator
www.statisticssolutions.com. A avaliação de concordância incluiu 4 etapas: tipo de fratura (A- trocantérica ou B- colo), grupo (1, 2 ou 3), subgrupos (1, 2 ou 3–exceto no tipo B3, que não possui subgrupos) e também seus qualificadores quando disponíveis na classificação, ou seja, apenas nas A.1.1 (N ou O) ou B2 1,
2 ou 3 (P, Q ou R). A [Tabela 1] e a [Tabela 2] ilustram as diferenças entre as classificações AO/OTA antiga e a nova.
Tabela 1
|
AO/OTA Antiga
|
AO/OTA Nova
|
Grupo A1
|
Transtrocantérica simples
|
Transtrocantérica simples
|
A1.1
|
Simples sem desvio
|
|
Fratura isolada de trocânter
*Qualificadores:
n: trocânter maior
o: trocânter menor
|
|
A1.2
|
Simples desviada
|
|
Fratura em duas partes
|
|
A1.3
|
Simples com traço distal ao calcar
|
|
Fratura com parede lateral intacta (>20,5 mm)
|
|
Grupo A2
|
Transtrocantérica cominuta
|
Transtrocantérica multifragmentária, parede lateral incompetente (<20,5 mm)
|
A2.1
|
Cominuta sem desvio
|
|
|
A2.2
|
Cominuta desviada
|
|
Fratura com 1 fragmento intermediário
|
|
A2.3
|
Multifragmentada (> 3 fragmentos)
|
|
Fratura com 2 ou mais fragmentos intermediários
|
|
Grupo A3
|
Transtrocantérica Reversa
|
Transtrocantérica Reversa
|
A3.1
|
Traço reverso oblíquo
|
|
Traço reverso simples e oblíquo
|
|
A3.2
|
Traço reverso transverso
|
|
Traço reverso simples e transverso
|
|
A3.3
|
Traço reverso com fratura do pequeno trocanter
|
|
Traço reverso com cunha ou
multifragmentária
|
|
Tabela 2
|
AO/OTA Antiga
|
AO/OTA Nova
|
Grupo B1
|
Fratura subcapital com desvio mínimo
|
Fratura subcapital
|
B1.1
|
Impactada em valgo > 15 graus
|
|
Impactada em valgo
|
|
B1.2
|
Impactada em valgo < 15 graus
|
|
Sem desvio
|
|
B1.3
|
Não impactada
|
|
Desviada
|
|
Grupo B2
|
Fratura transcervical
|
Fratura transcervical
|
B2.1
|
Basocervical
|
|
Simples
Qualificadores: p <30° q = 30-70° r >70°
|
|
B2.2
|
Médio cervical em adução
|
|
Multifragmentada
Qualificadores: p <30° q = 30-70° r >70°
|
|
B2.3
|
Médio cervical com cisalhamento
|
|
Com cisalhamento
Qualificadores: p <30° q = 30-70° r >70°
|
|
Grupo B3
|
Fratura subcapital desviada, não impactada
|
Fratura Basocervical
|
|
B3.1
|
Desvio moderado em varo e rotação lateral
|
|
|
B3.2
|
Desvio moderado vertical e rotação lateral
|
|
B3.3
|
Desvio significativo
|
|
Embora o grau de concordância tenha formas distintas de interpretação,[19] adotamos a proposta clássica de Landis e Koch,[20] com valores entre 0.00 e 0.20 considerados como concordância leve; 0.21 e 0.40 concordância
razoável; 0.41 e 0.60 concordância moderada; 0.61 e 0.80 concordância substancial,
e 0.81 e 1.00 concordância quase perfeita (ou excelente).
Na amostra populacional estudada, a média de idade foi de 77,71 anos (variando de
57 a 98 anos, desvio padrão de 10,12). O sexo feminino foi predominante, com 63% dos
casos, e o lado direito teve um caso a mais de fratura (51%).
Resultados
Concordância intraobservador
Na avaliação repetida com intervalo de 4 semanas, a concordância intraobservador de
tipo foi quase perfeita para os especialistas com k médio de 0.92, enquanto que a dos residentes foi substancial (k médio 0.77). Já na classificação de grupo, os especialistas apresentam uma concordância substancial (k médio 0.68) e os residentes moderada (k médio 0.44). Para subgrupo, a concordância dos especialistas foi moderada (k médio 0.52), e a dos residentes foi razoável (k médio 0.28). Por fim, em relação aos qualificadores, a concordância dos especialistas também foi moderada (k médio 0.50) e a dos residentes foi razoável (k médio 0.27).
De modo geral, os especialistas apresentam desempenho melhor que os residentes. Observa-se
ainda ([Figura 1]) que os coeficientes vão decrescendo à medida que se seguem as ramificações da classificação.
A [Tabela 3] descreve detalhadamente os achados intraobservadores.
Fig. 1 Comparativo entre especialistas e residentes do coeficiente médio kappa (intraobservador).
Tabela 3
|
kappa (Cohen)
|
Especialista
|
Tipo
|
Grupo
|
Subgrupo
|
Qualificador
|
1
|
0,972
|
0,705
|
0,607
|
0,607
|
2
|
0,972
|
0,589
|
0,376
|
0,338
|
3
|
0,894
|
0,747
|
0,599
|
0,600
|
4
|
0,851
|
0,713
|
0,500
|
0,459
|
Residente
|
|
|
|
|
1
|
0,828
|
0,468
|
0,298
|
0,300
|
2
|
0,851
|
0,443
|
0,259
|
0,260
|
3
|
0,806
|
0,640
|
0,421
|
0,391
|
4
|
0,608
|
0,230
|
0,153
|
0,144
|
Concordância interobservador
Considerando a primeira rodada como padrão (usado na maioria dos estudos) para a avaliação
interobservador, temos uma concordância no tipo de 93,67% para os especialistas (k 0.87, quase perfeita) e 90,17% para os residentes (k 0.80, substancial). No grupo, a concordância foi de 60,83% para os especialistas (k 0.53, moderada) 55,5% para os residentes (k 0.47, moderada). Avançando para subgrupo a concordância caiu para 44,5% entre os especialistas (k 0.41, moderada) e 42,7% para os residentes (k 0.39, razoável). Finalmente, nos qualificadores, a concordância foi 42,67% para os especialistas (k 0.40, razoável) e 41,0% para os residentes (k 0.39, razoável).
A [Tabela 4] detalha os resultados interobservadores. Tanto os especialistas quanto os residentes
tiveram decréscimo dos coeficientes à medida que a classificação se ramifica. No entanto,
na transição subgrupo-qualificador, o decréscimo da concordância foi pouco significativo. Na primeira rodada, os residentes
alcançaram coeficientes sempre abaixo dos coeficientes dos especialistas ([Figura 2]), mas na segunda rodada, os residentes apresentam uma concordância maior entre si
do que os especialistas ([Figura 3]).
Tabela 4
|
Avaliação 1
|
Avaliação 2
|
TIPO
|
% concordância
|
Kappa
|
% concordância
|
Kappa
|
Especialistas
|
93,67
|
0,87
|
97,00
|
0,94
|
Residentes
|
90,17
|
0,80
|
94,50
|
0,89
|
GRUPO
|
|
Especialistas
|
60,83
|
0,53
|
58,83
|
0,51
|
Residentes
|
55,50
|
0,47
|
69,50
|
0,63
|
SUBGRUPO
|
|
Especialistas
|
44,50
|
0,41
|
39,67
|
0,35
|
Residentes
|
42,67
|
0,39
|
57,67
|
0,55
|
QUALIFICADOR
|
|
Especialistas
|
42,67
|
0,40
|
37,33
|
0,35
|
Residentes
|
41,00
|
0,39
|
57,17
|
0,55
|
Fig. 2 Concordância interobservadores na primeira avaliação.
Fig. 3 Concordância interobservadores na segunda avaliação.
Discussão
Na classificação AO/OTA prévia, alguns padrões de fratura ocorriam tão raramente que
não havia necessidade de uma codificação exclusiva para estes. A terminologia era
foco de confusão, devido a grande variedade de termos para fraturas similares. Havia,
ainda, dificuldade em definir-se as fraturas do grupo A2. Na nova classificação, as
definições e os códigos foram atualizados e simplificados. As fraturas do colo foram
reorganizadas e o qualificador de Pauwels agregado para melhor definição de instabilidade,
especialmente em fraturas de alta energia.[19]
Um sistema de classificação de fraturas deve ter concordância adequada entre o mesmo
observador em oportunidades diferentes (intraobservador) e entre diferentes observadores
na mesma oportunidade (interobservador).[6]
[17]
[18] O coeficiente kappa (k) é um dos métodos mais usados para avaliar a acurácia diagnóstica de um sistema de
classificação; tendo seu cálculo ajustado para possíveis coincidências ao acaso.[3]
Neste estudo, para os especialistas, a concordância intraobservador foi quase perfeita
para tipo, substancial para grupo e moderada para subgrupo e qualificador, enquanto os residentes tiveram um desempenho abaixo em todas as divisões.
Comparar as concordâncias interobservadores nas duas rodadas foi um aspecto interessante
desta pesquisa. Uma observação curiosa é que a concordância interobservadores dos
residentes aumentou entre as rodadas, o que talvez tenha indicado a capacidade de
aprendizado da nova classificação.
Estudos sobre o sistema AO/OTA anterior obtiveram resultados similares aos obtidos
em nosso estudo, mas com pequenas variações. O estudo de Pervez et al.[3] obteve um k médio entre seus observadores de 0.62 para grupo, maior do que o observado em nosso estudo (k 0,53 - concordância moderada) e de 0.33 nos subgrupos, menor do que encontramos neste estudo (k 0,41 - concordância moderada). Urrutia et al.[6] obteve concordância moderada, como nossos resultados, entre seus 9 avaliadores para
os grupos, e apenas razoável para os subgrupos menor do que em nosso estudo (k 0,41 - concordância moderada). Mattos et al.[4] também obteve resultados semelhantes com AO/OTA e Tronzo. Já Schwartsmann et al.,[14] em um estudo também englobando ortopedistas e residentes, obteve concordância moderada
(0.60) para grupo, similar à presente pesquisa, e razoável (0.34) para os subgrupos, menor do que a observada no presente estudo (k 0,41). Outro estudo interessante,[15] com 100 fraturas do colo do fêmur, graduou a classificação de Garden[7] como de concordância interobservadores apenas razoável, que aumentou para moderada
ao se simplificar o critério para fraturas desviadas ou não. Isto indica que, em determinadas
fraturas, até mesmo uma classificação bastante simples pode gerar concordância apenas
moderada.
Em resumo, em relação à classificação antiga, no presente estudo obtivemos concordância
similar a da literatura para tipo e grupo e melhor concordância para subgrupo, enquanto qualificadores não eram disponíveis na classificação antiga. Isso indica que o novo sistema obteve
sucesso ao trazer maior concordância nos subgrupos, que foram mais extensamente modificados.
Avaliando a questão de experiência dos examinadores na classificação AO/OTA, Crijins
et al.[16] não observaram diferença entre 65 cirurgiões divididos entre mais e menos experientes
de acordo com as variáveis de tempo de prática (> ou < 17 anos), tempo de trabalho
dedicado ao trauma (> ou < 80%) e fraturas tratadas por ano (> ou < 50). Em uma analogia
com nosso estudo, avaliamos que os residentes se equipararam aos especialistas na
segunda avaliação, indicando uma curva rápida de aprendizado neste sistema. Fung et
al.[21] também notou que residentes mais experientes, na sua parte final de treinamento,
tinham uma avaliação melhor que os menos experientes, indicando o aprendizado da classificação
antiga.
Sobre o novo sistema AO/OTA especificamente, é interessante notar a eliminação do
subgrupo A2.1, o que pode auxiliar na distinção de padrões estáveis (grupo A1), dos
instáveis (grupos A2 e A3). Estudos do sistema prévio[11] que tentaram discernir até que ponto uma fratura trocantérica era estável tiveram
resultados algo conflitantes. Radaideh et al.[22] em um estudo sobre uso de hastes céfalo-medulares, definia os grupos A2 e A3 como
instáveis, assim com Zhang et al.[23] Já Knobe et al.[24] citam que os grupos A2 e A3 são geralmente considerados instáveis na literatura,
porém em uma avaliação direta a fratura do trocânter menor era o principal critério
de instabilidade para 82% dos cirurgiões, entre outros fatores considerados (fratura
do trocânter maior, fratura da parede lateral e traço reverso). Outro estudo[25] considerava com instáveis os subgrupos A2.1, A2.2 e A3.3.
A classificação atual tem a integridade da parede lateral (largura superior a 20,5 mm)
como o padrão de divisão entre o grupo A1 e A2. O racional para esta divisão foi inicialmente
descrito por Gottfried[26] e Palm et al.,[27] que definiram a parede lateral como importante estrutura para suporte de implantes.
Posteriormente, Hsu et al.[28] conseguiram avaliar qual a espessura da parede lateral seria necessária para síntese
com placa-parafuso deslizante com segurança, o que motivou a mudança atual da classificação.
Outros estudos[29] revisaram o assunto e trouxeram estratégias para reconstrução da parede lateral
mesmo com o uso de síntese intramedular. Com base nesta revisão da literatura e as
dificuldades de classificação em subgrupos, achamos interessante a divisão dos grupos
a partir de A2 (inclusive) como parâmetro para considerar uma fratura instável que
requer acurada técnica de redução e síntese intramedular.
Nosso estudo evidencia as dificuldades em sistemas de classificação para fraturas
da extremidade proximal do fêmur. Apesar destas dificuldades, este sistema demonstrou
vantagens em relação ao seu antecessor[11] ao simplificar uma divisão para fraturas trocantéricas instáveis ao nível de grupo
(A2 e A3) podendo facilitar uma eventual escolha de implante e técnicas de redução.
Nas fraturas do colo (tipo B), a nova subdivisão é mais simples do que os complexos
subgrupos prévios ([Tabela 1]), e também engloba o qualificador de Pauwels. Adicionalmente, verificamos através
da literatura, uma confiabilidade superior da nova classificação AO/OTA quando comparada
com outros sistemas muito difundidos (Garden, Evans, Boyd, Tronzo).
No presente estudo, buscamos uma metodologia consistente para avaliação de uma classificação
de fraturas, tendo como pontos fortes o tamanho e representatividade da amostra (maior
do que estudos prévios, sendo que todos os padrões da nova classificação foram identificados
por pelo menos um avaliador), além de um número adequado de observadores para melhor
confiabilidade do coeficiente de Kappa.[20] A metodologia de trabalhos de confiabilidade de classificações ortopédicas foi examinada
por Audigé et al.,[18] e o presente estudo engloba todos os critérios de qualidade descritos. Além disso,
não foi encontrado nenhum estudo com avaliação deste novo sistema nas bases de dados
do Pubmed, Medline e Scielo, o que traz dados inéditos e relevantes sobre esta classificação muito popular entre
cirurgiões ortopédicos. Outro ponto interessante foi a evolução da concordância interobservadores
notada entre médicos residentes entre as avaliações, indicando o aprendizado do sistema.
Um ponto deficitário nesta pesquisa foi a inclusão de especialistas de quadril em
comparação com apenas quatro residentes do segundo ano. Talvez, a inclusão também
de residentes do primeiro e do terceiro ano pudesse demonstrar ainda melhor o processo
de aprendizado.
Como outra possível limitação do presente estudo, destacamos a idade média relativamente
alta da amostra, indicando uma característica típica do perfil da população do hospital
onde este foi realizado. Porém, embora exista risco potencial de não se representarem
algumas fraturas mais específicas do trauma de alta energia, mais comum nos mais jovens,
ainda assim, todos os padrões da nova classificação AO/OTA foram identificados em
algum momento durante o estudo. Se buscássemos outros pacientes mais jovens para incluir
na amostra, incorreríamos em viés de seleção. Além disso, estudos desta natureza possuem
limitações inerentes ao seu desenho, como potencial vício de memória, que consideramos
baixo devido ao grande número de casos, a complexidade da classificação e pelo tempo
transcorrido entre as avaliações.
O novo sistema AO/OTA tem uma confiabilidade moderada interobservadores e substancial
intraobservadores para avaliadores experientes. Médicos residentes são capazes de
atingir os mesmos níveis de concordância após curto período de aprendizado. Mais estudos são necessários para avaliar sua capacidade em relação à indicação de
tratamento (especialmente sobre tipo de síntese) e de prognóstico.
Conclusão
A nova classificação AO/OTA para fraturas da região trocantérica e do colo do fêmur
mostrou concordâncias intra- e interobservadores adequadas para tipo e grupo, com queda nas ramificações subsequentes, ou seja, subgrupo e qualificador. Ainda assim, em relação à classificação AO/OTA antiga, houve melhora nas concordâncias
para subgrupos.