이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.


ai


오늘날 정신의학 분야에서는 진단 기술의 발전과 함께 다양한 예측 모델이 주목받고 있습니다. 특히 조현병과 양극성 장애처럼 증상이 청소년기 후반 혹은 성인 초기부터 나타나는 정신질환에 대해서는 조기 발견과 선제적 치료가 더욱 중요합니다. 최근 덴마크 연구진이 **인공지능(AI)**을 활용하여 이러한 정신질환의 진단 전환 가능성을 예측하는 모델을 개발했고, 그 결과가 긍정적이라는 소식이 전해졌습니다. 이번 글에서는 해당 연구의 주요 성과와 더불어 현재 국제적으로 진행 중인 AI 기반 예측 모델의 동향, 향후 과제 등을 분석적이고 객관적인 시각으로 살펴보겠습니다.


정신질환 진단의 도전과 AI의 등장

정신질환 진단은 다른 의학 분야보다 객관적 지표 확보가 어렵다는 특징이 있습니다. 조현병과 양극성 장애의 경우도 첫 진단까지 수년이 걸릴 수 있는데, 이는 다양한 이유로 인해 발생합니다. 첫째, 환자 개인이 느끼는 증상과 임상적 징후가 모호하거나 경미하여, 초기에 정확한 진단으로 연결되지 못하는 사례가 많습니다. 둘째, 우울감이나 불안, 환청, 망상 등 증상이 서로 중첩되는 경우도 있어, 임상적 판단이 복잡해지는 경우가 적지 않습니다. 마지막으로, 정신질환에 대한 낙인 때문에 환자 본인 혹은 가족이 진료를 기피하거나 늦게 받는 경향도 진단 시기를 늦추는 하나의 요인이 됩니다.

이러한 문제를 해결하기 위한 대안으로 인공지능(AI) 기술이 부상하고 있습니다. 특히 전자의무기록(EHR), 약물 처방 내역, 임상 노트 등의 대규모 의료 데이터를 AI 모델에 적용함으로써, 과거에는 놓치기 쉬웠던 진단 전환 신호를 조기에 감지하는 방법이 고안되고 있습니다. 2023년 이후에도 전 세계 여러 연구기관에서 이와 유사한 AI 모델을 개발하고 있는데, 이들은 탄성 순환 로지스틱 회귀, XGBoost, 심층 신경망(Deep Neural Networks) 등 다양한 알고리즘을 시도하며 정확도를 개선하고 있습니다.

덴마크에서 진행된 연구는 2013년부터 2016년까지 정신의료 서비스를 받은 24,449명의 데이터를 분석하였으며, 연구 대상자들의 연령대는 15세부터 60세까지로 비교적 폭넓었습니다. 연구진은 조현병 혹은 양극성 장애로 진단이 전환될 위험을 예측하기 위해 각 환자의 약물 처방 이력, 진단 기록, 그리고 의료진이 작성한 임상 노트 등을 종합적으로 고려했습니다. 조현병과 양극성 장애는 발병 양상이 달라서, 모델이 각각에 대해 얼마나 정확도를 보여주는지가 연구의 핵심 포인트였습니다.

최근 WHO(세계보건기구)나 미국 NIMH(국립정신보건연구소) 등의 기관에서도 AI 기반 정신질환 예측 모델에 대한 관심이 높아지고 있습니다. 2024년 이후에도 후속 연구들이 꾸준히 발표되고 있으며, 임상 현장에서 이미 시범 적용을 시작한 병원도 있습니다. 그러나 국가별 의료 시스템 및 데이터 형식, 개인정보 보호 규정 등이 달라, 동일 모델이라도 실제 적용 시 결과가 달라질 수 있음을 유념해야 합니다.

정신질환 진단의 도전은 단순히 임상적 진단 기법의 개선 문제만은 아닙니다. 사회·문화적 편견, 의료 접근성, 환자의 개인적 여건 등 다양한 요소가 복합적으로 작용하여 진단 시기를 늦추고, 그 결과 적절한 치료 개입도 함께 지연되는 상황이 자주 발생합니다. 예컨대 조현병 증상이 점진적으로 나타나는 환자의 경우, 초기에는 우울증이나 공황장애 같은 다른 진단을 받다가 결국 몇 년 후에야 조현병으로 최종 확진되는 사례도 보고됩니다. 양극성 장애 역시 우울 상태일 때는 ‘주요우울장애’로 오진되고, 조증 혹은 경조증 에피소드가 늦게 나타나 실제 양극성 장애임이 뒤늦게 드러나는 경우가 많습니다. 이런 맥락에서 AI 기술의 도입은 의료진의 진단 정확도를 높이고 조기 치료를 가능하게 함으로써 환자의 예후 개선에 크게 기여할 수 있습니다. 특히, 딥러닝 알고리즘을 비롯한 다양한 머신러닝 기법은 방대한 의료 데이터를 단시간에 처리하며, 환자 개개인의 유병력 패턴을 분석해 맞춤형 예측을 할 수 있다는 장점이 있습니다. 다만, 이 기술이 실제 임상 현장에 뿌리내리기 위해서는 충분한 데이터 축적과 모델 검증, 그리고 의료진과의 협업이 필수적입니다. 연구단계에서 나타난 높은 정확도가 실질적 환자 치료로 이어지기 위해서는 윤리적, 법적, 실무적 문제들이 종합적으로 검토되어야 합니다.


덴마크 연구의 주요 성과: 탄성 순환 로지스틱 회귀와 XGBoost

이번 덴마크 연구에서 사용된 AI 모델은 크게 **탄성 순환 로지스틱 회귀(Elastic Net Regularized Logistic Regression)**와 XGBoost 두 가지입니다.

  • 탄성 순환 로지스틱 회귀는 과적합(Overfitting)을 방지하면서도 중요한 변수를 선별해내는 데 유리합니다. 이는 정신질환 예측에서 특히 중요한데, 환자의 복잡하고 다차원적인 임상 정보 중 예측에 크게 기여하는 변수를 효과적으로 골라낼 수 있기 때문입니다.
  • XGBoost는 여러 개의 작은 예측 모델(결정 트리)을 결합하여 최종 예측값을 도출하는 앙상블(Ensemble) 기법입니다. 이 모델은 연속적인 학습 과정을 통해 잔차(Error)를 최소화하려고 하며, 일반적으로 예측 정확도가 높게 유지되는 장점이 있습니다.

연구진은 두 모델의 성능을 평가하기 위해 수신자 조작 특성 곡선(AUROC) 값을 확인했습니다. AUROC은 0과 1 사이의 값을 가지며 1에 가까울수록 예측력이 뛰어납니다.

  • 두 질환을 함께 예측할 경우 AUROC은 0.70
  • 조현병만 예측할 경우 0.80
  • 양극성 장애만 예측할 경우 0.62

이 결과는 조현병이 양극성 장애보다 임상적 특징이 더 뚜렷하기 때문에, AI가 예측할 때 상대적으로 높은 정확도를 내는 것으로 해석됩니다. 또한, 연구팀이 중요하게 본 예측 변수로는 입원 여부, 환청, 사회적 고립이 꼽혔는데, 이는 이전부터 임상 연구에서도 조현병의 위험 요인으로 주목받아온 요소들입니다. 한편, 양극성 장애는 조증과 우울증이라는 상반된 에피소드가 순환적으로 일어나므로, 환자의 증상 패턴을 파악하기가 상대적으로 까다로워 예측 정확도가 낮았다는 분석이 나옵니다.

아래 표는 덴마크 연구에서 보고된 주요 예측 모델별 AUROC 값을 간단히 정리한 것입니다.

예측 모델 구분AUROC
조현병만 예측0.80
양극성 장애만 예측0.62
두 질환 통합 예측0.70

이번 연구에서 주목할 점은 단순히 AI 모델이 어느 정도의 정확도를 달성했느냐에 그치지 않습니다. 연구팀이 조현병 고위험군으로 분류한 환자들 중 실제 진단으로 이어진 비율이 **19.4%**였고, 양극성 장애 고위험군 분류에서는 **9.9%**가 실제로 진단된 사실이 공개되었습니다. 이는 기존 임상의사들이 조현병과 양극성 장애를 진단할 때 고려했던 지표에, AI가 새롭게 가중치를 두는 변수들이 더해짐으로써 발생한 결과로 풀이됩니다. 즉, AI 모델을 통해 간과되거나 경미하다고 여겨졌던 환자 기록을 재발견할 수 있게 된 것입니다. 다만, 양극성 장애에서 예측 정확도가 낮았던 것은 해당 질환이 조현병보다 증상 양상이 복잡하고, 조증과 우울증 기간의 길이나 정도가 환자별로 크게 다를 수 있기 때문으로 분석됩니다. 실제 임상현장에서 이를 보완하기 위해서는 환자의 장기 추적 관찰 데이터가 더 많이 축적되어야 하며, AI 모델도 증상 사이클에 따른 변동을 좀 더 정교하게 반영할 수 있는 알고리즘으로 업데이트될 필요가 있습니다. 예컨대, 환자의 일상 활동 패턴이나 수면 주기, 온라인 소셜 미디어 사용량 같은 행동적 데이터까지 함께 결합하면 예측 정확도를 높일 수 있을 것으로 기대됩니다.

AI 예측 모델의 한계와 보완 방법

덴마크 연구는 AI가 정신질환 진단 전환 가능성을 예측하는 데 의미 있는 진전을 보여주었지만, 여전히 해결해야 할 문제점들도 존재합니다. 우선, 연구 대상 데이터가 특정 지역(덴마크 중앙정신의료서비스)에 한정되어 있습니다. 각 국가의 의료 체계, 문화적 배경, 유전자적 특성 등에 따라 정신질환의 발병 양상과 진단 시점이 달라질 수 있으므로, 다른 환경에서 동일 모델을 적용했을 때 성능이 보장되는지는 아직 미지수입니다.

또한, AI 모델의 해석 가능성(Explainability) 이슈도 중요합니다. 탄성 순환 로지스틱 회귀나 XGBoost는 상대적으로 해석이 용이한 편이지만, 딥러닝 기반 모델이 도입될 경우 알고리즘이 어떤 과정을 통해 특정 예측값을 도출했는지를 설명하기가 쉽지 않습니다. 정신의학 분야에서는 환자나 보호자에게 치료 방향을 설득력 있게 제시해야 할 때가 많기 때문에, 단순히 “AI가 위험하다고 판단했다”는 이유만으로는 충분한 임상적 신뢰를 확보하기 어렵습니다.

또 다른 한계는 데이터 품질 문제입니다. 전자의무기록(EHR)을 포함한 의료 데이터가 항상 일관적이고 오류 없이 수집되는 것은 아닙니다. 의사나 간호사가 주관적으로 기재한 임상 노트에는 진단명이 달리 표시되거나, 약물 처방 내역이 누락된 경우도 발생합니다. 이런 부분들은 AI 모델의 훈련에 부정적인 영향을 미칠 수 있으므로, 데이터 전처리검증 과정에서 많은 시간과 자원을 투입해야 합니다.

한계점이 존재함에도 불구하고, 보완 방법 또한 다양하게 제시되고 있습니다. 예컨대, 국제 연구 협력 네트워크를 통해 다국적, 다기관의 의료 데이터를 통합 분석하면 모델의 일반화 능력을 높일 수 있습니다. 실제로 미국, 유럽, 아시아 여러 연구소가 참여하는 글로벌 컨소시엄이 구축되어, AI 알고리즘을 공동 연구하고 있습니다. 또한, 데이터 보안 및 개인정보 보호를 위해 분산형 AI 학습(Federated Learning) 방식이 모색되기도 합니다. 이를 통해 환자 데이터를 중앙서버에 모두 모으지 않고 각 병원별로 분산된 상태에서 모델을 훈련, 교정함으로써 개인정보 유출 위험을 줄이면서도 대규모 데이터를 활용할 수 있습니다. 동시에, 모델 해석 가능성을 높이기 위한 SHAP(Shapley Additive Explanations) 같은 기법도 다각도로 연구되고 있어, 단순히 “예측 결과”를 내놓는 AI가 아닌 “설명할 수 있는 AI”로 발전하기 위한 노력이 이어지고 있습니다. 궁극적으로 이러한 노력들이 결합될 때, AI 예측 모델은 임상 의사들과 환자들에게 더욱 신뢰받는 의사결정 보조 수단으로 자리잡게 될 것입니다. 특히, 정신질환 분야에서는 초기 징후가 모호한 경우가 많으므로, 수많은 변수를 고려해 정확도와 신뢰도를 높인 모델의 가치는 매우 크게 평가될 것으로 예상됩니다.


앞으로의 전망: 국제적 검증과 개인화 의료

AI 기반 정신질환 예측 모델의 활용 가능성은 무궁무진합니다. 특히 조현병의 경우, 조기 개입(Early Intervention)이 예후 개선에 매우 중요하다는 점에서 AI 기술이 가지는 의의가 큽니다. 이미 2025년 현재, 북미 지역을 중심으로 다국적 제약사와 헬스케어 스타트업들이 협력하여 맞춤형 예측 플랫폼을 개발 중이며, 일부는 임상시험 단계에 접어들었습니다. 이러한 플랫폼은 환자의 유전자 프로필, 생활습관, 환경적 스트레스 요인, 심리검사 결과 등 다양한 요소를 종합적으로 반영하여 개인화 의료를 지향합니다.

덴마크 연구팀 역시 이번 연구 결과를 토대로 추가적인 대규모 검증을 계획 중이라고 밝혔습니다. 정확도가 상대적으로 낮았던 양극성 장애 예측 모델을 보완하기 위해, 환자의 기분 장애 관련 지표나 라이프로그(수면 시간, 활동량, SNS 사용 패턴 등) 정보를 더 상세히 반영하는 방안을 고려하고 있다고 합니다. 또한, AI가 예측한 결과를 단순히 수치로 제시하는 것을 넘어, 환자에게 맞춤형 가이드를 제공할 수 있도록 인터페이스 설계에도 주목하고 있습니다. 이는 정신질환 환자들이 자신의 상태를 이해하고 자가 관리에 참여하도록 유도함으로써, 치료 과정에서의 의사소통 비용을 줄이는 효과가 있습니다.

그러나 이러한 미래가 실현되기 위해서는 윤리적·법적 문제도 반드시 짚고 넘어가야 합니다. AI 모델이 예측이 틀렸을 때, 혹은 편향된 데이터를 학습했을 때 발생할 수 있는 책임 소재에 대한 규정이 아직은 불명확합니다. 또한, 개인의 민감 정보가 여러 기관과 공유되는 상황에서, 데이터 프라이버시를 어떻게 보장할 것인지에 대한 논의도 활발히 이루어져야 합니다. 궁극적으로 국제적인 가이드라인이나 표준화 작업이 이루어져야, 국가 간 협력을 통해 AI 모델의 신뢰도를 높이고 환자에게 실질적인 도움을 줄 수 있을 것입니다.

미래 정신의학은 환자의 특성을 세밀하게 분석하여 **정밀의료(Precision Medicine)**를 구현하는 쪽으로 나아갈 가능성이 큽니다. 이는 과거처럼 모든 환자에게 같은 진단 기준과 같은 치료 방법을 일괄 적용하는 것이 아니라, 환자의 유전자, 환경, 행동 데이터를 종합해 개인에게 최적화된 치료를 제공한다는 개념입니다. AI 예측 모델은 이 정밀의료의 출발점이라 할 수 있습니다. 특히, 조현병처럼 한 번 진단이 내려지면 사회적, 심리적 부담이 큰 질환일수록, 조기 진단과 조기 개입이 환자의 삶에 지대한 영향을 미칩니다. 양극성 장애 역시 조증과 우울증 주기가 한 번 크게 돌기 전에 안정적인 치료를 시작할 수 있다면, 환자와 주변인의 삶의 질이 크게 개선됩니다. 최근 발표된 몇몇 논문에서는 웨어러블 기기나 스마트폰 앱을 통해 실시간으로 수집되는 행동 데이터까지 AI 모델에 통합할 경우, 양극성 장애의 기분 변동을 높은 정확도로 예측할 수 있다는 결과를 제시하기도 했습니다. 이는 조현병 예측 모델과 마찬가지로, 임상에서 “무엇을 놓치고 있었는가”를 재발견하게 만들어주며, 결과적으로 환자의 재발률과 자살 위험 등을 낮추는 데 도움을 줄 수 있습니다. 따라서 AI가 제시하는 객관적 지표와 임상적 판단이 유기적으로 결합하면, 앞으로의 정신의학에서는 치료 효율과 환자 만족도 모두가 크게 향상될 것으로 기대됩니다.


마치며

덴마크 연구진이 발표한 조현병·양극성 장애 AI 예측 모델은 진단 지연을 줄이고 조기 치료로 이어질 가능성을 열어준다는 점에서 큰 의의를 가집니다. 탄성 순환 로지스틱 회귀와 XGBoost 모델 모두, 조현병 예측에는 비교적 높은 정확도를 보였으며 양극성 장애 예측은 아직 개선의 여지가 있음을 확인시켜줍니다. 특히, 조현병 고위험군으로 분류된 환자 중 19.4%가 실제 진단으로 이어졌다는 점은 AI가 임상의들의 의사결정을 적극 보조할 가능성을 시사합니다.
물론, 이 연구가 특정 지역의 데이터를 기반으로 이루어졌다는 점에서, 국제적 검증이 추가로 필요하다는 점도 강조되었습니다. 아울러 양극성 장애처럼 증상이 다양하고 변화 주기가 일정치 않은 질환을 AI로 예측하기 위해서는 장기 추적 데이터행동적 지표까지 결합해야 한다는 의견이 제기되고 있습니다.
향후에는 AI 모델의 해석 가능성과 개인정보 보호, 윤리적 책임 문제 등을 포괄적으로 다루는 연구가 활발히 진행될 것으로 보이며, 분산학습이나 설명가능 인공지능(XAI) 기술이 그 대안으로 제시되고 있습니다. 의료 현장에서 인공지능은 이미 영상의학, 암 진단, 신경과학 분야에서 상당한 성과를 내고 있으며, 정신과 영역에서도 점진적으로 자리를 잡아갈 것으로 전망됩니다. 궁극적으로 AI 예측 모델은 정신질환 진단의 새로운 패러다임을 열어, 환자에게 더욱 선제적이고 개인화된 치료 기회를 제공하게 될 것입니다.

Leave a Comment