H
하베스트
AI로 요약된 콘텐츠

대부분의 발표된 연구 결과가 거짓인 이유

핵심 요약: 현대 과학 연구 결과 중 다수가 실제로는 거짓일 가능성이 매우 높다. 이는 연구 설계, 통계적 유의성의 오용, 표본 크기, 연구자 간 경쟁, 편향 등 다양한 요인에 기인한다. 논문에서는 왜 이런 일이 발생하는지 수식적으로 분석하며, 우리가 연구 결과를 어떻게 더 신뢰할 수 있도록 향상시킬 수 있을지에 대해 생각해본다.


1. 문제 제기: 왜 많은 연구 결과가 거짓일까?

점점 더 많은 과학자와 대중들이 "대부분의 현대 논문 연구 결과가 거짓일 것"이라는 우려를 하고 있다. 실제로 저명한 저널에 실린 연구조차도 시간이 지나 다른 연구로 반박되거나 신빙성이 떨어지는 경우가 잦다. 저자는 이 현상에 놀랄 필요가 없다고 말한다.

"대부분의 주장된 연구 결과는 거짓임을 증명할 수 있다."

이 글은 어떤 요인들이 이런 현상을 만들고, 연구 결과 해석과 과학 발전에 어떤 함의를 주는지 구체적으로 탐구한다.


2. 통계적 모형과 연구 결과의 신뢰도

연구 결과가 진짜일 확률: PPV

논문은 양성 예측 가치(PPV, Positive Predictive Value)라는 확률적 개념을 활용한다.
PPV는 한 연구 결과(예: B 질병에 A 약이 효과가 있다)가 '실제로도 진실일' 가능성을 나타낸다.

PPV는 다음 요인에 따라 달라진다.

  • 사전 확률(R): 본격적으로 연구를 시작하기 전에, 연구 가설이 사실일 것 같은 사전 신뢰도.
  • 통계적 검정력(1−β): 연구가 실제 효과를 발견해낼 확률.
  • 유의수준(α): 사실이 아닌데도 효과가 있다고 잘못 판단할 확률 (보통 0.05, 즉 5%).

작은 표본, 낮은 효과 크기, 사전 가능성이 낮은 주제일수록 PPV는 떨어진다.
즉, 연구 결과가 사실일 확률보다 거짓일 확률이 높아진다.


3. 편향(Bias)의 영향

연구 설계 및 보고 과정에서의 편향

편향(bias)은 연구 수행이나 결과 해석에서 의도적으로 혹은 무의식적으로 결과를 '왜곡'하는 모든 요인을 의미한다.
예를 들어:

  • 선택적 결과 보고(Selective Reporting): 원하는 결과만 강조하거나 비판적 결과는 빼거나 왜곡.
  • 분석 방법의 임의 변경: 데이터 마이닝, 사후 분석 등.
  • 이해관계: 연구자의 금전적, 명예적 이익.

이런 편향이 커질수록, 진실된 연구 결과가 나올 확률(PPV)은 급격히 감소한다.

"편향의 수준이 높아질수록 연구 결과가 진실일 확률은 상당히 줄어든다."

이외에도 반대로 중요한 사실이 무시되는 경우(Reverse bias)도 있으나, 이는 드물고 최근에는 측정 기술 향상으로 상당 부분 해결되고 있다.


4. 여러 연구팀의 검증과 경쟁

현대 생명과학을 비롯해 많은 분야에서는 같은 가설을 다수의 연구팀이 계속 반복적으로 검증한다.
그런데 이 과정이 의외로 문제를 악화시킨다. 여러 팀이 동일 가설을 검증할수록, 우연히 통계적으로 유의한 값이 한 팀에서 나올 가능성이 높아진다.
즉, '경쟁이 심한 핫 분야'일수록 거짓된 결과를 유의하게 만든 연구가 나올 확률이 더 높아진다.

"과학계에 더 많은 팀이 몰리는 '핫한' 연구 분야일수록, 연구 결과가 진실일 가능성은 더 낮아진다."


5. 실제 사례와 여섯 가지 귀결(Corollary)

논문은 이러한 원리를 실제 유전체 연구 사례로 설명한다. 100,000가지 유전자 변이 중 실제로 질병에 영향을 미치는 것은 10개뿐일 거라고 가정하고, 통계적 검정력과 편향까지 고려했을 때 진실된 결과가 '있다'고 결론 내릴 확률은 극히 낮다.

그리고 다음과 같이 여섯 가지 귀결을 제시한다.

  1. 작은 규모의 연구일수록, 참인 연구 결과일 확률은 낮아진다.
  2. 효과 크기가 작을수록, 연구 결과가 진실일 확률은 낮아진다.
  3. 거대한 탐색적 연구이거나, 연구 가설이 많고 선별이 적을수록, 결과가 진실일 확률은 낮다.
  4. 연구 설계와 해석 방식의 유연성이 클수록(즉 임의로 바꿀 수 있을수록), 연구 결과의 진실도는 떨어진다.
  5. 이해관계자(금전적·비금전적)의 영향이 클수록, 거짓 결과의 가능성이 높아진다.
  6. 여러 연구팀이 경쟁적으로 몰려 있는 분야일수록, 진실한 결과가 도출될 확률이 더 낮아진다.

6. 과연 대부분의 연구 결과는 거짓인가? 그리고 그 이유

시뮬레이션과 실제 연구 상황을 종합해 볼 때, 대부분의 연구 설계·분야에서는 참(True)인 연구 결과가 나올 확률이 50%를 넘기 어렵다.
랜덤화·대규모 임상 연구나 좋은 품질의 메타분석이 아닌 이상, 대부분의 관찰연구·탐색적 과학 논문 결과는 '거짓(재현 불가)'일 가능성이 더 높다.


7. 결국, 통계적 유의성이 편향을 반영한다

특히 생의학처럼 사전 확률(진짜 효과가 존재할 확률)이 아주 낮은 분야에서는 보고된 효과 크기가 실제 효과가 아니라, 그 분야의 편향(Bias) 정도를 '정확히 측정한 값'일 수도 있다.
즉, 강하게 통계적으로 유의한 결과일수록, 오히려 더 커다란 편향의 신호일 가능성이 있다.

"너무 크고 너무 유의미한 효과들은, 오히려 대단한 발견의 신호가 아니라 심각한 편향의 신호일 수 있다. 데이터, 분석, 결과에 무엇이 잘못됐는지 비판적으로 다시 살펴봐야 한다."


8. 그렇다면 어떻게 해야 할까?

100% 진실을 담보할 수 있는 "금표준(gold standard)"은 존재하지 않지만, 우리는 실천적 해법을 시도할 수 있다.

  1. 연구 설계와 검정력 강화: 크고 체계적인 연구(대규모 무작위 임상, 표준화된 메타분석 등)를 우선 활용.
  2. 편향 방지의 문화적 변혁: 연구 설계의 사전 등록, 통합 분석, 검증 중심의 문화 확산.
  3. 의미 있는 의문에 집중: 사전 확률이 비교적 높은 분야(확실히 진짜가 있을 법한 주제)에 연구력을 집중.
  4. 개별 단일 연구의 통계적 유의성만 맹신하지 않기: 전체 증거의 합, 과거 경험, 인접 분야의 편향 정도도 같이 고려.
  5. '발견'의 의미 재고: 통계적으로 유의하다는 것은 편향, 다중 검증, 우연의 역할까지 감안해 신중히 해석해야 함.

마무리

이 글은 많은 논문 연구 결과가 사실은 거짓일 확률이 높다는 점을 수식, 그림, 실제 사례 등 다양한 방식으로 설득력 있게 보여준다. 연구자가 '연구 결과' 앞에 설 때, '이 결과가 진짜일까?'라는 비판적 질문을 끊임없이 던지고, 연구 설계·분석·결과 해석 모두에서 겸손함과 신중함을 잃지 않아야 한다는 중요한 교훈을 준다. 🚦

요약 완료: 2025. 10. 10. 오전 6:07:05

이런 요약이 필요하신가요?

하베스트가 원클릭으로 요약해드립니다

5초 요약
AI 자동 분석
📱
모든 기기
웹, iOS, Chrome
🔍
스마트 검색
언제든 재발견
요약 시작하기
나도 요약하기