2026.03.16 10:24

워싱턴 주립대학교 연구 챗GPT의 과학적 가설 평가 능력에 대한 한계 지적

워싱턴 주립대학교 연구팀은 메스üt 치크 교수를 중심으로 수행한 최신 연구를 통해 챗GPT의 과학적 가설 검증 능력에 대한 심각한 의문을 제기했습니다. 풀먼에 위치한 이 연구기관은 과학 논문에서 추출한 700개 이상의 가설을 챗GPT에 입력하여 분석한 결과, 2024년 기준 정확도는 76.5%였으며, 2025년에는 약간 향상되어 80%를 기록했습니다. 그러나 이는 무작위 추측보다 약 60% 더 나은 수준에 불과해, 연구자들은 챗GPT의 신뢰도를 낮게 평가했습니다. 특히 거짓 가설을 구별하는 능력은 매우 제한적이었으며, 정확도는 16.4%에 불과했습니다.

연구의 핵심 문제점 중 하나는 챗GPT의 응답 일관성의 부족이었습니다. 동일한 질문에 대해 10번의 응답 중 일관성 있는 정확성을 보인 비율이 겨우 73%에 머물렀습니다. 치크 교수는 ‘동일한 질문에 대해 계속해서 상이한 답변을 제공하는 것은 응답의 일관성 부족을 명확히 보여줍니다’라고 강조했습니다.

이러한 결과는 기업 관리자들에게 AI 결과를 신중하게 검토하고 회의적인 시각으로 접근해야 함을 시사합니다. 치크 교수는 ‘현재의 AI 기술은 우리가 세상을 이해하는 복잡성을 완전히 포착하지 못하며, 단지 정보를 저장하고 일부 통찰력을 제공하는 데 그치고 있습니다’라고 설명했습니다. 연구는 챗GPT-3.5와 업데이트된 챗GPT-5 미니 버전 간의 정확도 차이가 미미함을 확인했습니다.

결론적으로, 이 연구는 인공 일반 지능이 아직 복잡한 추론 능력을 완전히 따라잡지 못하고 있음을 보여주며, 비즈니스 환경에서의 AI 활용 시 주의가 필요함을 다시 한번 강조합니다.

트위터 공유: 워싱턴 주립대학교 연구 챗GPT의 과학적 가설 평가 능력에 대한 한계 지적

워싱턴 주립대학교 연구 챗GPT의 과학적 가설 평가 능력에 대한 한계 지적

워싱턴 주립대학교 연구 챗GPT의 과학적 가설 평가 능력에 대한 한계 지적

최신 뉴스

시애틀 FIFA 월드컵 대비 홈리스 지원 쉼터 확대 추진

시애틀 대기강수대 영향으로 풍부한 강수량 예상

스노퀄미 스키 리조트 눈사태 경보 머리부터 묻힌 스키어 구조 영상으로 경각심 고조

케인바 인근 총기 사건 발생 경찰관 개입 후 사망자 발생

시애틀 인근 I-5 고속도로 의료 위급 상황 역주행 차량 안전 차단망에 저지… 심각한 사고 예방

캐스케이드 산맥 폭설로 눈사태 증가…대기강수대 영향으로 불안정 상황 지속 우려

타이머 마운틴 인근 SR-18 동쪽 도로 소규모 산사태로 통행 차단

2026 월드컵 대비 시애틀 교통공사 일시 중단 발표

스파웨이 레이크 공원 칼 위협 사건 56세 용의자 체포

시애틀 주차 위반 티켓 발행 급감 징수 수입 64만 달러 감소