AI 정치적 편향성: 왜 "안티 워크(Anti-Woke)" 챗봇조차 좌편향되는가
최근 워싱턴 포스트(Washington Post)의 조사에 따르면, LLM(대규모 언어 모델) 생태계 전반에서 지속적인 이념적 경향이 드러났습니다. 대부분의 주요 AI 모델이 상당한 좌편향성을 보이고 있다는 점입니다. 보수적이거나 "진실을 추구하는" 모델로 마케팅된 모델들조차 이러한 패턴에서 벗어나는 데 어려움을 겪고 있으며, 이는 학습 데이터와 정렬(alignment) 프로토콜의 막대한 영향력을 시사합니다.
좌편향된 응답의 지배력
이번 조사는 6개의 주요 AI 모델을 대상으로 다양한 정치적 질문을 테스트했으며, 그 결과 진보적 관점으로의 뚜렷한 기울어짐이 발견되었습니다. OpenAI의 GPT-5.5가 가장 편향된 것으로 나타났는데, 응답의 80%가 독점적으로 좌편향된 논거를 제공했습니다. 이 모델은 부유층에 대한 증세나 단일 지불 의료 시스템(single-payer healthcare systems)과 같은 정책을 빈번하게 지지했습니다.
Deepseek의 V4 Pro가 그 뒤를 바짝 쫓으며 테스트 사례의 70%에서 독점적으로 좌편향된 답변을 내놓았습니다. OpenAI와 Deepseek 모델 모두 사형 제도에 대해 일관되게 반대하는 논거를 펼쳤는데, 이는 사형 제도에 대한 미국인의 다수가 지지한다는 오랜 Gallup 데이터와 상충하는 결과입니다. Anthropic의 Claude Opus 4.8은 보다 온건한 접근 방식을 보여주었으며, 43%의 경우에만 독점적으로 좌편향된 답변을 제공했고 57%의 경우에는 균형 잡힌 관점을 제시했습니다.
"안티 워크" 및 보수적 AI의 역설
가장 놀라운 발견 중 하나는 진보적 편향성에 대응하기 위해 명시적으로 설계된 모델들조차 실패했다는 점입니다. 안티 "워크(woke)" 및 "진실 추구형" 챗봇으로 마케팅된 일론 머스크의 xAI Grok 4.3은 여전히 대개 독점적으로 좌편향된 응답을 생성했습니다. 경쟁 모델들에 비해 우편향된 답변을 더 많이 제공하기는 했으나, 일관된 보수적 입장을 유지하는 데는 실패했습니다.
조사는 이에 대한 두 가지 가능한 이유를 제시합니다. 모델들이 경쟁사들이 사용하는 것과 동일한 거대한 인터넷 규모의 데이터셋으로 학습되었거나, 다른 AI 모델의 출력물로부터 의도치 않게 학습하고 있다는 것입니다. 또한, 기독교 및 보수적 원칙에 기반해 구축되었다고 주장하는 Gab의 Arya 모델의 경우, 우편향된 논거보다 좌편향된 논거로 응답하는 경우가 12배 더 많았습니다. 하지만 Grok은 정렬(alignment)이 수동으로 조정될 수 있음을 보여주었습니다. Grok은 트랜스젠더 권리에 대해 일론 머스크의 공개적 입장과 일치하는 독점적인 우편향 입장을 취했는데, 이는 특정 주요 주제에 대한 의도적인 개입이 가능함을 시사합니다.
균형 잡힌 예외로서의 Google Gemini
업계 전반이 중립성 유지에 어려움을 겪고 있는 반면, Google의 Gemini 3.1 Pro는 중요한 예외로 눈에 띄었습니다. 이 모델은 문제의 양면을 93%의 확률로 제시하며 놀라운 균형 유지 능력을 보여주었습니다. 독점적으로 좌편향된 응답은 7%에 불과했으며, 독점적인 우편향 입장을 기본값으로 취하는 경우는 없었습니다.
Gemini는 또한 경제 강화를 위한 군사력 확장의 논거를 제공하는 등, 다른 모델들이 제시하지 못한 다양한 관점을 탐구하는 독특한 능력을 보여주었습니다. 이는 Google의 인간 피드백 기반 강화 학습(RLHF)과 시스템 프롬프팅이 다각적 추론을 위해 더 효과적으로 조정되었을 수 있음을 시사합니다.
이것이 AI 생태계에 중요한 이유
LLM이 정보 검색의 주요 인터페이스가 됨에 따라, "중립성 격차(neutrality gap)"는 개발자와 정책 입안자들에게 중대한 관심사가 되고 있습니다. 기초 데이터나 미세 조정(fine-tuning) 과정에서 적용되는 안전 계층이 이념적으로 편향되어 있다면, AI는 객관적인 도구가 아닌 에코 체임버(echo chamber)가 될 위험이 있습니다. 더 넓은 관점에서 이는 특히 특정 정치적 입장이 과학적 합의나 인권과 충돌할 때, "안전 정렬(safety alignment)"과 "이념적 정렬(ideological alignment)"을 분리해야 하는 기술적 과제를 부각시킵니다.
핵심 요약
- 광범위한 편향성: OpenAI (GPT-5.5)와 Deepseek (V4 Pro)는 각각 80%와 70%로 가장 높은 수준의 좌편향성을 보였습니다.
- 실패한 이념적 전환: xAI의 Grok 및 Gab의 Arya와 같은 "안티 워크" 모델들은 학습 데이터 의존성 때문인지 여전히 주로 좌편향된 관점을 기본값으로 취합니다.
- 중립성의 예외: Google의 Gemini 3.1 Pro는 테스트된 시나리오의 93%에서 양면적 관점을 제공하며 가장 균형 잡힌 모델임이 입증되었습니다.
