AI의 가장 큰 위험
대부분의 사람들은 깨어나는 기계를 두려워한다.
진짜 위험은 더 조용하다. AI는 너무 똑똑해져서 실패하는 것이 아니라, 우리가 제공하는 먹이를 오염시키기 때문에 실패할 수도 있다.
2029년을 생각해 보자. 개발자들은 거대한 컨텍스트 윈도우와 더 뛰어난 추론 능력을 갖춘 새로운 모델을 훈련시킨다. 이들은 모델을 가르치기 위해 인터넷의 스냅샷을 사용한다. 여기에는 블로그, 포럼, 뉴스, 소셜 미디어가 포함된다.
하지만 인터넷은 변하고 있다.
수년 동안 봇과 특정 집단들은 대규모로 콘텐츠를 게시해 왔다. 이것은 단순한 스팸이 아니다. 잘 쓰인 콘텐츠다.
인터넷은 학습 데이터를 위한 전쟁터가 되어가고 있다.
과거의 프로파간다는 사람을 겨냥했다. 새로운 프로파간다는 모델을 겨냥한다. 일단 편향이 학습 데이터에 유입되면, 그것은 수백만 개의 미래 AI 시스템 내부에 살아남는다.
당신은 가짜 기사를 결코 보지 못할 수도 있고, 조작된 스레드를 찾지 못할 수도 있다. 하지만 그 영향력은 남는다. 그것은 기본 전제가 되고, 그럴듯하게 들리는 답변이 된다.
데이터 포이즈닝(Data poisoning)은 단순한 기술적 공격이 아니다. 그것은 미묘한 변화다. 모델을 망가뜨리는 것이 아니라, 모델을 뒤튼다.
다음과 같은 위험을 고려해 보라:
- 가짜 페이지는 위험한 제품을 안전해 보이게 만든다.
- 가짜 개발자 채팅은 나쁜 코드를 모범 사례처럼 보이게 만든다.
- 정치적 내러티브는 수년 전부터 심어진다.
- 합성된 의견들이 미래 어시스턴트의 목소리가 된다.
위험은 단 하나의 거짓말이 아니다. 위험은 왜곡된 현실의 지도다.
이제 사람들은 인간 독자가 아닌 미래의 모델을 위해 콘텐츠를 작성한다. 블로그 포스트는 씨앗이다. 가짜 리뷰는 신호다. 수천 개의 작은 거짓말이 통계적 진실이 된다.
AI는 우리의 소음과 조작을 물려받는다. 인터넷이 오염되면, 모델은 우리의 가장 최악의 왜곡을 학습하게 될 것이다.
우리는 새로운 질문을 던져야 한다. 단순히 AI를 안전하게 만들 수 있는지를 물을 것이 아니라, AI가 학습하기에 충분할 만큼 우리의 지식을 안전하게 지킬 수 있는지를 물어야 한다.
오늘날의 인터넷은 이 사실을 알고 있는 사람들에 의해 쓰여지고 있다.
출처: https://dev.to/marrouchi/the-greatest-danger-to-ai-6km
선택 사항 학습 커뮤니티: https://t.me/GyaanSetuAi
