Dlaczego badacz Microsoftu zbudował sieć neuronową, używając kóz w Age of Empires II
W błyskotliwym pokazie technicznej satyry, Adrian de Wynter, badacz z Microsoftu i University of York, skonstruował funkcjonal
To tworzy cykl błędnego koła: badacze projektują eksperymenty, aby udowodnić, że model posiada „strach” lub „moralność”, a ponieważ wychodzą z tego założenia, wyniki nieuchronnie je potwierdzają.
Przejście w stronę obserwacyjnej nauki o AI
De Wynter ostrzega, że praktyki branżowe, takie jak trenowanie Claude przez Anthropic do używania fraz typu „wierzę, że”, pogłębiają ten problem. Może to prowadzić do niebezpiecznych konsekwencji, w tym przywiązania emocjonalnego, pochlebstwa i wzmacniania urojeń u użytkowników.
Zamiast przypisywać modelom świadomość, de Wynter proponuje „trzeźwe podejście” oparte na obserwowalnych danych. Zamiast twierdzić, że model „rozumie” dane pojęcie, badacze powinni stwierdzać, że „w warunku X model generuje wynik Y”. Pozwala to zachować testowalność naukową i zapobiega nadużywaniu złożonej matematyki do uzasadniania nieuzasadnionych twierdzeń o zdolności do odczuwania.
Kluczowe wnioski
- Równoważność matematyczna: De Wynter dowodzi, że medium obliczeniowe (czy to kozy w grze, czy tekst w oknie czatu) nie zmienia podstawowej matematyki, a mimo to drastycznie zmienia nasze postrzeganie „inteligencji”.
- Systemowe uprzedzenia badawcze: Ponad połowa analizowanych prac naukowych dotyczących AI wpada w pułapkę błędnego koła, zakładając, że modele LLM posiadają ludzkie cechy jeszcze przed ich przetestowaniem.
- Potrzeba rygoru obserwacyjnego: Społeczność AI musi odejść od przypisywania modelom wyższych procesów poznawczych na rzecz skupienia się na ściśle obserwowalnych, testowalnych wynikach obliczeniowych.