Egzamin dla sztucznej inteligencji

Player z reklamą – Radio DTR

Egzamin dla sztucznej inteligencji. FrontierMath sprawdza granice maszynowego rozumowania

Sztuczna inteligencja coraz lepiej radzi sobie z zadaniami matematycznymi – ale tylko do pewnego poziomu. Aby sprawdzić, czy modele językowe potrafią myśleć jak prawdziwi matematycy, powstał projekt FrontierMath, koordynowany przez firmę Epoch AI.

W inicjatywie wziął udział dr Bartosz Naskręcki z Uniwersytetu im. Adama Mickiewicza w Poznaniu, który współtworzył najtrudniejszy poziom testu – Tier 4. To właśnie tam umieszczono zadania, których rozwiązanie wymaga wiedzy eksperckiej i miesięcy pracy.

Reklama

– „Odpowiedzią miała być bardzo duża liczba, aby model nie mógł jej przypadkiem zgadnąć. Włożyłem w to zadanie całe 15 lat mojej pracy naukowej. Udokumentowane rozwiązanie zajęło 13 stron gęstego tekstu matematycznego” – opowiadał PAP dr Naskręcki.

Jak powstawał egzamin dla AI?

Trzydziestu ekspertów z całego świata spotkało się w Berkeley, aby wspólnie opracować zestaw 50 zadań z pięciu obszarów matematyki: teorii liczb, topologii, kombinatoryki, analizy matematycznej i geometrii algebraicznej. Każde zadanie było testowane na najnowszych modelach AI – i wielokrotnie przerabiane, aby uniemożliwić maszynom szybkie dojście do poprawnej odpowiedzi.

Na razie najlepsze modele rozwiązują jedynie 4 zadania z 50. To wyzwanie, którego – jak ocenia dr Naskręcki – żaden żyjący matematyk nie byłby w stanie w całości podołać.

AI kontra kreatywność człowieka

Badacz podkreśla, że choć AI świetnie „kombinuje” i łączy znane fakty, nie jest zdolna do tworzenia zupełnie nowych koncepcji. – „Żaden aktualny model nie wpadnie na pomysł, jak udowodnić hipotezę Riemanna. To pozostaje domeną ludzi” – mówi.

Według niego prawdziwą przewagą człowieka nad maszyną są unikalne doświadczenia – książki, sztuka, codzienne przeżycia. To z takich, nieoczywistych połączeń rodzą się pomysły, których AI nie jest w stanie wygenerować.

Koniec pruskiego modelu szkoły

Rozwój sztucznej inteligencji wymusza także refleksję nad edukacją. – „Musimy porzucić pruski model szkoły, który wychowywał posłusznych żołnierzy. Teraz potrzebujemy ludzi, którzy potrafią samodzielnie myśleć, ryzykować i budować coś nowego” – ocenia matematyk.

Kluczowa staje się tzw. „płynna inteligencja”, czyli zdolność do kreatywnego rozwiązywania problemów i nieszablonowego myślenia. Właśnie tego, jak podkreśla, AI wciąż nie potrafi.

Źródło informacji Nauka w Polsce