Egzamin dla sztucznej inteligencji. FrontierMath sprawdza granice maszynowego rozumowania
Sztuczna inteligencja coraz lepiej radzi sobie z zadaniami matematycznymi – ale tylko do pewnego poziomu. Aby sprawdzić, czy modele językowe potrafią myśleć jak prawdziwi matematycy, powstał projekt FrontierMath, koordynowany przez firmę Epoch AI.
W inicjatywie wziął udział dr Bartosz Naskręcki z Uniwersytetu im. Adama Mickiewicza w Poznaniu, który współtworzył najtrudniejszy poziom testu – Tier 4. To właśnie tam umieszczono zadania, których rozwiązanie wymaga wiedzy eksperckiej i miesięcy pracy.
– „Odpowiedzią miała być bardzo duża liczba, aby model nie mógł jej przypadkiem zgadnąć. Włożyłem w to zadanie całe 15 lat mojej pracy naukowej. Udokumentowane rozwiązanie zajęło 13 stron gęstego tekstu matematycznego” – opowiadał PAP dr Naskręcki.
Jak powstawał egzamin dla AI?
Trzydziestu ekspertów z całego świata spotkało się w Berkeley, aby wspólnie opracować zestaw 50 zadań z pięciu obszarów matematyki: teorii liczb, topologii, kombinatoryki, analizy matematycznej i geometrii algebraicznej. Każde zadanie było testowane na najnowszych modelach AI – i wielokrotnie przerabiane, aby uniemożliwić maszynom szybkie dojście do poprawnej odpowiedzi.
Na razie najlepsze modele rozwiązują jedynie 4 zadania z 50. To wyzwanie, którego – jak ocenia dr Naskręcki – żaden żyjący matematyk nie byłby w stanie w całości podołać.
AI kontra kreatywność człowieka
Badacz podkreśla, że choć AI świetnie „kombinuje” i łączy znane fakty, nie jest zdolna do tworzenia zupełnie nowych koncepcji. – „Żaden aktualny model nie wpadnie na pomysł, jak udowodnić hipotezę Riemanna. To pozostaje domeną ludzi” – mówi.
Według niego prawdziwą przewagą człowieka nad maszyną są unikalne doświadczenia – książki, sztuka, codzienne przeżycia. To z takich, nieoczywistych połączeń rodzą się pomysły, których AI nie jest w stanie wygenerować.
Koniec pruskiego modelu szkoły
Rozwój sztucznej inteligencji wymusza także refleksję nad edukacją. – „Musimy porzucić pruski model szkoły, który wychowywał posłusznych żołnierzy. Teraz potrzebujemy ludzi, którzy potrafią samodzielnie myśleć, ryzykować i budować coś nowego” – ocenia matematyk.
Kluczowa staje się tzw. „płynna inteligencja”, czyli zdolność do kreatywnego rozwiązywania problemów i nieszablonowego myślenia. Właśnie tego, jak podkreśla, AI wciąż nie potrafi.
Źródło informacji Nauka w Polsce