Matematyczne granice zgadywania następnego słowa
Artykuł wyjaśnia, jak działają modele autoregresyjne i dlaczego nawet mały błąd na token rośnie wykładniczo wraz z długością odpowiedzi. Pokazuje, skąd biorą się halucynacje i czemu nie znikną tylko dzięki większym danym.









