studio Open AI rileva un tasso di errore per i 4 modelli di ChatGPT, con allucinazioni che vanno dal 48% al 90%.
- 01-preview: Il miglior modello, 42,7% di risposte corrette, 9,2% non risposte e 48% di errori.
- GPT-4o: 38,2% risposte corrette, 1,0% non risposte e 60,8% di errori.
- o1-mini: 8,1% risposte corrette, 28,5% non risposte e 63,4% di errori.
- GPT-4o-mini: 8,6% risposte corrette, 0,9% non risposte e 90,5% errori.
Introducing SimpleQA | OpenAI – (generatori di errori) – UPDATED – Quinta’s weblog
