kybernaut_01
No Fate!
Thema Reasoning / Logische Schlussfolgerung… OpenAI hat jetzt einen Benchmark mit Testfragen veröffentlicht:
www.heise.de
![www.heise.de](/synthesizer/proxy.php?image=https%3A%2F%2Fheise.cloudimg.io%2Fbound%2F1200x1200%2Fq85.png-lossy-85.webp-lossy-85.foil1%2F_www-heise-de_%2Fimgs%2F18%2F4%2F6%2F9%2F9%2F8%2F4%2F3%2Fshutterstock_2395623655-70c69c0f0525df6d.jpg&hash=ad2f18bfae1b7b35abfc2280dddf6165&return_error=1)
OpenAI legt SimpleQA vor: Neuer Test für Halluzinationen
KI-Modelle haben Schwierigkeiten mit Faktentreue und kurzen, präzisen Antworten. OpenAI will das nun messbar und vergleichbar machen.