OpenAI官方数据：ChatGPT o3瞎编能力比o1高两倍

2025-04-24 12:40:02 来源：新经网作者：冯思韵

很多朋友不知道【OpenAI官方数据：ChatGPT o3瞎编能力比o1高两倍】，今天小绿就为大家解答一下。

　　OpenAI官方数据显示，在专门检测幻觉的PersonQA测试中，o4-mini准确率低于前代o1和o3，编造频率更是o1的三倍。而性能更强的o3虽然整体准确率提升，其编造概率却比o1高出两倍。研发团队坦言，即便为模型加入图像分析和联网检索能力，仍无法解释为何升级后的产品更容易"信口开河"。

　　实际使用中，o4-mini有时会过早给出结论，这或许暗示着信息加工过程中存在失真。可以预见的是，在未来相当长时间里，保持对AI输出的审慎核查仍是必要动作。毕竟在追求智能的道路上，真实与幻象往往只有一线之隔。

　　【CNMO科技消息】ChatGPT的性能还在持续进化。但用户很快发现这类AI有时会给出错误答案，甚至能一本正经地编造看似合理的内容。

　　经过技术迭代，如今ChatGPT及其竞品已能提供部分信息来源，尤其在联网搜索场景中。不过很多人的使用习惯始终未变——坚持要求AI为每个结论标注有效链接，发现错误立即纠正。虽然未来更先进的模型可能解决"幻觉"问题，但当前最新发布的ChatGPT o3和o4-mini反而呈现出更明显的编造倾向，这成为AI发展路上耐人寻味的现象。

　　有趣的是，这些新模型确实展现出惊人潜力：通过照片定位拍摄地点，深度解析网页信息，甚至构建复杂的思维链条。但就像不受控的想象力，它们总会在推理过程中夹杂虚构内容。OpenAI工程师至今未能破解这个技术困局。

以上问题已经回答了。如果你想了解更多，请关新经网网站 (https://www.xinhuatone.com/)

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

相关推荐