AI圈的头条被DeepSeek占据多日,直到OpenAI推出了全新的推理模型系列o3-mini。这次不仅向免费用户开放了推理模型,而且成本相比之前的o1系列降低了15倍。OpenAI表示这是其推理模型系列中最新、最具成本效益的模型。
新模型上线后,网友们迅速将其与国产大模型DeepSeek R1进行对比。此前,AI社区热衷于用DeepSeek R1和其他模型进行编程挑战,比如编写一个Python脚本,让球在某个形状内弹跳并保持在形状内。这种任务需要模型识别物体间的碰撞,并确保物理效果准确。
在这项测试中,DeepSeek R1曾表现出色,甚至超过了OpenAI的o1 pro。不过,随着o3-mini的推出,情况发生了变化。有帖子声称o3-mini在某些方面超越了DeepSeek R1,引发了大量网友关注。
例如,在一个开发者发布的测试中,要求两个模型分别编写一个球在旋转六边形内弹跳的Python程序,小球需受重力和摩擦力影响。结果显示,o3-mini对碰撞和弹跳的处理更为出色,而DeepSeek R1的小球似乎不受重力控制。