国外一网友发帖吐槽GPT-4o新模型“偷懒”。
起因是这位网友在大模型竞技场对GPT-4o新老两代模型进行了测试,结果令人意外。
他输入了大量文本,要求模型进行翻译。
最后旧版模型gpt-4o-2024-05-13顺利完成了任务,而新版模型gpt-4o-2024-08-06却直接拒绝了翻译请求。
这一结果让他感到失望,因为他原本期待新模型能够提供更加强大和灵活的服务。
帖子下的网友纷纷评论:可别下一步变成Claude 2.0啊... ...
有网友跟帖回复:我之所以用GPT-4o不用Claude就是因为它限制太多了,要是GPT-4o限制也这么多的话,那我也不用它!
当然也有人出谋划策,说可以在模型训练时惩罚它的拒绝行为,从而降低拒绝率... ...
要知道这次的最新模型gpt-4o-2024-08-06,在ZeroEval基准测试可是直接跃居第一名。
输入和输出分别节省50%、33%,token输出也从4k扩展到16k。主打一个更强更便宜。