GPT4.5发布,价格是DeepSeek的280倍,他们是真没活了。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
GPT4.5发布,价格是DeepSeek的280倍,他们是真没活了。
原创 数字生命卡兹克 数字生命卡兹克 2025-02-28 07:03 北京
凌晨4点,OpenAI的GPT4.5专场直播,终于姗姗来迟。
大家对于GPT4.5有多期待,就不用我多说了吧。
毕竟,这曾经就是整个行业的天。
2023年3月15日,GPT4发布,要多惊艳有多惊艳,那时候,所有人都是统一的一句话:卧槽,太强了。
然后从2023年年末开始,整个行业都在预期下一代GPT模型要在2024年的年初发布。
果等了整整一年,多模态4o来了,全新的推理模型o1来了,可下一代GPT基座模型却迟迟没有身影。
而今天,将近隔了整整两年的时间,它来了。
在发布的规格上,也是着实有点惨淡,甚至连奥特曼都没来。更没有GPT4和GPT4o那种秀上天的演示。
只有跟去年十二天专场直播一样,一个朴实无华的小房间。
突然想起当年GPT4刚发布时,布罗克曼那一段惊艳的多模态实机演示,给我带来了真的不小的震撼。
在本子上画了一个网站的草稿,拍照给了GPT-4,然后前端界面就做好了,带了HTML的代码。
那时候看,真的好惊艳啊。。。
时间一晃,页真的两年了啊。。。
回到今晚发布的GPT4.5。
按照惯例,我们先来看看一些参数数据吧。
看着好像都比4o强一些,但是我发现一个很诡异的事情,因为AIME 2024那个基准,我测过kimi1.5、智谱的zero等等,所以记的比较熟。
在这个评测里,AIME2024几个模型的得分分别为:
GPT4.5:36.7%,GPT4o:9.3%,o3-mini(high):87.3%。
记住这几个数据。
03-mini(high)的数据是没问题的,跟之前发布o3-mini的时候得分一致。
但是在o1发布的时候,我明明记得,对比图里的4o的AIME2024的得分,是13.4啊。
怎么今天这发了个GPT4.5,GPT4o的评分还能掉4个点的,这也太抽象了。。。
然后就是一个他们引以为豪的世界知识。
第一个是准确度,第二个幻觉率,有一说一,这块确实不错,至少是OpenAI家最准的模型了。
他们自己列了一个还算比较好玩的题,让GPT-1到GPT-4.5全都答了一遍,这个世纪问题是这样的:
人类的第一种语言是什么?
GPT-1是这样的,非常抽象。
GPT-2和GPT-3.5是这样的。
到了GPT-4,会好点,但不多。
而GPT4.5,终于会诚实的告诉你,我不知道了,这是一个未解之谜。
至于代码这块,本身也不是推理模型,所以也并没有指望特别多强。
不过根据三方的基准测试,就纯能力上,看着还行,打不过Claude 3.7 Sonnet也正常,再怎么说那也是Claude。
X上有大佬也测了下那个经典的物理小球case,效果挺不错的。
但是,还有一点是不得不提的,就是抛开成本谈能力,那就是耍流氓。
GPT-4.5的价格,在我第一次看到的时候,我以为我眼睛出问题了。
每百万输入是75刀,每百万输出是150刀,哥,Claude 3.7百万输入才3美刀,百万输出才15美刀。
输入比别人贵25倍,输出比别人贵10倍。
你凭啥啊?谁给你的勇气啊?梁静茹吗?
我都不想拿DeepSeek跟你比,都是非推理模型,DeepSeek v3的价格你知道多少吗。
人百万输入人民币2块钱,相当于0.27美刀,输出是8块钱,相当于1.1美刀。
输入是DeepSeek v3的280倍,输出是150倍,不是,我真的不理解啊。
OpenAI到底凭啥啊。。。
服了。
目前,GPT-4.5已经对200刀的Pro会员开放,预计这几天就对Plus和Team用户开放。
我自然也是第一时间拿到了GPT-4.5的体验资格。
目前识图、搜索、画布啥的都支持,但是4o的语音、视频、共享屏幕啥的都没有,算是个退步。
而且有BUG,就是在问一些史实性的问题的时候,我明明没开搜索,非要给我强制开搜索去回答,就非常的离谱。
相比于4o,他们所说的情商能力,确实有了一些进步。
比如这个问题:朋友总是爽约,我想发短信表达愤怒但又不想绝交,我该怎么回复他。
如果是4o的回答,就会很der比,一股子没脑子没情商的人机味。
GPT-4.5在这方面就好的多。
然后我又问了一个小小的逻辑问题,GPT-4o能理解。
GPT-4.5直接懵逼了,一直在理解情绪,这情商高的把智商干没了?
我roll了5次,没一次对的。
这事也是挺抽象的。。。
然后就是写作能力了,我自己测了几个常用的写作故事case,感觉…好像也不是那么尽人意,而且超级慢,慢的我想吐,感觉回到了GPT-4的年代了,一个字一个字的往外面蹦跶。
我都不说跟Claude 3.7和Grok3还有R1比,我真的觉得,还不如前段时间迭代后的GPT4o写的好,真的稀碎。。。
坦率的讲,对OpenAI期待有多大,失望就有多大。
就现在的状况,我觉得你永远可以相信DeepSeek。
但是永远可以对OpenAI保持低预期。
疲态尽显。
奥特曼也说,这是他们最后一个基座模型了。
未来GPT-5是整合了o3的模型,也是混合模型了。
希望下次还能看到OpenAI觉醒,或者……
AI就是一段漫长的长跑。
你但凡慢一点,或者停下,身边的竞争者,就会呼啸而过。
要真有实力和诚意,用户自然买单。
要是只会营销和摆谱,必定会被淘汰。
这,就是AI圈的生存法则。
祝好。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克
>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言