我体验完刚发布的Claude3.5,发现最强的是这个新功能。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
我体验完刚发布的Claude3.5,发现最强的是这个新功能。
原创 数字生命卡兹克 数字生命卡兹克 2024-06-21 05:58 北京
OpenAI的最大对手,Anthropic,没有任何预兆的,官宣了自己的新模型。
Claude 3.5 Sonnet。
Claude3家族原本有三个参数量级的模型,分别是:
Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
可以理解成Opus(大杯)、Sonnet(中杯)、Haiku(小杯)。
而这一次,是把中等参数模型Sonnet的3.5升级版放了出来。
在跑分上,除了MMLU(本科水平的知识)和MATH(数学能力)上,基本都达到了最佳。
此处要注意,Claude 3.5 Sonnet只是一个中等参数模型,在参数量级上远远达不到Claude 3 Opus的级别,但是在跑分上超了,这就很恐怖。
而在多模态的视觉能力上也基本达到了全面领先。
除了视觉问答(MMMU)离GPT4o还查了小1个点之外,其他的4项:视觉数学推理 (MathVista)、科学图表理解 (AI2D)、图表问答、文档视觉问答 (ANLS),都达到了最佳水平。
最搞的是,Anthropic在发布Claude 3.5 Sonnet前为了预热,搞了一段小插曲,他们发了一段谜语。
我看了半天也没看明白,然后朋友跟我说,视频里面的是摩斯密码,转换过来是Sonnet,上面的密码要用维吉尼亚密码去破,那一刻我才焕然大雾。
于是我扔给了GPT,GPT给我破译了出来,得到了一段诗。
No more be grieved at that with which thou hast done - 不再因你所做的事情而感到悲伤。
Roses have thorns and silver fountains mud - 玫瑰有刺,银色的泉水也有泥。
All models err yet between the third and fourth - 所有的模式都会出错,但在第三和第四之间。
Run our new creation blooms a wiser bud - 我们的新创造将绽放出一个更智慧的花蕾。
说实话破完了又一次给我干懵逼了,这个谜语让我感受到了我智商的低谷。。。
搜了半天,然后发现这段,原来是莎士比亚的第35首十四行诗,而十四行诗,其实对应的单词就是Sonnet。
那这下,答案就呼之欲出了,Anthropic要发Claude 3.5 Sonnet了。
就在我兴致勃勃的准备去炫耀我解出来谜题的时候,发现Anthropic已经发公告正式官宣发布Claude 3.5 Sonnet 10分钟了。。。
全世界都知道了,而且是在我花了好大力气解完谜题之后,尼玛,瞬间有一种被Anthropic背刺的感觉。
话说回来,除了以中等参数实现了综合跑分第一外,Claude 3.5 Sonnet的运行速度是Claude 3 Opus的2倍,但是定价会更便宜,毕竟是中等参数的模型。
推理能力也确实有了提升,但是坦率的讲,对于普通用户来说,可能直观的差异性,不是很大。
最让我惊喜的,其实是他们的新功能,Artifacts。
当用户要求 Claude 生成代码片段、文本文件或网站设计等内容时,右边就会多出来一个实时的窗口,这个就是Artifacts。
这个功能需要手动开启,点击头像,有个Feature Preview,点进去,把Artifacts打开就行。
比如说,我想让Claude帮我做一个横版跳跃的小游戏,坤哥跳过各种障碍物的小游戏。
我在打开Artifacts后,先让claude给我画一个主角,跟它说:
给我画一个8-bit的svg小人,灰色身体,白色头发,旁边有一个篮球。
他就会嘟嘟的写代码,这时候,右边的Artifacts窗口就会被打开。
所有代码全部写完后,他就会出来一个预览和code的tab,此时,你就可以直接在Artifacts窗口里的预览tab看到画出来的svg小人了。
然后,我们在让claude帮忙画一些装饰的鸡。
主角有了,鸡有了,现在,我们让claude帮忙做一个游戏,一个横版的跳跃游戏,我们的主角坤哥需要不断的跳过一只一只的小鸡。
我直接说:现在,请帮我做一个横版的跳跃游戏,可操控的主角是8-bit的小人,需要跳过的障碍物是不断迎面而来的一只一只不同的小鸡,背景是蓝色的天空。我每次按空格键就是跳跃。
很快,代码就写好了。
然后,我们在预览窗口,是真的,可以直接玩这个游戏的。
虽然把篮球给我干消失了,但是无伤大雅。
所以,Artifacts对于很多开发者来说,未来,是有巨大的效率提升的,直接以可视化的方式展现在你的面前,甚至,还是可以交互的。
可以预期到,未来例如网页设计等等,会有巨大的效率提升。
甚至,你可以在Claude里,直接做一个PPT。
就非常的离谱。
相比于模型的更新,这种功能的更新,可能会实打实的更让我兴奋,它真的可以提升效率,以及整出不一样的花活。
而ChatGPT虽然也有类似的交互,但是也只局限于一些数据分析场景。
Claude,这次,是做了大幅度的进化。
最后,Anthropic说,会在今年晚些时候,放出Claude 3.5 Haiku 和 Claude 3.5 Opus。
也在探索ChatGPT目前特有的记忆功能。
反正,这些模型厂商卷起来,对我们普通用户来说,肯定是好事。
只是老黄,可能要抱着他的英伟达,在那个铁王座上,坐的更久一点了。
还有那个奥特曼。
你的GPT-5,到底啥时候端上来?
哦不对,先把你的完全版的GPT4o端上来再说吧。
一个多月了,我还没用上新语音和新视觉呢= =
呸,渣男。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言