智谱AI静悄悄的上线了一大波新模型,过年了,真的。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
智谱AI静悄悄的上线了一大波新模型,过年了,真的。
原创 数字生命卡兹克 数字生命卡兹克 2024-08-29 21:56 北京
智谱今天下午在KDD 2024上面,悄咪咪的上线了一堆的超级更新。
我真的服了,我本来今天从泰国回来,准备休一天假的,结果晚上又坐在电脑面前被迫营业。
他们总是每次,静悄悄的就把4个2给扔出去了。
嗯,就一场演讲了,发布了一堆新模型还有新功能,个顶个都很猛。
我挨个列一下:
大语言模型GLM-4-Plus。
图像和视频理解模型GLM-4V-Plus。
AI绘图图模型CogView-3-Plus。
智谱清言上线“视频通话”
而且,这些新模型,已经全部上线了他们的开发者平台,现在,开发者已经可以直接调用API去进行开发了。。。
至于上线到智谱清言上面给普通消费者用,可能还得几天,我线上试了一下还都是老模型,毕竟模型太多了,这切换上去估计也费点时间。。。
说实话,我懵逼了,也麻了。
智谱AI就一直都是很这种地主家的傻儿子的感觉,这但凡是OpenAI,发这么多东西,必须让你先猜谜语3天,跟你玩个大反转。。。
一个一个说下:
GLM-4-Plus
全新的模型,看了下跑分整体基本上正儿八经的追平了GPT4o,而且智谱这家公司是很实诚的那种,真的不如就是不如,真的超过就是超过,不弄虚作假,所以这个跑分还是非常可信的。
AlignBench(对齐和遵循指令能力)还有MATH(数学能力)基本跟GPT4o打平,GPQA(小学问题)和LCB(代码)这块能打平GPT4o但是跟Claude 3.5还是有一些差距,Claude 3.5实在是太强了。
长文本这块,能力基本是打平或者超越。
我也去后台跑了一下GLM-4-Plus,效果确实是比之前强了。
至少之前我测试的那个很坑爹的调休问题:这么多AI大模型,就没一个能算清今年这破调休的?
基本所有的大模型都全军覆没,只有Claude3.5能连续答对5次。
而新的GLM-4Plus,这次居然也连续答对5次了。
很强,很猛。
而这个经典的动物过河问题:“农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。”
GLM-4-Plus也是3次连对,这道题之前也是所有的大模型全军覆没,甚至Claude3.5都错了。
很强,非常强。
而价格这块,算不上便宜,中规中矩价格吧,比Claude3.5贵。
GLM-4v-Plus
终于支持视频理解了,这点很强,而且很爽。也可以直接理解网页内容,然后转换为 html 代码。
基本每项都能超Glaude和GPT4,但是唯独MMMU-Val(多模态和多任务理解能力方面表现的基准测试)拉了,还有很大的进化距离。
功能这块也是最齐全的。
我在后台跑了下。
图片理解没啥问题。
但是后台有个小BUG,就是明明支持视频理解了,但是后台的测试不支持视频上传。
就很坑。
价格这块,也不算贵。
毕竟这也算是国内首个通用视频理解模型 API。
CogView-3-Plus
他们也终于更新了新的绘图模型,说是有了大幅进化。
但是我实际测下来,嗯坦率的讲,离Flux、Midjourney这种肯定还有不少距离,但是至少在美感上,智谱的这个AI绘图模型是比以前进化很多了,容易不再是偏理工的审美了。。
放几张我在后台跑的图。
能看了。
智谱清言“视频通话”
我因为某些奇怪的关系,所以智谱的很多内测,我基本都会第一批拿到。
那这个智谱清言的“视频通话”,我也是今天发现,我能直接用上了。
路径在此:
在我打开摄像头,看着自己出现在视频里,和小智对话的那一刻。
次元壁感觉破了。
“你好,我是小智。很高兴见到你!”虚拟助手的声音从扬声器里传来。
这感觉真奇妙啊。以前和AI聊天,总觉得它是个看不见的“幽灵”。现在突然多了个“眼睛”,让AI更“真实”了。
我随手跟他聊了聊。
这应该也是国内第一个类GPT4o的视频通话功能。
可以标记,不过可惜的是声音能明显的感觉到是极低延时的TTS,在实时对话中是可以打断的。但是依然不会唱歌,没有太明显的情绪。
但是这种随时可以打断,并迅速切换话题的能力,在GPT4o还是个大期货的状态下,还是很有用的。
有趣,而且够实用,时间不够,没有太多的去玩,等我后续好好再体验一下。
但是体验上视频理解能力还不是完全体,有一些问题,好像视频理解能力没有上最强的,我期待一下后面的更新。
大多数用户应该都还没拿到,如果想用的,可以用这个链接里扫码申请,应该会很快:
https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf
写在最后
智谱这家公司,在我心中一直都是一个很特别的存在。
就像那种在少林寺中的扫地僧,经常默默的干活,不时给你来个大的。
而且,不只是一个概念产品或远期目标,而是已经可以投入使用的实际技术。
这种“直接拿出真东西”的做法,展现着我们的态度。
再看看大洋彼岸。
每天拿着虚无缥缈的草莓再营销的公司。
嗯,我还是喜欢我们,自己家的东西。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克、东毅、小瑞
>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言