智谱AI深夜上线全新Agent GLM-PC,再见仍是巅峰。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
智谱AI深夜上线全新Agent GLM-PC,再见仍是巅峰。
原创 数字生命卡兹克 数字生命卡兹克 2025-01-23 12:25 安徽
年前AI圈混战,热闹程度不亚于23年3月,一个个都卷麻了。
OpenAI半泄漏半预热搞了半天的Agent产品Operator还没来。
智谱的新版Agent GLM-PC悄无声息的憋了个大的,直接先来了。
昨天夜里,智谱突然让我帮忙试一下他们的Agent。
真的是夜里。。。
AI圈好热闹,但是作为一个自媒体,我的肝好想说:
求求了,大过年的,放过我吧。。。
没办法,为了首发,咋办呢,只能熬夜一个通宵,肝他娘的。
还好,在体验了一夜后,GLM-PC 1.1版本,没有让我失望。
虽然小问题还是有一些,但,前路已明。
可以说,如今AI领域,最让我兴奋、最让我觉得科幻的,也只有Agent了。
也给大家简单过一下他们Agent的历史。
2024年10月25日,智谱在CNCC发布了第一款手机自主人工智能,AutoGLM,直接在行业内和金融市场上掀起了风暴。
2024年11月29日,智谱在Agent OpenDay上,宣布升级版的AutoGLM,还有电脑版本的自主人工智能,GLM-PC 1.0内测版。
但是那时候,GLM-PC还是非常不成熟的,我也在当时的发布会现场写到:
终于,两个月以后,GLM-PC 1.1正式版,来了。
复杂任务拆解能力大幅强化,任务成功率比1.0高太多太多了,操作速度直逼人类,每步操作几乎都在1.5s以内,虽然别看只是0.1版本的升级,但我觉得他们内部对比版本号命名还是保守了,其实完全可以叫2.0的,再不济1.5也是可以的。。。
而且,Mac和Windows,全都都可用了。
跨越时空,智谱AI也完成了7年前,老罗在鸟巢那个“理解万岁”的梦。
也不知道,老罗看着如今的GLM-PC 1.1版本,会不会也摇着扇子,感慨到:我当年那个TNT也是很酷的啊,就是这么想的啊…如果我们晚做7年…可惜啊,没有如果。
网址在此:https://cogagent.aminer.cn/home
下载注册以后,就会来到首页。
虽然我也不知道智谱他们为啥要给GLM-PC取名叫牛牛,可能,是因为GLM-PC作为新时代的Agent代表,可以堪称赛博牛马?…
这次最大的功能更新,是他们加入的深度思考。
类似于OpenAI o1那种做法,你给GLM-PC发一个任务,他会给你先生成一套非常详细的思维链,自己给自己想明白以后,再去执行。
比如说给微信上的“熬夜测试”群的所有群成员发送2025年新春祝福语。
他会一步一步思考、拆解、返回结果,即使失败了也会自己PUA自己来进行重新反思。
而且最特别的是,跟手机端的AutoGLM不一样,这次更新明显不只是纯视觉方案了,还引入了代码机制。
生成的内容,是函数,在上图中,能看到两个GLM-PC定义的函数LAUNCH_APP和CogAgent。
这个点非常有意思,代码是极度严谨、规范、正确率高的方式,他们抛弃了传统的思维链,而是使用代码式的思维链,在我几个小时的体验里,明显能感觉到,在这套逻辑的加持下,GLM-PC对复杂任务的规划、推理、和反思的能力,得到了明显的强化。
之前GLM-PC 1.0版本的模型,是智谱在2023年就开始做的多模态GUI Agent - CogAgent,去年12月20他们也直接开源出去了,能感知和理解交互界面中的视觉元素与布局,模拟人类做出任意元操作,就比如点击、键盘输入、悬浮、拖拽那些。
而这次加入代码后,通过代码思维框架和图形界面的结合,有点像神经心理学理论中的左右脑,为右脑补齐了理性的左脑,成了一个真正完整的智能。
看看上面这个case的实际运行效果。视频为了大家观感,我都做了2倍速处理。
整体上,一气呵成,直接给我测试群里四个人,全部发了一个新春祝贺,甚至还是定制化的,每个人都写了名字,内容还不一样。
我还能说什么好呢?
真的,玩AI这么久,体验了几百款AI产品,我已经很久没有被AI所震撼了。
但是当这种任务,在电脑上,AI理解我的意图后,自动化完美的处理完成的时候,我才真真切切的感受到。
科幻变成现实的感觉。
全世界,智谱,是第一个做到的。
这一刻,怎么吹国产AI,我觉得都不为过。
2025,必是真正的Agent之年。
我也希望,是属于智谱Agent,璀璨的一年。
除了单纯的发微信文字消息,你还可以让AI,给你制作图片和视频,自动发送过去。
比如,我想让GLM-PC,给微信上的“鲜虾包”发送2025年新春祝福语,再给他制作一个新春图片和一个新春祝贺视频,发送给他。
不止发文字,GLM-PC还直接调用智谱自己的接口,创作了图和视频,发给了鲜虾包。
太太太太牛逼了。
这个图片和视频的美感虽然确实有点不太好看,但是不妨碍作为Agent的这个能力,直接酷到爆炸好吧。
又比如我还可以让它:
直接一气呵成。
虽然最后出现了BUG,一直卡死在时间循环那了,因为调用错了时间,且飞书日历只有半点和整点,时间匹配不上,所以没能成功。
但是在我看来,依然瑕不掩瑜。
整体测试上,在多步任务上表现还算是比较稳定的。
比如马上春节了,我们可以让它:打开小红书,在小红书搜索春节习俗,获取前三篇的图片和文字介绍,扩写成一篇文章,保存到桌面Word文件。
可以看到,这些任务都执行的很好,把前三篇的文章都保存下来了,还能扩写,word文件也保存的很好。
你什么都不需要干,只需要一句话,一篇word就完事了。
这一瞬间,我感觉,我看见了未来。
我脑子里莫名其妙想到的一个场景。
我穿越回到了1976年,在加州那个著名的车库里,我面前站着乔布斯和沃兹尼亚克,看着他们正在焊那个具有革命意义的Apple I,我拉着他们走到旁边,说:
**嘿,给你们看一个神迹。
**
这叫,人工智能。
你看,我也见证了一个新的时代,见证了人机交互的又一次变革。
GLM-PC 1.1的出现,固然还有很多不足之处,比如任务成功率不是百分百,有时候也会陷入死循环。还会对着屏幕乱点,屏幕尺寸的支持也不是很好,我的带鱼屏直接没法用,只能拔了外接屏幕用我的笔记本标准分辨率的屏幕。
甚至,在我们的幻想里,真正的Agent,应该是可以打开剪映给我们自动剪个片子,打开Blendr自动建个模,它应该是个无所不能的超人。
当然,今天,AI还没有达到这一步。
但是永远不要怀疑,AI的潜力。
凌晨5点,我合上电脑,关灯入眠。
隐约中,我仿佛看到了一束光。
想来,当它再次亮起的时候。
我或许会跟着它一起,走得更远,更深。
走向那个,与现在相连的未来。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克、dongyi
>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言