
金磊 发自 凹非寺万博客户端app下载
量子位 | 公众号 QbitAI
的确越到年底,越是伟人打架。
这不,智谱又又又发了新模子——GLM-4.7。
然后一举在代码竞技场WebDev榜单上稀奇GPT-5.2,拿下开源大模子第一!

当今网友们也正在拿它荒诞实测中,体验完险些都是清一色的“Amazing”。
径直来感受一下网友拿着GLM-4.7和Gemini 3同期作念的桌版溜溜球游戏,让网友直呼:
GLM-4.7完胜!

视频地址:https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw
那么,为什么GLM-4.7此次会在编程遵循上有这样大的逾越?
就在今天早些时候,智谱还特地在Reddit上举办了一场AMA(Ask Me Anything)行为,对于背后的一切,都依然回答得了了明了。
对于GLM-4.7,智谱回答一切
这场对话不仅揭示了GLM-4.7如何通事后纯熟已矣性能飞跃,还初次深度曝光了自研的强化学习框架——Slime。
咱们整理了这场AMA的中枢精华,望望这个被称为“Claude Code最好平替”的国产模子,究竟是如何真金不怕火成的。
模子性能与优化
开首就是众人最为护理的,为什么GLM-4.7会在体感上有如斯说明的逾越。
智谱团队在AMA中明确暗示,GLM-4.7的更动主要吞并在后纯熟阶段。
在SFT(监督微调)和RL(强化学习)阶段,团队收受了更精细的发布配方(Release Recipe)。通过对不同畛域数据集的对皆,模子不仅在基准测试上跑分更高,在骨子部署中的领会性也大幅普及。
而针对社区对于“为何不出更大参数目模子”的疑问,智谱团队直言:
纯熟成本和部署成本是推测打算的中枢锚点。
GLM-4.7在推测打算之初就商量了硬件胁制。团队方针是让模子在亏空级显卡上也能跑出Air版块的生动性,同期保持接近30B甚而更高畛域的逻辑才调。这种在有限参数下压榨极致性能的念念路,恰是为了让AI真实落地。
除此以外,智谱共享了他们设置的一套复杂的预纯熟数据经过:
多源集合: 涵盖从高质地论文到演义等各种文本。极致算帐: 包含去重、质地过滤和明锐词筛查。对皆计谋: 重心关注SFT和RL阶段,让写稿作风不再像机器东说念主,而是愈加生动致密。模子哄骗场景与功能
如果说往日的GLM是个有些寂寞的理科生,那么4.7版块则是完成了一次情商逆袭。
在AMA中,开荒者问得最多的就是编程。智谱团队坦言,他们针对Claude Code作念了无数的优化和适配责任。
咫尺,GLM-4.7在多说话编码方面进展出色,不仅救济Python、JS,在一些相对冷门的说话和复杂的逻辑架构上也展现了极强的交融力。
团队合计,智能体框架对性能的影响占比高达30%,因此GLM-4.7在系统辅导词、器用调用层级上作念了深度打磨。
为了让模子更像东说念主,团队从无数演义和脚本中吸收营养。
当今的GLM-4.7在创意写稿时,细节描述愈加丰富,不再只会说“在一个阳光明媚的下昼”这种套话。在扮装璜演任务中,它能更好地督察东说念主设,减少出戏的频率。
除此以外,GLM-4.7还引入了一个极端硬核的功能:交错念念考(Interleaved Thinking)。
在实践为作或调用器用之前,模子会先进行一段隐性念念考。这种访佛OpenAI o1的念念维链机制,让它在处理复杂的多模态任务(如看图写代码、图表分析)时,减少了减弱操作的概率,提高了准确度。
时间措施与器用
智谱之是以在国外社区受迎接,与其积极拥抱开源的立场密弗成分。
此次AMA最让东说念主惊喜的莫过于Slime框架的公开。
为了处置大模子强化学习遵循低、领会性差的问题,智谱研发并开源了Slime。
这个框架专为大畛域强化学习推测打算,救济多种对皆算法。它的名字寓意着“生动且具有极强得当性”,能够匡助开荒者更容易地复现GLM级别的对皆遵循。
智谱暗示,他们从开源生态中获益良多,因此也乐于回馈。
他们细心描述了从数据网罗、算帐到质地过滤的完整活水线。这种透明度在咫尺的国产大模子厂商中并未几见,也获得了LocalLLaMA社区的一致尊重。
在 Reddit 上,智谱团队展现了极其接地气的一面。
灵验户问:“你们纯熟时碰到最不测的挑战是什么?”
团队回答:“最大的挑战其实是发布配方。就像厨师手里有最好的食材(数据),但如何掌抓火候(RL参数)让它在出锅时最完满,频频需要无数次的推倒重来。”
还有东说念主辱弄:“GLM-4.7是不是吃了什么灵丹灵药?”
团队则幽默回话:“主若是咱们学会了如何让它在行为之前多想一想。”
实测GLM-4.7在了解完GLM-4.7背后的“奇技淫巧”之后,咱们如故老限定,一波实测走起~
开首值得看重的是,当今在z.ai上搞开荒,最好是点开“全栈开荒”的按钮:
然后咱们先作念一个植物大战僵尸来小试牛刀,Prompt如下:
请基于面前目次准备的素材(下载 https://z-cdn.chatglm.cn/temp/Grazy Dave.mp3 动作游戏音乐, 下载 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目次下的各种植物与僵尸静态/GIF图片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif),作念一个《植物大战僵尸》游戏。
不错看到,相似是经典的测试游戏,此次在体感上是“声色俱全”的那种(体验连气儿放底下了):
https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361除了游戏以外,GLM-4.7另一个体感上的跃迁,即是作念PPT了,这个demo的Prompt极其浮浅:
作念一个先容巴黎的PPT。
不错看到,PPT的遵循依然达到了径直商用的进程:
除此以外,作念海报亦然GLM-4.7的一绝。
举例推测打算一张宣传领会鞋的海报,对比GLM-4.6和GLM-4.7,遵循的差距就一目了然了:
从各样遵循来看,也就不难交融为什么此次GLM-4.7会在X上被刷屏了。
本心上市后不时开源在此次AMA中,除了时间硬核细节,围不雅众人最护理的莫过于智谱要上市的事情了。
毕竟最近对于智谱拟赴港IPO的音书激发了圈内不小的关注。
Reddit上有资深老哥尖锐提问:“一朝公司上市,你们是否会缩减开源插足?”
智谱团队给出了一个极端刚烈的宽心丸:“开源是咱们的中枢基因,不管本钱旅途如何变化,咱们本心上市后将不时开源。”
团队解释说念,智谱深知其成长离不开开源生态的润泽。不时开源不仅是回馈,更是保持时间最初、设置开荒者范例的最优旅途。这种“即便敲钟,也要开卷”的姿态,如实让不少国外开荒者直呼“Respect”。
通过交错念念考普及智商上限,通过Slime框架表率纯熟经过,智谱正在用最硬核的神情诠释:国产模子不仅能跑分,更能实战。
况兼从用户们的响应来看,GLM-4.7以及智谱长久以来的责任亦然被赐与了高度的认同。
举例有网友从价钱角度评价说:
GLM 4.7的1年订阅(接近Opus 4.5级别)= Codex/Claude Code的1个月Max Plan。
我当今就立马订一年的。
包括估值40亿好意思元的Fireworks也在Day0救济GLM 4.7,嗯,好意思国东说念主亦然有更好的模子收受了。
除此以外,在AMA的中,智谱团队说了一句让东说念主期待的话:“咱们会为了AGI在来岁作念更多的孝敬。”
在此基础之上,智谱首席科学家唐杰在GLM-4.7发布之际发表了他对于大模子发展的一些不雅点。
原连气儿:https://weibo.com/2126427211/QjIYhCmfq
在IPO的灯光亮起之前,智谱收受先点亮开荒者的屏幕。这种长久目的的淘气,大约恰是大模子时间最稀缺的底色。
— 完 —
量子位 QbitAI · 头条号
关注咱们万博客户端app下载,第一时刻获知前沿科技动态