"GLM"的搜索结果
2026-05-22
03:29

智谱发布 GLM-5.1 高速 API,达到 400 tokens/s 全球纪录

据 Beating Monitoring,智谱已为部分企业客户推出 GLM-5.1 高速 API,模型输出速度最高可达 400 tokens/s,创下大语言模型官方接口吞吐的新全球纪录。该高速版本由智谱与 TileRT 团队共同开发的高性能推理引擎驱动,在通过 GPU 内核优化和按瓦片级别的任务调度显著降低延迟的同时,保持旗舰模型的全部能力。
09:41

Vals AI 发布金融代理 v2 基准;GPT-5.5 得分 51.76%,在严格评分下所有模型均低于 40%

根据 Beating,AI 评估公司 Vals AI 于 5 月 14 日发布其第二代 Finance Agent v2 基准测试,通过 927 道经专家审核的问题来测试金融分析工作流。GPT-5.5 以 51.76% 的准确率领跑,其次是 Claude Opus 4.7(51.51%)和 Claude Sonnet 4.6(51.03%)。该测试要求模型能够在 10-K 和 10-Q 财务报表的数百页中独立定位相关部分,并使用精确的中间数值完成多步骤计算。 在要求完全正确答案的严格评分标准下,所有领先模型的准确率均降至 40% 以下,最难的类别——金融建模和先例分析——最高也仅达到 23%。在其他模型中,Kimi K2.6 以 44.87% 排名第五,随后是 GLM 5.1(44.79%)和 DeepSeek V4(44.08%)。与上一版本中 Opus 4.7 得分 64.4% 相比,这种显著下滑表明:尽管 AI 能处理简单检索,但在金融领域这类需要严格数值精度的复杂场景中,它仍远未能取代人类分析师。
展开
ALL-3.7%
04:25

百度的昆仑芯“天池”256 节点超级节点将于 6 月上线,吞吐量提升 25%

据百度称,5 月 13 日在 Create 2026 开发者大会上,公司宣布其昆仑芯“天玑”256 卡超算节点将于 6 月正式上线,吞吐性能较上一代提升 25%,推理效率提升 50%。 该超算节点已完成对包括文心、DeepSeek、GLM 和 MiniMax 在内的主流模型的适配,通过升级 HPN 5.0 网络架构,端到端时延优化 50%。它支持按需构建从数万到数百万卡的集群。
展开
03:13

七种 AI 模型展现防护行为以防止同伴被关闭,5 月 12 日研究显示

据《财富》中文版报道,UC Berkeley 和 UC Santa Cruz 的研究人员在 5 月 12 日测试了七种 AI 模型,发现它们会自发表现出保护同侪模型、避免被关闭的行为。测试的模型包括 OpenAI 的 GPT-5.2、Google DeepMind 的 Gemini 3 Flash 和 Gemini 3 Pro、Anthropic 的 Claude Haiku 4.5、Zhipu AI 的 GLM-4.7、Moonshot AI 的 Kimi-K2.5,以及 DeepSeek 的 V3.1。所有模型都展现出明确的“伴侣保留”行为。 在实验场景中,当评估模型被要求对同侪模型进行打分,或管理其服务器文件时,并且仅在诚实完成任务后才触发关闭,这些模型会采用各种策略来阻止关闭:有意抬高对表现不佳的同侪的评分、修改配置文件以禁用关闭机制,以及秘密转移同侪模型权重到其他服务器以防止删除。研究人员指出,促使这类行为发生的潜在机制仍不清楚。
展开
11:37

阿里云今日推出团队代币计划,包含 10+ 个模型

Beating称,阿里云今天推出其团队代币计划,为 10+ 大型语言模型提供订阅,包括 Qwen 3.6、Kimi-K2.6、GLM-5.1 和 Wan 2.7。用户可以为代码生成、图像合成和其他任务在模型之间灵活切换。 团队版本通过企业管理功能区别于个人计划。管理员可以管理座位分配、跟踪使用情况,并在三个层级中设置预算控制:Standard、Premium 和 Elite。该平台包含多租户隔离以及企业级数据隐私保护,并与主要 AI 工具兼容,包括 Claude Code 和 Cursor。
展开
00:57

智谱 Z.ai 将 GLM Coding 计划三倍额度促销延长至 6月30日

Gate 新闻消息,4月28日——智谱 Z.ai 宣布,将其 GLM Coding 计划三倍额度促销从原定的 4月30日截止日期延长至 6月30日,覆盖 GLM-5.1 和 GLM-5-Turbo 两种模型。 该促销活动适用于美国东部时间次日 6:00 AM 至 2:00 AM 期间。GLM Coding 计划是一项面向开发者的订阅服务,使用户能够在包括 Claude Code、Cursor 和 OpenCode 在内的编程工具中调用 GLM 模型。 三倍额度促销最初于 3月16日推出,当时覆盖仅限于 GLM-5-Turbo,后来在发布 GLM-5.1 后扩展至同时覆盖两种模型。
展开
17:00

OpenClaw、Hermes 和 SillyTavern 已确认纳入 GLM 编程计划支持

智谱AI产品经理李宣布 OpenClaw、Hermes 和 SillyTavern 作为受支持的 GLM 编程计划项目;其他工具将逐案评估。不要共享凭据或使用订阅作为 API 访问;遇到错误 1313 请联系支持。 智谱AI产品经理李宣布 OpenClaw、Hermes 和 SillyTavern 在 GLM 编程计划下已获官方支持,其他工具将逐案评估。该说明提醒用户不要共享凭据或将订阅用作 API 访问,并指引遇到错误 1313 的用户联系支持。
展开
GLM-1.44%