Question 1

GLM-4.6V 和 GLM-4.6V-Flash 有什么区别？

Accepted Answer

GLM-4.6V (106B) 是为复杂推理和云端部署设计的高性能基础模型。Flash 版本 (9B) 则是专为低延迟和消费级硬件本地部署优化的轻量级模型。

Question 2

GLM-4.6V 是真正开源的吗？

Accepted Answer

是的，模型权重基于 MIT 协议发布，允许广泛的商业和研究用途，没有其他某些“开放”模型中常见的限制性条款。

Question 3

原生工具调用（Function Calling）是如何工作的？

Accepted Answer

与将图像转换为文本描述再进行推理的模型不同，GLM-4.6V 将工具调用集成到了视觉模型本身。它可以接收图像（如截图），进行分析，并直接生成可执行的操作或工具调用指令。

Question 4

我可以在本地运行 GLM-4.6V 吗？

Accepted Answer

可以，9B Flash 版本可以在现代消费级 GPU（如 RTX 3090/4090 或 Mac M 系列）上轻松运行。106B 版本则需要大量显存（多卡配置）或通过云端推理。

Question 5

它写代码比 GLM-4.5 Air 强吗？

Accepted Answer

社区反馈显示，GLM-4.5 Air 在纯文本代码逻辑上可能仍有优势。但在涉及视觉 UI 复刻的前端任务中，GLM-4.6V 表现更佳。

Z.ai (GLM-4.6V)

支持原生视觉工具调用的开源多模态大模型