2025-10-09T09:55:53.png

阿里昨天发布的代码模型 Qwen3-Coder,有 4800 亿参数,是阿里迄今为止最具代码推理能力的代码模型,官方宣称“可以与 Cluade Sonnet4 媲美”。

下面是官方宣称的一些关键信息:

  • 旗舰版本 Qwen3‑Coder‑480B‑A35B‑Instruct 是迄今为止最具“agentic coding”能力的开源模型;
  • 在 Agentic Coding、浏览器和工具使用等任务上达到了开源界 SOTA,与 Anthropic 的 Claude Sonnet 4 不相上下;
  • 上下文支持 256K token 原生,配合 YaRN 可扩展至 1M,使其可胜任大规模仓库与多轮交互场景;
  • 通过 7.5T 数据(70% 代码)增强训练,并加入 agentic RL,达成在 SWE‑Bench Verified 等实际工程任务上的 SOTA 性能。

还好是阿里发布的,这要是菊花发布的,大嘴高低得喊俩小时的遥遥领先。

2025-10-09T09:56:15.png

我在社区看到很多人体验后说效果确实很不错,编码能力确实出众。我本来也想试试,但在看到很多网友吐槽费用后,果断放弃了:

2025-10-09T09:56:34.png

网友们遇到的情况大都是一个问题下去或者还没用一会,二三十块的欠费提醒短信就来了。

感觉这回阿里云有点套路云的意思了。

总的来说,阿里这次确实表现强劲,多位开发者实测发现 Qwen3‑Coder 在编码复杂逻辑(如权限系统、ACL)时能“一次成型”,表现不输 Claude Sonnet 4、Opus 等主流闭源模型,这也算是验证了官方的宣传确实没有吹牛。

缺点也明显,就是贵。

虽然模型是开源的,理论上你自己也可以跑一个用用,但 420B 参数不是消费级硬件能撑得起来的,我问了 ChatGPT,说至少要 8 个 A100。

有人之前用 Mac mini 4 集群跑大模型,我也问了下,说不行,多少都不行。

话说,这次阿里来卷 AI 编程,有网友调侃说是因为 AI Agent 唯一的落地场景就是帮程序员写代码,别的没啥好做的,只能来卷写代码了。

这让我想起当年区块链火爆的时候,我就说过区块链唯一的落地场景就是虚拟货币。

不过我不是很认同 『AI Agent 唯一的落地场景就是帮程序员写代码』这句话。AI Agent 的落地场景明显要多得多,只不过当前最成熟的场景是写代码而已。

相比之下,区块链只是把成熟的技术组合起来,出道即巅峰,并没有什么发展空间,当年那些落地的场景,大都是伪需求。

说个经典的区块链伪需求,食品安全溯源,也就是区块链溯源防伪系统,当年看到这类项目我就觉得搞笑,数据又不会自己跑到链上去,都是需要人操作的,凡是有人参与的事情,就有可能作假,这个溯源有个毛线用?

聊偏了,继续说 AI Agent。

AI Agent 除了写代码比较成熟外,在自动化数据分析、互联网信息提取与分析、个人智能助理、写作、智能客服等场景都蛮成熟的。

只不过这些场景大都在 AI 火爆之前就已经有很多算法或解决方案满足了,AI 的到来让事情更简单更好一些。

目前 AI Agent 领域的创业公司主要分为四大类:代码助手、企业 Agent 平台、垂直行业应用、通用 Agent。前段时间火爆的 Manus AI 就属于通用 Agent。

AI 叠加现在火爆的各种机器人创业公司、成熟的无人机,未来好玩的产品肯定越来越多,比如小米刚刚推出了智能眼镜(虽然做得太水了)。

这年头对于普通人来说,最大的机遇可能就是英伟达的股票了。

本文完。

标签: aliyun, AI

添加新评论