阿里发布代码模型 Qwen3-Coder,能力怎么样?看到网友们的账单,我不敢用了...
阿里昨天发布的代码模型 Qwen3-Coder,有 4800 亿参数,是阿里迄今为止最具代码推理能力的代码模型,官方宣称“可以与 Cluade Sonnet4 媲美”。
下面是官方宣称的一些关键信息:
- 旗舰版本 Qwen3‑Coder‑480B‑A35B‑Instruct 是迄今为止最具“agentic coding”能力的开源模型;
- 在 Agentic Coding、浏览器和工具使用等任务上达到了开源界 SOTA,与 Anthropic 的 Claude Sonnet 4 不相上下;
- 上下文支持 256K token 原生,配合 YaRN 可扩展至 1M,使其可胜任大规模仓库与多轮交互场景;
- 通过 7.5T 数据(70% 代码)增强训练,并加入 agentic RL,达成在 SWE‑Bench Verified 等实际工程任务上的 SOTA 性能。
还好是阿里发布的,这要是菊花发布的,大嘴高低得喊俩小时的遥遥领先。
我在社区看到很多人体验后说效果确实很不错,编码能力确实出众。我本来也想试试,但在看到很多网友吐槽费用后,果断放弃了: