阿里巴巴 Qwen(通义千问)团队近日发布了两个新的小规模多模态模型: Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-30B-A3B-Thinking。
每个模型拥有 30亿个活跃参数,但在性能上却有着巨大的野心。

阿里 Qwen-VL-30B-A3B 新模型发布 数学、视频处理性能获称更强-Mo 动态

据 Qwen 团队介绍,这两个新版本旨在与 GPT-5-Mini 和 Claude4Sonnet 等顶尖模型竞争,并在某些基准测试中,在数学、图像识别、文本识别、视频处理和代理控制等关键领域展现出更强的性能。

这一系列产品还包括一个用于更快推理的 FP8版本,以及 Qwen3-VL-235B-A22B 模型的 FP8变体。

这些模型已全面开放获取,用户和开发者可以通过 HuggingFace、ModelScope 和 GitHub 下载使用,也可通过阿里云 API 调用。此外,Qwen 也提供了一个可直接使用的网页聊天界面。这一发布强调了 Qwen 团队在推动高效、高性能小模型普及化方面的努力。

来源https://www.aibase.com/zh/