阿里通义千问发布小尺寸模型Qwen3-4B，性能超越GPT4.1-Nano

责任编辑：王鹤迦 2025.08.07 16:36 来源：通信世界网

通信世界网消息（CWW）阿里通义千问今日宣布，其新发布的Qwen3-4B模型系列中的两个新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已经在魔搭社区和HuggingFace平台上正式开源。

新模型在非推理领域表现出色，Qwen3-4B-Instruct-2507全面超越了闭源的小尺寸模型GPT4.1-Nano，并在性能上接近中等规模的Qwen3-30B-A3B（non-thinking）。在推理领域，Qwen3-4B-Thinking-2507的表现甚至可以与Qwen3-30B-A3B（thinking）相媲美。

官方指出，2507版本的Qwen3-4B模型特别适合在手机等端侧硬件上部署，这将使得手机等移动设备能够高效地运行这些模型。

Qwen3-4B-Instruct-2507模型的通用能力得到了大幅提升，不仅超越了商业闭源的小尺寸模型GPT-4.1-nano，而且在性能上接近Qwen3-30B-A3B（non-thinking）。新模型还覆盖了更多语言的长尾知识，并在主观和开放性任务中增强了人类偏好对齐，能够提供更符合人们需求的答复。此外，模型的上下文理解能力扩展至256K，使得小模型也能够处理长文本。

Qwen3-4B-Thinking-2507模型在推理能力上得到了大幅增强，AIME25得分高达81.3分，推理表现可以媲美Qwen3-30B-Thinking模型。特别是在AIME25测评中，该模型在数学能力方面表现出色，以4B参数量获得了81.3分的高分。此外，该模型的Agent分数也非常突出，相关评测均超越了更大尺寸的Qwen3-30B-Thinking模型。模型的256K tokens上下文理解能力支持更复杂的文档分析、长篇内容生成、跨段落推理等场景，为用户提供更加丰富的应用体验。

通信世界网版权及免责声明:

1、凡本网注明“来源：通信世界全媒体”及标有原创的所有作品，版权均属于通信世界网。未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载我方内容的单位，也必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和本站来源。
2、凡本网注明“来源：XXX（非通信世界网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。

发表评论请先登录

发表评论

评价

共0条评论

...

热点文章

...

技术文章

...

会议活动