通义千问 Qwen3-4B 新模型发布,端侧性能大跃升
2025-08-07 09:17:02
来源:IT之家
8 月 7 日消息,昨日(8 月 6 日),通义千问 Qwen 发布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,实现了性能的大幅提升。
官方指出,小型语言模型(SLM)在智能体人工智能(Agentic AI)的发展进程里具有极高价值。而 “2507” 版本的 Qwen3-4B 模型,具备体积小巧但性能强劲的特点,尤其适合在手机等端侧硬件上进行部署。
根据相关博文介绍,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著增强了通用能力,目标是成为更为全能的端侧得力工具。
该模型掌握了更丰富的语言知识以及长尾知识,其上下文理解长度扩展到了 256K,即便作为小模型也能够处理长文本。在通用能力方面,该模型超越了闭源的小尺寸模型 GPT-4.1-nano,性能与同等规模的 Qwen3-30B-A3B(non-thinking)相近。
官方表示,该模型更像是一位高效的 “执行专家”,能够严格遵循指令,迅速给出响应,在内容创作、工具调用等方面更为适用。
在推理(thinking)领域,Qwen3-4B-Thinking-2507 的推理能力有了大幅提升,在 AIME25 测评中获得了高达 81.3 分的成绩。Qwen3-4B-Thinking-2507 的推理表现可与中等模型 Qwen3-30B-Thinking 相媲美,在聚焦数学能力的 AIME25 测评中,以仅 4B 的参数量取得了 81.3 分的优异成绩。
官方称此模型如同一位严谨的 “学术专家”,面对复杂问题时能够逐步展开推理,完成任务的过程更加深入且可靠 。
【版权提示】间距离倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至 1069823586@qq.com,我们将及时沟通与处理。
- 标签:
- 性能
猜你喜欢
姜超回应红魔游戏平板5 Pro延期:水冷、屏幕等都遇到技术难关
红魔游戏平板5Pro将于6月30日正式发布,随着发布会临近,官方已启动新品预热,并率先公布外观设计。今日,红魔游戏手机产品总经理姜超发文提到,“很抱歉平板发布的确实比预期晚了很多,我们在水冷、屏幕、高
4天前
荣耀X80 Pro Max 11000mAh电池太猛!续航刷新世界纪录
荣耀X80ProMax将于今晚19:00正式发布,新机主打超长续航、防水和抗摔能力。据了解,荣耀X80ProMax搭载11000mAh第四代青海湖电池,是目前行业电池容量最大的智能手机。新机续航到底有
4天前
红魔最强游戏平板亮相!这设计行业唯一 透明机身超酷炫
红魔游戏平板5Pro将于6月30日正式发布,今日官方正式揭晓了新机外观。红魔游戏平板5Pro提供黑色和银色两款配色,采用号称是“行业独一份”的RGB水冷设计。平板通过透明机身直接展示内部水冷管路,运行
4天前
苹果20款新品蓄势待发 首款折叠屏iPhone领衔
据MacRumors报道,科技记者马克·古尔曼日前透露,苹果计划从今年下半年到2027年推出约20款新品,覆盖iPhone、Mac、iPad、AppleWatch、智能家居及AI穿戴设备等多个产品线。
14999元起 你买苹果or华为!折叠屏iPhone开产 今年9月发布
从供应链流出的最新动态显示,苹果筹备多年的首款折叠屏iPhone已经正式进入试产阶段,距离正式和消费者见面的日子越来越近。有参与项目配套的苹果供应链企业对外爆料,公司近期已经开始向这款首款折叠屏iPh
高通联发科首发台积电第二代2nm工艺:苹果落后整整一年
今年9月,苹果A20系列、高通骁龙8E6系列和联发科天玑9600系列将集中亮相,三大旗舰芯片首次采用台积电2nm工艺节点,先进制程的竞争迎来全新拐点。尽管三家大厂均交由台积电代工,但制程版本却有明显分





