返回 爱风尚w

阿里宣布一口气开源Qwen3全系列32款MLX量化模型

2025-07-09

眼看着距离 iPhone17 系列发布只剩不到两个月时间了,但苹果 AI 在中国区还是连个影子都看不到。时间紧迫事情难办,你说苹果的 CEO,蒂姆库克,作为一个六十多岁的年轻人,能睡得着吗?

应该能吧。毕竟就在半个月前,事情已经悄悄迎来转机。6 月 16 日,阿里宣布一口气开源Qwen3全系列32款MLX量化模型。

个中的关键,显然是「MLX」

「MLX」是一个专为苹果芯片深度适配的开源机器学习框架,是为了方便苹果开发者打造的、专属苹果设备的“AI赛道”。

它可以利用苹果设备的统一内存架构优势,把数据都集中放在内存里,然后 CPU、GPU 和 NPU 等计算单元根据各自的需要轮流处理数据,省去了数据在 CPU、GPU 来回搬运的过程。

所以阿里这次开源模型的潜台词是,这 32 款模型都是准备在苹果设备上跑的。而且模型囊括了4bit、6bit、8bit和BF16等4种不同精度的量化版本,就像是和苹果商量好一样,不同精度的版本正好可以对应不同设备的性能状况。

比如内存最小、性能最弱的 iPhone,就可以用 4bit 精度的版本,本地部署大模型;性能再强一点的 iPad 不同版本可以分别部署 4bit 到 6bit 的型号,性能更强的 MacBook、Mac PC 就能任选 6 bit 到 BF16的多种精度了。

结合种种现实情况,的确有不少媒体把阿里的操作解读为「苹果 AI 入华的最后一块拼图」。接连和百度、字节、腾讯传出绯闻之后,苹果和阿里的合作,好像终于有了实质性进展。

虽然“人家郎才女貌天生一对,哪里轮到你们这群妖魔鬼怪反对”,但阿里和苹果在 AI 上合作这件事,感觉还有很多疑问,或者困惑需要解答。

Qwen3 能行吗?

第一个摆在面前的现实问题,也是很多不那么关心 AI 大模型的苹果用户想知道的问题,是Qwen3 的能力究竟怎么样。

从阿里官方发布的测试成绩、一些 AI 领域 KOL 的实际评测来看,Qwen3 大模型的基础能力还是很拔尖的。

Qwen3 系列是一款混合推理模型,同时支持思考模式和非思考模式。基于36万亿tokens训练数据量,让 Qwen3 在推理、指令遵循、工具运用及多语言任务方面的能力都有比较明显的提升。

在阿里的介绍中,Qwen3 的核心能力有精通多种语言、原生支持模型上下文协议、函数调用、复杂智能体任务、数学运算、编程与逻辑推理和人机对齐等。

而在量化模型能力的基准测试中,旗舰模型Qwen3-235B-A22B 在代码、数学、通用能力等领域已经能战胜同期(4 月份)的 DeepSeek R1,面对 OpenAI-o1 这样的标杆模型也不落下风。

小参数模型的性能表现更是 Qwen3 的一大卖点。

在阿里官方给出的评测数据中,Qwen3-30B-A3B,一款激活参数只有 3B 的小模型,基准测试的表现就已经超过 DeepSeek V3 和GPT-4o;甚至Qwen3-4B 这样极小参数的小模型,也能和上代的 Qwen2.5-72B-Instruct 掰掰手腕了。

至少从模型的基准能力来看 Qwen3 没有问题,不过就像跑分高不等同于体验好,模型的基准测试成就优秀,也不直接等同于 AI 功能的体验优秀。

目前苹果已经在海外上线的 AI 功能可以分为语言与文本生成类、图像生成与编辑类、智能助手类和系统理解与内容搜索类四种,落地的具体功能包括一键改写邮件、文生图/文生 emoji、背景杂物消除和通话录音自动摘要等等。

这些功能主要运用了大模型的自然语言处理能力、上下文感知与语义理解、多模态生成和智能代理能力,而目前 Qwen3 只能说“基本具备”以上需要的核心 AI 能力。

例如,Qwen3 是一个语言大模型,「自然语言处理」和「上下文理解」等本来就是强项,苹果AI 需要的写作辅导、跨 App 内容理解等应该是得心应手。

但它想要实现「多模态生成」功能,就得寻求其他外挂模型的协助,也许是阿里自己的通义万相,也许苹果会寻求其他合作方,总之只靠它是玩不转的。

而且在「智能代理」能力方面,虽然 Qwen3 有处理复杂智能体任务的能力,但想要实现海外版苹果 AI 那与系统设置/功能深度融合、调度的效果,就意味着 Qwen3 要能掌控iOS 的“灵魂”, 拥有完全的操作系统权限,去调用 API和系统信息,这将会是一个非常敏感的议题。

不过,或许苹果在中国区也找不到比阿里更好的合作伙伴了。

这段时间以来大家都说阿里现在只关心两件事:在外卖上打赢京东美团,在 AI 上成为领军人物。

阿里不仅在升级和模型开源上动作频频,在云基础设施领域投资超 530 亿人民币用于未来三年 AI 与云基础设施建设,还计划募资约 15.3 亿美元,以进一步支持云计算与 AI 基础设施扩张。

比起百度的口碑风险、字节跳动还是以抖音为重心、DeepSeek 在多模态功能上“偏科”,苹果和一心一意搞外卖和 AI 的阿里走到一起也算水到渠成了。

只是,这对库克来说是一个美梦,还是噩梦?

最新文章

“美团免单”的话题冲上热搜榜首,引起网友关注

财经

 

阅读10584

马斯克重金打造的Grok 4,正式面世!

科技

 

阅读13178

《无名之辈2》开局导演就撕开剧本,哪来的恐袭?

电影

 

阅读12038

张柏芝:坚强母亲的担当

明星

 

阅读18690

我国退休人员基本养老金实现“21连涨”

新闻

 

阅读18138

2022 twobaby.net 冀ICP备20013543号-2

冀公网安备13010802001966