2025年6月30日,华为高调宣布开源其盘古大模型核心组件,包括70亿参数稠密模型和720亿参数的混合专家模型(Pro MoE),宣称这是构建昇腾生态的关键举措。
然而仅隔四天,一项发布于GitHub的研究投下震撼弹:用户@HonestAGI通过“LLM指纹”技术分析指出,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),远超业内0.7以下的正常差异范围。
更引发哗然的是,在盘古官方开源代码中赫然出现“Copyright 2024 The Qwen team, Alibaba Group”的版权声明,被质疑复制阿里代码时未彻底清除痕迹。
技术争议:参数相似性是否等于抄袭?
争议核心聚焦于两项技术证据:
一、QKV偏差高度雷同
研究显示,盘古与Qwen-2.5在Q(查询)、K(键)、V(值)三种投影层参数分布呈现几乎一致的模式,尤其在早期层特征峰值及收敛行为上高度同步。考虑到QKV偏差是Qwen 1.0-2.5代的标志性设计(后续版本已弃用),这种相似性被解读为“非独立开发”的有力佐证。
二、指纹技术的科学性质疑
华为支持者反驳称,通过计算参数标准差形成的“模型指纹”缺乏普适性。知乎技术帖举例:若用同一方法对比其他模型(如百川13B与Qwen1.5),相关性也可达0.87,表明该方法易产生假阳性。华为内部人士更强调,盘古采用自研MoGE架构解决分布式训练负载均衡,与Qwen基础架构本质不同。
华为回应:承认复用但否认侵权
面对舆论发酵,华为诺亚方舟实验室于7月5日发布声明作出回应:强调盘古是基于昇腾硬件平台独立训练的基础模型,创新提出分组混合专家架构(MoGE),未使用其他模型增量训练;
开源合规性方面:华为承认部分基础组件参考业界开源实践(含Qwen代码),但已严格遵循许可证要求标注版权信息,符合Apache 2.0协议允许的复用范围;
行业反思:开源狂欢下的模糊地带
此次风波暴露AI大模型发展的三大痛点:
法律滞后性:当前知识产权法主要规制训练数据侵权(如《纽约时报》诉OpenAI),对模型架构相似性缺乏界定标准,维权难度极高;
协议混乱性:尽管Apache 2.0等协议允许代码复用,但企业常利用其模糊性进行“换皮式创新”——例如零一万物Yi-34B被指套壳Meta Llama,斯坦福Llama3-V项目复用面壁智能模型等;
竞争白热化:百度、阿里、华为密集开源实为生态争夺战。华为需借盘古绑定昇腾芯片生态,阿里则通过魔搭社区扩张影响力,技术透明度让位于商业博弈。
这场争议已如一面棱镜,折射出AI狂奔时代的技术伦理困境。当“站在巨人肩膀上”与“换皮套壳”的界限日益模糊,行业亟需建立可量化的原创性评估体系——不仅是参数指纹,更需涵盖架构专利、数据溯源、协议合规的全维度标准。
毕竟,健康的开源生态不是“免费午餐”,而是尊重规则前提下的协作创新。