华为回应没有抄袭阿里大模型

2025年6月30日，华为高调宣布开源其盘古大模型核心组件，包括70亿参数稠密模型和720亿参数的混合专家模型（Pro MoE），宣称这是构建昇腾生态的关键举措。

然而仅隔四天，一项发布于GitHub的研究投下震撼弹：用户@HonestAGI通过“LLM指纹”技术分析指出，盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927（1.0为完全一致），远超业内0.7以下的正常差异范围。

技术争议：参数相似性是否等于抄袭？

争议核心聚焦于两项技术证据：

一、QKV偏差高度雷同

研究显示，盘古与Qwen-2.5在Q（查询）、K（键）、V（值）三种投影层参数分布呈现几乎一致的模式，尤其在早期层特征峰值及收敛行为上高度同步。考虑到QKV偏差是Qwen 1.0-2.5代的标志性设计（后续版本已弃用），这种相似性被解读为“非独立开发”的有力佐证。

二、指纹技术的科学性质疑

华为支持者反驳称，通过计算参数标准差形成的“模型指纹”缺乏普适性。知乎技术帖举例：若用同一方法对比其他模型（如百川13B与Qwen1.5），相关性也可达0.87，表明该方法易产生假阳性。华为内部人士更强调，盘古采用自研MoGE架构解决分布式训练负载均衡，与Qwen基础架构本质不同。

华为回应：承认复用但否认侵权

面对舆论发酵，华为诺亚方舟实验室于7月5日发布声明作出回应：强调盘古是基于昇腾硬件平台独立训练的基础模型，创新提出分组混合专家架构（MoGE），未使用其他模型增量训练；

开源合规性方面：华为承认部分基础组件参考业界开源实践（含Qwen代码），但已严格遵循许可证要求标注版权信息，符合Apache 2.0协议允许的复用范围；

行业反思：开源狂欢下的模糊地带

此次风波暴露AI大模型发展的三大痛点：

法律滞后性：当前知识产权法主要规制训练数据侵权（如《纽约时报》诉OpenAI），对模型架构相似性缺乏界定标准，维权难度极高；

协议混乱性：尽管Apache 2.0等协议允许代码复用，但企业常利用其模糊性进行“换皮式创新”——例如零一万物Yi-34B被指套壳Meta Llama，斯坦福Llama3-V项目复用面壁智能模型等；

竞争白热化：百度、阿里、华为密集开源实为生态争夺战。华为需借盘古绑定昇腾芯片生态，阿里则通过魔搭社区扩张影响力，技术透明度让位于商业博弈。

这场争议已如一面棱镜，折射出AI狂奔时代的技术伦理困境。当“站在巨人肩膀上”与“换皮套壳”的界限日益模糊，行业亟需建立可量化的原创性评估体系——不仅是参数指纹，更需涵盖架构专利、数据溯源、协议合规的全维度标准。

毕竟，健康的开源生态不是“免费午餐”，而是尊重规则前提下的协作创新。

每天学习更多>>