华为盘古大模型引热议 负责人回应

今日,专业技术论坛Github上的一篇论文引起激烈讨论。论文指出,通过比较发现,Pangu Pro MoE 模型与 Qwen-2.5 14B 模型在注意力参数分布上的相关性极高(平均相关性高达 0.927),大幅超出了正常范围,因此认为盘古大模型可能抄袭了千问大模型。随后,持不同观点的网友也引发了激烈讨论。


而据知情人士处透露,负责盘古大模型开发的诺亚方舟负责人王云鹤在内网针对此事做了回应,核心是两个:一是面向昇腾训练的全新架构,意味着盘古大模型是基于昇腾芯片进行训练的,拥有独特的架构设计。对方的评估方法不科学;二是使用LLaMA和qwen的开源组件,遵循了开源规范,社区鼓励,不是抄袭。

天权链存证书

加载更多评论

人打赏了这篇文章

加载更多内容

关闭