斯坦福大学某AI团队抄袭中国大模型
近期,斯坦福大学AI团队推出的Llama3-V开源模型,被揭露涉嫌抄袭清华大学与面壁智能共同开发的“小钢炮”MiniCPM-Llama3-V 2.5模型,此事迅速在网络上引发了广泛讨论。斯坦福大学某AI团队抄袭中国大模型,对此,斯坦福团队的两名成员Siddharth Sharma和Aksh Garg在社交媒体上承认了这一学术不端行为,并向面壁MiniCPM团队正式道歉,宣布将立即撤回Llama3-V模型。
Aksh Garg在声明中坦承,他们未能充分验证模型的原创性,对于发生的抄袭事件深感遗憾,并对因此给原作者带来的影响表示歉意。他们承认在推广模型时,没有充分检查项目的新颖性,特别是没有意识到其与之前OpenBMB项目的关联,对此负有全部责任。
斯坦福人工智能实验室的负责人Christopher David Manning同样对此类抄袭行为进行了批评,并对MiniCPM模型给予了正面评价。
事件起因于斯坦福AI团队声称以低廉成本训练出了超越GPT-4V水平的多模态大模型。然而,网友分析发现,该模型与面壁智能近期发布的MiniCPM-Llama3-V2.5在模型结构、代码乃至特定细节上高度相似,仅做了少量表面改动。更进一步,面壁智能通过特定古文字数据测试确认了抄袭情况,指出两模型在处理未公开的“清华简”战国古文字数据时表现出一致的正确与错误模式。斯坦福大学某AI团队抄袭中国大模型。
面壁智能CEO李大海对此事表示遗憾,同时强调应建立一个开放、合作且基于信任的行业环境。他希望通过正当途径让团队的努力得到认可,而非以抄袭风波的形式。
面壁智能的首席科学家、清华大学副教授刘知远强调,人工智能领域的进步依赖于全球范围内的算法、数据和模型开源共享。MiniCPM-Llama3-V 2.5正是基于对前人成果的尊重和利用最新技术发展而来。他指出,违反开源精神的行为破坏了行业基础,但同时也表达了对涉事学生若能改正错误的宽容态度。
面壁智能作为一家专注于大模型端侧应用的科技公司,近年来获得包括华为哈勃、春华创投等多家机构的投资支持。李大海透露,推进大模型在终端的实际应用是公司当前的工作重点之一。