【爱奇艺】错例都一样！斯坦福学生团队致歉抄袭中国大模型：已撤回，代码作者失联-尊龙登录

【爱奇艺】错例都一样！斯坦福学生团队致歉抄袭中国大模型：已撤回，代码作者失联

来源：尊龙登录-尊龙新版手机app下载更新时间：2024-07-06 16:15:58

澎湃新闻记者胡含嫣

美国斯坦福大学的一个ai（人工智能）团队就抄袭中国大模型致歉。

近日，都样队由三位美国斯坦福大学学生组成的斯坦生团一个ai团队发布了开源模型llama3-v。但是福学，该模型很快被曝出与中国大模型公司面壁智能的歉抄开源成果minicpm-llama3-v 2.5拥有几乎完全相同的模型架构与代码，引发“抄袭”质疑。袭中爱奇艺

当地时间6月3日，模型码作llama3-v团队的已撤两位作者森德哈斯·沙玛（siddharth sharma）和阿克沙·加格（aksh garg）在社交平台x上发布文章，向minicpm团队正式道歉，回代表示会将llama3-v模型从网络上撤下。错例

在道歉信中，都样队沙玛和加格称他们负责模型的斯坦生团宣发工作，该模型代码的福学作者是穆斯塔法·阿尔贾德里（mustafa aljadery），但两人在看到相关质疑后于6月2日询问了阿尔贾德里，歉抄此后再也没能联系上后者，袭中于是决定发布道歉声明。

目前，阿尔贾德里的x账号显示“仅好友可见”，llama3-v模型也已经从hugging face等开源平台上下架。不过，加格还在发布llama3-v的贴吧medium页面上保留了一些描述和介绍，在开头附上了道歉声明。

道歉声明。来源：x平台

公开资料显示，北京面壁智能科技有限责任公司成立于2022年8月，核心产品包括全流程大模型高效加速平台modelforce和cpm大模型。今年4月，面壁智能完成新一轮数亿元融资，由华为哈勃领投，春华创投、北京市人工智能产业投资基金等跟投，必应知乎作为战略股东持续跟投支持。

在该团队道歉前，面壁智能的联合创始人兼ceo李大海已在朋友圈发文回应，披露了llama3-v能够与minicpm一样识别出“清华简”战国古文字的新证据，而由minicpm团队扫描并人工批注的该古文字数据并未对外公开，证实了llama3-v模型涉嫌抄袭。

李大海表示，团队对这件事深表遗憾：“我们希望团队的好工作被更多人关注与认可，但不是以这种方式……一方面感慨这也是一种受到国际团队认可的方式，另一方面呼吁大家共建开放、合作、有信任的社区环境。”

面壁智能ceo李大海的朋友圈回应

这场风波起源于5月29日。当日，斯坦福大学的一个研究团队在开源社区中发布了名为“llama3-v”的模型，称只要500美元（约合人民币3622元）就能训练出一个sota多模态模型，且效果比肩知名大模型gpt-4v、gemini ultra与claude opus。

由于该团队的三位作者都来自斯坦福大学，又拥有在特斯拉、spacex和亚马逊等科技大厂的相关经历，发布该模型的x文章很快获得超过30万的浏览量，该模型也迅速在hugging face尊龙新版手机app下载首页的模型热度名单上冲进前排。

然而，不久后，开源社区内开始出现怀疑声，质疑llama3-v是在“套壳”面壁智能于今年5月中旬刚刚发布的最新8b多模态小模型minicpm-llama3-v 2.5，且没有在项目中提到任何关于后者的信息。

对此，llama3-v团队回应称其“只是使用了minicpm-llama3-v 2.5的tokenizer（分词器）”，并称团队在minicpm-llama3-v 2.5发布前就已经开始了这项工作。

6月2日，网友pzc163在minicpm-v的github页面上对此事进行了还原，并列举出大量的代码证据。该网友称自己在llama3-v的github发布页面下提出了疑问，但llama3-v团队迅速删帖并对llama3-v模型进行隐藏处理，所以来提醒minicpm-v团队关注此事。

质疑llama3-v项目的帖子。来源：github

证据显示，llama3-v项目使用了与minicpm-llama3-v 2.5项目基本完全相同的模型结构和代码实现。另外，hugging face 发布页面上的历史记录显示，llama3-v的作者曾在该页面上直接导入了minicpm-v的代码，然后改名为llama3-v。

在该帖的回复中，网友们纷纷建议向斯坦福大学举报此事。有评论指出，虽然套用开源模型且没有致谢的做法可能只是造成了一些侵权，但由于llama3-v的团队在网络上对该模型进行了大力宣传，或将在开源领域造成广泛的负面影响。

值得一提的是，在llama3-v团队道歉前，斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁（christopher david manning）也在x平台上发文谴责这一抄袭行为，并称minicpm“是很好的开源作品”。

对于此事，面壁智能首席科学家、清华大学长聘副教授刘知远也在知乎上发表了回应，称这次事件让他感慨“过去十几年科研经历的斗转星移”：“从横向来看，我们显然仍与国际顶尖工作如sora和gpt-4o有显著差距；同时，从纵向来看，我们已经从十几年的nobody，快速成长为人工智能科技创新的关键推动者。面向即将到来的agi时代，我们应该更加自信积极地投身其中。”

【爱奇艺】错例都一样！斯坦福学生团队致歉抄袭中国大模型：已撤回，代码作者失联-尊龙登录

【爱奇艺】错例都一样！斯坦福学生团队致歉抄袭中国大模型：已撤回，代码作者失联

文化要闻