斯坦福某AI团队抄袭、套壳清华系开源大模型，现已被实锤_科技资讯

斯坦福某AI团队抄袭、套壳清华系开源大模型，现已被实锤

创始人

2024-06-04 04:23:38

钛媒体App 6月3日消息，近日，美国斯坦福大学某AI团队被爆抄袭、套壳清华系AI公司面壁智能的开源大模型，在模型架构与代码上完全相同，引发的舆论在X和HuggingFace上持续发酵，现已被面壁智能实锤。

具体来看，5月29日，斯坦福大学的一个研究团队发布了一个名为Llama3V的SOTA开源多模态模型，号称效果比肩GPT-4V、Gemini Ultra、Claude Opus，尺寸比GPT4-V小100倍，但训练成本仅需500美元（约等于人民币 3650 元）。几天后，Llama3V被质疑套壳清华系AI公司面壁智能于5月中旬发布的8B多模态小模型MiniCPM-Llama3-V 2.5。面对质疑，Llama3V团队称，他们只是使用了 MiniCPM-Llama3-V 2.5的tokenizer（分词器），并宣称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。

面壁智能团队通过测试，发现Llama3-V大模型能识别清华简（清华大学收藏的一批战国竹简的简称），其训练数据的采集和标注均由清华NLP实验室和面壁智能团队完成，相关数据尚未对外公开。Llama3-V在识别清华简的文字时，结果和MiniCPM-Llama3-V 2.5不仅在正确的地方一模一样，在犯错的地方也雷同。同时，两个模型在清华简上的高斯噪声也同样高度相似。此外，与MiniCPM-Llama3-V 2.5类似，Llama3-V也显示出了很强的OCR能力，甚至包括中文。

上一篇：重庆打造科技转化新平台 118项企业需求发布寻对接

下一篇：挑战英伟达超威将推出新人工智能芯片

斯坦福某AI团队抄袭、套壳清华系开源大模型，现已被实锤

相关内容

热门资讯