斯坦福某AI团队抄袭、套壳清华系开源大模型,现已被实锤
创始人
2024-06-04 04:23:38

钛媒体App 6月3日消息,近日,美国斯坦福大学某AI团队被爆抄袭、套壳清华系AI公司面壁智能的开源大模型,在模型架构与代码上完全相同,引发的舆论在X和HuggingFace上持续发酵,现已被面壁智能实锤。

具体来看,5月29日,斯坦福大学的一个研究团队发布了一个名为Llama3V的SOTA开源多模态模型,号称效果比肩GPT-4V、Gemini Ultra、Claude Opus,尺寸比GPT4-V小100倍,但训练成本仅需500美元(约等于人民币 3650 元)。几天后,Llama3V被质疑套壳清华系AI公司面壁智能于5月中旬发布的8B多模态小模型MiniCPM-Llama3-V 2.5。面对质疑,Llama3V团队称,他们只是使用了 MiniCPM-Llama3-V 2.5的tokenizer(分词器),并宣称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。

面壁智能团队通过测试 ,发现Llama3-V大模型能识别清华简(清华大学收藏的一批战国竹简的简称),其训练数据的采集和标注均由清华NLP实验室和面壁智能团队完成,相关数据尚未对外公开。Llama3-V在识别清华简的文字时,结果和MiniCPM-Llama3-V 2.5不仅在正确的地方一模一样,在犯错的地方也雷同。同时,两个模型在清华简上的高斯噪声也同样高度相似。此外,与MiniCPM-Llama3-V 2.5类似,Llama3-V也显示出了很强的OCR能力,甚至包括中文。

相关内容

热门资讯

数据市场“强功能”流通服务机构... 来源:中国经营报 中经记者 许璐 李晖 北京报道 国家数据局近日发布《关于培育数据流通服务机构 加快...
浙江移动手机套餐全攻略:从19... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
原创 科... 哈喽,大家好,今天小墨这篇评论,主要来分析科学家也会被偏见绑架,数据证实预期时反而最该警惕。 同一张...
辣点财经|医美“颜值税”来袭,... “颜值税”真来了?从今年1月1日起,医美行业正式告别“免税红利”,开始征收6%的增值税。消息一出就吸...
聚焦船舰通信高技术领域 邦彦技... 来源:证券时报e公司 1月9日晚间,邦彦技术(688132)公告,广东省工业和信息化厅公示了2025...