LLaMA 大语言模型系列论文阅读_电脑知识_泰达科技网

LLaMA 大语言模型系列论文阅读

创始人

2024-11-14 14:04:30

文章目录

1. LLaMA

1. LLaMA

paper：LLaMA: Open and Efﬁcient Foundation Language Models 《开源高效的基础语言模型》

code：https://github.com/meta-llama

单位：Meta AI

时间：2023.02

LLaMA 模型声称以更小的体积，在多数任务上超越了GPT-3的性能。LLaMA 提供了 7B、13B、65B三种规格，其中 LLaMA 13B 基本超过了 GPT-3 175B

模型结构：transformer decoder-only 结构，与初始 Transformer 不同的地方包括采用了前置层归一化（Pre-normalization）、使用RMSNorm 归一化函数（Normalizing Function）、激活函数更换为SwiGLU、使用旋转位置嵌入（RoP）

优化器：AdamW

推荐阅读：

Meta最新模型LLaMA细节与代码详解
LLaMA系列 | LLaMA和LLaMA-2精简总结

上一篇：The C programming language (second edition,K&R) exercise（CHAPTER 6）

下一篇：如何在 Android 设备上更改您的位置？

相关内容

热门资讯

裸辞做“一人公司”，我后悔了去年这个时候，一位以色列程序员正在东南亚旅行。他顺手把一个在脑子里转了很久的想法做成了产品，一个让任...

南京建成国内首个Pre-6G试... 4月21日，2026全球6G技术与产业生态大会在南京开幕。全息互动技术展台前，一名远在北京的工作人员...

超梵求职受邀参加“2025抖音... 超梵求职受邀参加“2025抖音巨量引擎成人教育行业生态大会”，探讨分享优质内容传播，服务万千学员。 ...

摩托罗拉Razr 2026（R... IT之家 4 月 22 日消息，摩托罗拉宣布新一代 Razr 折叠手机将于 4 月 29 日在美国发...

库克卸任，特纳斯领航：苹果新纪... 苹果首席执行官蒂姆·库克将卸任，硬件工程主管约翰·特纳斯将接任，苹果公司今天宣布此事。库克将在夏季...