PaddlePaddle
diff --git a/‎docs/llm/gcu/llama/README.md‎
Lines changed: 1 addition & 1 deletion b/‎docs/llm/gcu/llama/README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/llm/intel_hpu/llama/README.md‎
Lines changed: 1 addition & 1 deletion b/‎docs/llm/intel_hpu/llama/README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/llm/metax/llama/README.md‎
Lines changed: 1 addition & 1 deletion b/‎docs/llm/metax/llama/README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/llm/npu/llama/README.md‎
Lines changed: 1 addition & 1 deletion b/‎docs/llm/npu/llama/README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/llm/sdaa/llama/README.md‎
Lines changed: 1 addition & 1 deletion b/‎docs/llm/sdaa/llama/README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/llm/xpu/llama/README.md‎
Lines changed: 1 addition & 1 deletion b/‎docs/llm/xpu/llama/README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎llm/dcu/llama/README.md‎ ‎llm/devices/dcu/llama/README.md‎llm/dcu/llama/README.md renamed to llm/devices/dcu/llama/README.md
Lines changed: 27 additions & 27 deletions b/‎llm/dcu/llama/README.md‎ ‎llm/devices/dcu/llama/README.md‎llm/dcu/llama/README.md renamed to llm/devices/dcu/llama/README.md
Lines changed: 27 additions & 27 deletions
diff --git a/‎llm/dcu/llama/lora_argument.json‎ ‎llm/devices/dcu/llama/lora_argument.json‎llm/dcu/llama/lora_argument.json renamed to llm/devices/dcu/llama/lora_argument.json b/‎llm/dcu/llama/lora_argument.json‎ ‎llm/devices/dcu/llama/lora_argument.json‎llm/dcu/llama/lora_argument.json renamed to llm/devices/dcu/llama/lora_argument.json
diff --git a/‎llm/dcu/llama/pretrain_pp8.json‎ ‎llm/devices/dcu/llama/pretrain_pp8.json‎llm/dcu/llama/pretrain_pp8.json renamed to llm/devices/dcu/llama/pretrain_pp8.json b/‎llm/dcu/llama/pretrain_pp8.json‎ ‎llm/devices/dcu/llama/pretrain_pp8.json‎llm/dcu/llama/pretrain_pp8.json renamed to llm/devices/dcu/llama/pretrain_pp8.json
diff --git a/‎llm/dcu/llama/sft_argument.json‎ ‎llm/devices/dcu/llama/sft_argument.json‎llm/dcu/llama/sft_argument.json renamed to llm/devices/dcu/llama/sft_argument.json b/‎llm/dcu/llama/sft_argument.json‎ ‎llm/devices/dcu/llama/sft_argument.json‎llm/dcu/llama/sft_argument.json renamed to llm/devices/dcu/llama/sft_argument.json
@@ -1 +1 @@
-../../../../llm/gcu/llama/README.md
+../../../../llm/devices/gcu/llama/README.md
@@ -1 +1 @@
-../../../../llm/intel_hpu/llama/README.md
+../../../../llm/devices/intel_hpu/llama/README.md
@@ -1 +1 @@
-../../../../llm/metax/llama/README.md
+../../../../llm/devices/metax/llama/README.md
@@ -1 +1 @@
-../../../../llm/npu/llama/README.md
+../../../../llm/devices/npu/llama/README.md
@@ -1 +1 @@
-../../../../llm/sdaa/llama/README.md
+../../../../llm/devices/sdaa/llama/README.md
@@ -1 +1 @@
-../../../../llm/xpu/llama/README.md
+../../../../llm/devices/xpu/llama/README.md
@@ -1,9 +1,9 @@
-# 🚣‍♂️ 使用PaddleNLP在海光DCU上运行llama2-13b模型 🚣
-Paddle框架与PaddleNLP套件在海光的DCU产品上进行了深度的适配和优化，实现了大模型在训练和推理上与GPU高度统一，在精度和性能上拥有先进水平。
+# 🚣‍♂️ 使用 PaddleNLP 在海光 DCU 上运行 llama2-13b 模型 🚣
+Paddle 框架与 PaddleNLP 套件在海光的 DCU 产品上进行了深度的适配和优化，实现了大模型在训练和推理上与 GPU 高度统一，在精度和性能上拥有先进水平。
 
-海光DCU产品在PaddleNLP组合套件上拥有多种技术优点：
+海光 DCU 产品在 PaddleNLP 组合套件上拥有多种技术优点：
 
-- **完全支持4D混合并行分布式训练，灵活适应各种训练策略。**
+- **完全支持4D 混合并行分布式训练，灵活适应各种训练策略。**
 - **各类高性能的融合算子，提升训推性能。**
 - **优化的通讯库，掩盖分布式训推延迟。**
 
@@ -14,11 +14,11 @@ Paddle框架与PaddleNLP套件在海光的DCU产品上进行了深度的适配
 ### 1.硬件平台
 
 
- | 芯片类型 | DTK版本 |
+ | 芯片类型 | DTK 版本 |
  | --- | --- |
  | K100_AI | 24.04.1 |
 
-**本示例使用8卡机器，并通过微调训练+推理的流程演示运行方法，使用hy-smi命令查看运行环境中的DCU信息，如下所示：**
+**本示例使用8卡机器，并通过微调训练+推理的流程演示运行方法，使用 hy-smi 命令查看运行环境中的 DCU 信息，如下所示：**
 ```
 $ hy-smi
 
@@ -34,7 +34,7 @@ DCU     Temp     AvgPwr     Perf     PwrCap     VRAM%      DCU%      Mode
 ```
 
 ### 2.环境准备：
-推荐使用docker方式运行，提供拉取的docker镜像，关于本项目所需新版本 DTK 等均可从[光合](https://developer.hpccube.com/tool/)开发者社区下载安装，docker中默认使用dtk-24.04.1。
+推荐使用 docker 方式运行，提供拉取的 docker 镜像，关于本项目所需新版本 DTK 等均可从[光合](https://developer.hpccube.com/tool/)开发者社区下载安装，docker 中默认使用 dtk-24.04.1。
 
 (1). 拉取镜像
 ```
@@ -62,13 +62,13 @@ docker run -it \
     registry.baidubce.com/device/paddle-dcu:dtk24.04.1-kylinv10-gcc82 \
     /bin/bash
 ```
-(3). 安装paddle
+(3). 安装 paddle
 ```
 # paddlepaddle『飞桨』深度学习框架，提供运算基础能力
 python -m pip install paddlepaddle-dcu==3.0.0b2 -i https://www.paddlepaddle.org.cn/packages/stable/dcu/
 ```
 
-(4). 克隆PaddleNLP仓库代码，并安装依赖
+(4). 克隆 PaddleNLP 仓库代码，并安装依赖
 ```
 # 用paddlenlp develop分支
 git clone https://github.com/PaddlePaddle/PaddleNLP.git
@@ -78,19 +78,19 @@ pip install -r ../requirements.txt
 (5). 安装 paddlenlp_ops
 ```
 # PaddleNLP仓库内置了rms相关的专用算子
-cd legacy/model_zoo/gpt-3/external_ops
+cd slm/model_zoo/gpt-3/external_ops
 python setup.py install
 ```
 
 ## 3.微调：
-- **注：** 进入llm路径进行以下操作。
+- **注：** 进入 llm 路径进行以下操作。
 ### 数据集准备
-我们提供了数据集demo便于您调试使用
+我们提供了数据集 demo 便于您调试使用
 ```
 wget https://bj.bcebos.com/paddlenlp/datasets/examples/alpaca_demo.gz
 tar -xvf alpaca_demo.gz
 ```
-我们支持的精调数据格式是每行包含一个字典的json文件，每个字典包含以下字段：
+我们支持的精调数据格式是每行包含一个字典的 json 文件，每个字典包含以下字段：
 - `src`: `str, List(str)`，指模型的输入指令（instruction）、提示（prompt），模型应该执行的任务。
 - `tgt`: `str, List(str)`，指模型的输出。
 样例数据：
@@ -99,39 +99,39 @@ tar -xvf alpaca_demo.gz
 ...
 #您可以根据此格式自行制作精调数据。
 ```
-### Lora微调
+### Lora 微调
 
-可参考以下脚本启动Lora微调训练：
+可参考以下脚本启动 Lora 微调训练：
 ```
 PYTHONPATH=.. python run_finetune.py dcu/llama/lora_argument.json
 ```
-### sft微调
-可参考以下超参启动Lsft微调训练：
+### sft 微调
+可参考以下超参启动 Lsft 微调训练：
 ```
 PYTHONPATH=.. python run_finetune.py dcu/llama/sft_argument.json
 ```
 ## 3.预训练：
 ### 数据准备
 数据详细制作流程可参考[此处](https://github.com/PaddlePaddle/PaddleNLP/tree/develop/llm/tools/preprocess/README.md)，例：OpenWebText2预训练数据制作参考[此处](https://paddlenlp.readthedocs.io/zh/latest/llm/pretraining/data/OpenWebText2.html)
 
-为了方便用户运行测试本模型，本项目提供了处理好的100k条doc的训练样本：
+为了方便用户运行测试本模型，本项目提供了处理好的100k 条 doc 的训练样本：
 
 ```
 cd PaddleNLP/llm/
 mkdir data && cd data
 wget https://bj.bcebos.com/paddlenlp/models/transformers/llama/data/llama_openwebtext_100k.bin
 wget https://bj.bcebos.com/paddlenlp/models/transformers/llama/data/llama_openwebtext_100k.idx
-cd .. && tree data 
+cd .. && tree data
 data
 ├── llama_openwebtext_100k.bin
 └── llama_openwebtext_100k.idx
 ```
 - **注：** 与微调数据集区分路径
 ### 运行脚本
 
-该训练脚本可以单节点也可多节点运行，每节点8张DCU-K100AI-64G。
+该训练脚本可以单节点也可多节点运行，每节点8张 DCU-K100AI-64G。
 
-并行配置采用TP 1，PP 8，使用fp16精度预训练。
+并行配置采用 TP 1，PP 8，使用 fp16精度预训练。
 
 可参考以下脚本启动预训练：
 
@@ -142,20 +142,20 @@ python -m paddle.distributed.launch \
 ```
 
 ## 4.高性能推理
-高性能推理内置动态插入和全环节算子融合策略，隐藏了底层实现的细节，实现了开箱即用高性能并行推理能力。在保持高性能推理和动态插入的基础上可以动态地为cachekv分配存储空间，极大地节省显存，从而在同一时刻处理更多的query以获得吞吐的提升。
+高性能推理内置动态插入和全环节算子融合策略，隐藏了底层实现的细节，实现了开箱即用高性能并行推理能力。在保持高性能推理和动态插入的基础上可以动态地为 cachekv 分配存储空间，极大地节省显存，从而在同一时刻处理更多的 query 以获得吞吐的提升。
 
 (1). 环境准备
 
-PaddleNLP 针对于Transformer 系列编写了高性能自定义算子，提升模型在推理和解码过程中的性能，使用之前需要预先安装自定义算子库：
+PaddleNLP 针对于 Transformer 系列编写了高性能自定义算子，提升模型在推理和解码过程中的性能，使用之前需要预先安装自定义算子库：
 ```
 # DCU设备安装自定义算子
 cd PaddleNLP/csrc && python3 setup_hip.py install
 ```
 (2). 高性能推理
 
-下面分别给出关闭BlockAttention和打开BlockAttention进行高性能推理的命令参考：
+下面分别给出关闭 BlockAttention 和打开 BlockAttention 进行高性能推理的命令参考：
 
-a.关闭BlockAttention的高性能推理
+a.关闭 BlockAttention 的高性能推理
 
 **动态图：**
 
@@ -178,7 +178,7 @@ python3 ./predict/export_model.py --model_name_or_path checkpoints/llama_ptq_ckp
 python3 ./predict/predictor.py  --model_name_or_path ./inference --inference_model --dtype float16 --mode static （测性能可选：--batch_size 1 --src_length 3072 --max_length 1024 --benchmark）
 ```
 
-b. 打开BlockAttebtion的高性能推理
+b. 打开 BlockAttebtion 的高性能推理
 
 **动态图：**
 
@@ -227,4 +227,4 @@ python3 ./predict/predictor.py  --model_name_or_path ./inference --inference_mod
 
 ## 7.参考
 
-* [https://github.com/PaddlePaddle/PaddleNLP](https://github.com/PaddlePaddle/PaddleNLP)
+* [https://github.com/PaddlePaddle/PaddleNLP](https://github.com/PaddlePaddle/PaddleNLP)
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-../../../../llm/gcu/llama/README.md`
	`1`	`+../../../../llm/devices/gcu/llama/README.md`
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-../../../../llm/intel_hpu/llama/README.md`
	`1`	`+../../../../llm/devices/intel_hpu/llama/README.md`
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-../../../../llm/metax/llama/README.md`
	`1`	`+../../../../llm/devices/metax/llama/README.md`
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-../../../../llm/npu/llama/README.md`
	`1`	`+../../../../llm/devices/npu/llama/README.md`
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-../../../../llm/sdaa/llama/README.md`
	`1`	`+../../../../llm/devices/sdaa/llama/README.md`
Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-../../../../llm/xpu/llama/README.md`
	`1`	`+../../../../llm/devices/xpu/llama/README.md`