PaddlePaddle · ZHUI · Mar 6, 2025 · Mar 6, 2025 · Mar 6, 2025 · Mar 6, 2025
diff --git a/llm/server/dockerfiles/Dockerfile_serving_cuda118_cudnn8 b/llm/server/dockerfiles/Dockerfile_serving_cuda118_cudnn8
@@ -17,8 +17,12 @@ RUN mkdir -p /opt/source/ && cd /opt/source/ \
     && python3 -m pip install --no-cache-dir -r PaddleNLP/requirements.txt \
     && python3 -m pip install --no-cache-dir -r PaddleNLP/llm/server/server/requirements.txt
 
-RUN cp /opt/source/PaddleNLP/llm/server/server/scripts/start_server.sh /opt/output/Serving/ \
-    && cp /opt/source/PaddleNLP/llm/server/server/scripts/stop_server.sh /opt/output/Serving/
+RUN cp /opt/source/PaddleNLP/llm/server/server/scripts/start_server.sh start_server \
+    && chmod +x start_server \
+    && mv start_server /usr/local/bin/ \
+    && cp /opt/source/PaddleNLP/llm/server/server/scripts/stop_server.sh start_server \
+    && chmod +x stop_server \
+    && mv stop_server /usr/local/bin/ 
 
 ENV PYTHONPATH="/opt/source/PaddleNLP/llm/server/server:/opt/source/PaddleNLP"
 

diff --git a/llm/server/dockerfiles/Dockerfile_serving_cuda124_cudnn9 b/llm/server/dockerfiles/Dockerfile_serving_cuda124_cudnn9
@@ -17,8 +17,12 @@ RUN mkdir -p /opt/source/ && cd /opt/source/ \
     && python3 -m pip install --no-cache-dir -r PaddleNLP/requirements.txt \
     && python3 -m pip install --no-cache-dir -r PaddleNLP/llm/server/server/requirements.txt
 
-RUN cp /opt/source/PaddleNLP/llm/server/server/scripts/start_server.sh /opt/output/Serving/ \
-    && cp /opt/source/PaddleNLP/llm/server/server/scripts/stop_server.sh /opt/output/Serving/
+RUN cp /opt/source/PaddleNLP/llm/server/server/scripts/start_server.sh start_server \
+    && chmod +x start_server \
+    && mv start_server /usr/local/bin/ \
+    && cp /opt/source/PaddleNLP/llm/server/server/scripts/stop_server.sh stop_server \
+    && chmod +x stop_server \
+    && mv stop_server /usr/local/bin/ 
 
 ENV PYTHONPATH="/opt/source/PaddleNLP/llm/server/server:/opt/source/PaddleNLP"
 

diff --git a/llm/server/server/server/engine/config.py b/llm/server/server/server/engine/config.py
@@ -338,13 +338,13 @@ def reset_value(self, value_name, key, config):
         reset_value(self, "block_size", "infer_model_block_size", config)
         reset_value(self, "max_seq_len", "infer_model_max_seq_len", config)
         reset_value(self, "return_full_hidden_states", "return_full_hidden_states", config)
+        if self.seq_len_limit > self.max_seq_len:
+            self.seq_len_limit = self.max_seq_len
+            logger.warning(f"The loading model requires len(input_ids) <= {self.max_seq_len}, now reset MAX_SEQ_LEN.")
 
-        assert (
-            self.seq_len_limit <= self.max_seq_len
-        ), f"The loading model requires len(input_ids) <= {self.max_seq_len}, but now the setting MAX_SEQ_LEN={self.seq_len_limit}."
-        assert (
-            self.dec_len_limit <= self.max_seq_len
-        ), f"The loading model requires MAX_DEC_LEN <= {self.max_seq_len}, but now the setting MAX_DEC_LEN={self.dec_len_limit}."
+        if self.dec_len_limit > self.max_seq_len:
+            self.dec_len_limit = self.max_seq_len
+            logger.warning(f"The loading model requires MAX_DEC_LEN <= {self.max_seq_len}, now reset MAX_DEC_LEN.")
 
     def get_unique_name(self, name):
         """