職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
注:急招職位,待遇可談,要求有推理優化經驗。研發團隊直招,非獵頭職位。
職位描述:
1. 支持搜索/OCR/NLP等各方向算法模塊的落地和優化
2. 方向一:負責深度模型性能優化,提升大規模在線推理集群的吞吐,降低時延,保證在線服務可用性;
3. 方向二:負責分布式模型訓練框架的開發和優化,提升整體訓練流程的效率
4. 方向三:負責LLM大模型推理/訓練優化
職位要求:
1. 熟悉linux環境,熟悉C/C 和Python,熟悉GPU體系結構
2. 熟悉至少一種推理引擎,有引擎/算子開發部署經驗,如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用訓練平臺,熟悉OpenMMLab/HuggingFace等算法模型池,有實際應用經驗
加分項:
1. 有CUDA編程經驗優先
2. 有推理服務實際部署和優化經驗優先
3. 熟悉ONNX、TorchScript等模型轉換格式優先
4. 熟悉模型量化、蒸餾、剪枝等壓縮方法,有相關應用經驗者優先
職位描述:
1. 支持搜索/OCR/NLP等各方向算法模塊的落地和優化
2. 方向一:負責深度模型性能優化,提升大規模在線推理集群的吞吐,降低時延,保證在線服務可用性;
3. 方向二:負責分布式模型訓練框架的開發和優化,提升整體訓練流程的效率
4. 方向三:負責LLM大模型推理/訓練優化
職位要求:
1. 熟悉linux環境,熟悉C/C 和Python,熟悉GPU體系結構
2. 熟悉至少一種推理引擎,有引擎/算子開發部署經驗,如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用訓練平臺,熟悉OpenMMLab/HuggingFace等算法模型池,有實際應用經驗
加分項:
1. 有CUDA編程經驗優先
2. 有推理服務實際部署和優化經驗優先
3. 熟悉ONNX、TorchScript等模型轉換格式優先
4. 熟悉模型量化、蒸餾、剪枝等壓縮方法,有相關應用經驗者優先
工作地點
地址:北京海淀區北京海淀區上地街道中關村軟件園


職位發布者
HR
作業幫

-
請選擇
-
公司規模未知
-
公司性質未知
-
匯苑開拓大廈