職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
1、負責開源大模型、移動自有基礎大模型的調優(如SFT、RLHF等)、訓練范式優化及性能優化;
2、負責大模型prompt工程、模型蒸餾、推理加速、超長上下文等優化技術研究;
3、負責大模型安全與幻覺研究,提高大模型安全性及穩定性,解決大模型可控可信度不足問題;
4、參與大模型的產品落地,包括基于反饋的算法調優、算法創新、系統評測等。
任職資格:
1、計算機、人工智能、自然語言處理等相關專業碩士及以上學歷,具備5年以上自然語言處理算法經驗;
2、熟練掌握語言大模型相關算法,掌握GPT-series、LLaMa等預訓練模型,精通微調模型、自監督學習、注意力機制、Transformer、多模態學習等技術;
3、熟練掌握Python、C 等編程語言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度學習算法,掌握Deepspeed/Megatron等分布式訓練框架;
4、優秀的分析問題和解決問題的能力,對解決具有挑戰性的問題充滿激情;
5、具有良好的團隊合作精神和溝通能力,能夠牽頭帶領團隊承擔大模型應用與落地任務;
6、具備超大規模(千卡及以上)集群進行大模型(100B )訓練及調優經驗者優先;
7、有優秀的英文學術論文寫作能力,在英文期刊和學術頂會上發表過學術論文者優先;
8、對人工智能領域的前沿研究和算法有很高的熱情,渴望用人工智能技術解決商業世界的難題。
1、負責開源大模型、移動自有基礎大模型的調優(如SFT、RLHF等)、訓練范式優化及性能優化;
2、負責大模型prompt工程、模型蒸餾、推理加速、超長上下文等優化技術研究;
3、負責大模型安全與幻覺研究,提高大模型安全性及穩定性,解決大模型可控可信度不足問題;
4、參與大模型的產品落地,包括基于反饋的算法調優、算法創新、系統評測等。
任職資格:
1、計算機、人工智能、自然語言處理等相關專業碩士及以上學歷,具備5年以上自然語言處理算法經驗;
2、熟練掌握語言大模型相關算法,掌握GPT-series、LLaMa等預訓練模型,精通微調模型、自監督學習、注意力機制、Transformer、多模態學習等技術;
3、熟練掌握Python、C 等編程語言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度學習算法,掌握Deepspeed/Megatron等分布式訓練框架;
4、優秀的分析問題和解決問題的能力,對解決具有挑戰性的問題充滿激情;
5、具有良好的團隊合作精神和溝通能力,能夠牽頭帶領團隊承擔大模型應用與落地任務;
6、具備超大規模(千卡及以上)集群進行大模型(100B )訓練及調優經驗者優先;
7、有優秀的英文學術論文寫作能力,在英文期刊和學術頂會上發表過學術論文者優先;
8、對人工智能領域的前沿研究和算法有很高的熱情,渴望用人工智能技術解決商業世界的難題。
工作地點
地址:蘇州虎丘區蘇州市高新區昆侖山路58號


職位發布者
劉女士/..HR
中移(蘇州)軟件技術有限公司

-
通信/電信/網絡設備/增值服務
-
500-999人
-
國有企業
-
虎丘區科靈路78號