職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
1、負責智算容器/AI平臺產品的維護工作,對系統可用性負責。主要工作包括投訴、故障等緊急事件的應急處置、監控告警優化、監控數據分析、變更、產品架構及性能優化。
任職資格:
1、大學本科或以上學歷,具備3年以上容器相關運維或開發經驗,;
2、能夠熟練使用Linux操作系統,熟悉Linux內核、網絡、存儲等系統底層原理,具備Linux常用服務的維護、問題處理和優化能力。
3、能夠熟練使用ansible、saltstack、zabbix、grafana、ELK、Prometheus等常用自動化運維工具并精通其中至少一種,有自動化運維工具開發經驗者優先;
4、熟悉CI/CD過程管理體系架構、能夠熟練使用Jenkins等工具完成產品快速交付;
5、精通至少Java、Python、Go、Shell等開發語言中的一種,熟練使用并能夠開發腳本;
6、精通K8S、Docker、鏡像倉庫、容器、serverless或Kafka等常見中間件日常運維,性能優化,版本升級,故障處理。熟悉基于Docker的容器生態體系,熟悉分布式體系,精通相關源碼者優先。
7、熟悉機器學習、深度學習、大模型等AI知識,熟悉TensorFlow、PyTorch等框架。
8、了解英偉達GPU、華為昇騰NPU等AI芯片以及配套smi軟件工具
1、負責智算容器/AI平臺產品的維護工作,對系統可用性負責。主要工作包括投訴、故障等緊急事件的應急處置、監控告警優化、監控數據分析、變更、產品架構及性能優化。
任職資格:
1、大學本科或以上學歷,具備3年以上容器相關運維或開發經驗,;
2、能夠熟練使用Linux操作系統,熟悉Linux內核、網絡、存儲等系統底層原理,具備Linux常用服務的維護、問題處理和優化能力。
3、能夠熟練使用ansible、saltstack、zabbix、grafana、ELK、Prometheus等常用自動化運維工具并精通其中至少一種,有自動化運維工具開發經驗者優先;
4、熟悉CI/CD過程管理體系架構、能夠熟練使用Jenkins等工具完成產品快速交付;
5、精通至少Java、Python、Go、Shell等開發語言中的一種,熟練使用并能夠開發腳本;
6、精通K8S、Docker、鏡像倉庫、容器、serverless或Kafka等常見中間件日常運維,性能優化,版本升級,故障處理。熟悉基于Docker的容器生態體系,熟悉分布式體系,精通相關源碼者優先。
7、熟悉機器學習、深度學習、大模型等AI知識,熟悉TensorFlow、PyTorch等框架。
8、了解英偉達GPU、華為昇騰NPU等AI芯片以及配套smi軟件工具
工作地點
地址:蘇州虎丘區蘇州市高新區昆侖山路58號


職位發布者
劉女士/..HR
中移(蘇州)軟件技術有限公司

-
通信/電信/網絡設備/增值服務
-
500-999人
-
國有企業
-
虎丘區科靈路78號