職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
負責AI模型工程化相關工作,如框架設計、模型優化、推理加速等。
任職資格:
1、計算機、人工智能等相關專業本科以上學歷,3年以上工作經驗,具備扎實的C/C /Python/CUDA等編程經驗及工程化經驗;
2、熟悉深度學習算法(transformer、LLM、VLM、DM等)及及常用開源大模型;
3、熟悉AI常用訓練和部署(如PyTorch/DeepSpeed/QNN/vllm/;
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)應用與原理 ;
4、熟悉常見模型輕量化方法(量化AWQ/GPTQ、剪枝、蒸餾等)和大模型推理加速(off-loading、投機采樣等)及相關工具鏈;
5、有CUDA性能優化及其他硬件(如 CPU、NPU 等)的使用、相關的性能調優經驗,如FastTransformer、TensorRT、triton等經驗優先;
6、加分項:2年及以上大模型分布式推理引擎開發經驗;國際競賽和核心會議發文;
7、加分項:有AI Infra公司和AI芯片公司、大語言模型推理框架研發經驗優先;
8、加分項:有內存管理、算子優化、機器學習編譯、異步并發、IO優化相關研發經驗優先。
負責AI模型工程化相關工作,如框架設計、模型優化、推理加速等。
任職資格:
1、計算機、人工智能等相關專業本科以上學歷,3年以上工作經驗,具備扎實的C/C /Python/CUDA等編程經驗及工程化經驗;
2、熟悉深度學習算法(transformer、LLM、VLM、DM等)及及常用開源大模型;
3、熟悉AI常用訓練和部署(如PyTorch/DeepSpeed/QNN/vllm/;
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)應用與原理 ;
4、熟悉常見模型輕量化方法(量化AWQ/GPTQ、剪枝、蒸餾等)和大模型推理加速(off-loading、投機采樣等)及相關工具鏈;
5、有CUDA性能優化及其他硬件(如 CPU、NPU 等)的使用、相關的性能調優經驗,如FastTransformer、TensorRT、triton等經驗優先;
6、加分項:2年及以上大模型分布式推理引擎開發經驗;國際競賽和核心會議發文;
7、加分項:有AI Infra公司和AI芯片公司、大語言模型推理框架研發經驗優先;
8、加分項:有內存管理、算子優化、機器學習編譯、異步并發、IO優化相關研發經驗優先。
工作地點
地址:深圳寶安區庭威產業園-2號樓1B2樓D區
以擔保或任何理由索取財物,扣押證照,均涉嫌違法,請提高警惕
職位發布者
鐘景維HR
深圳市億道控股有限公司

-
電子技術·半導體·集成電路
-
500-999人
-
公司性質未知
-
深圳市寶安區28區大寶路49-1號金富來大廈
深圳寶安區
3年以上
本科
2025-11-02 04:54:32
人關注
下載APP
關注今日招聘微信服務號