岗位职责
1、负责深度学习在线推理引擎的设计与开发,打造低延时,高吞吐的推理引擎;
2、参与神经网络加速技术的调研、探索和落地;
3、负责nlp大模型在实际业务场景中落地。
任职要求
1、本科及以上学历,具备丰富的模型推理加速算法经验,熟悉各类主流加速库,如:tensorrt / cudnn / mkl / xla等;熟悉各类ir,包括不限于onnx;
2、熟悉主流深度学习框架:tensorflow / pytorch,熟悉主流推理引擎:triton / openvino;
3、有算子开发经验,具备深度学习模型性能分析和优化能力;
4、熟悉图优化、混合精度、剪枝、编译优化技术,有实操业务落地经验的优先;
5、熟悉模型部署优化,如模型量化、模型压缩,模型转换,模型稀疏化等;
6、熟练掌握c/c++/python编程,有大模型端到端落地经验者优先;
7、熟悉pytorch源码者优先。
- 行业未知
- 1000人以上
- 私营·民营企业
- 东莞市长安镇乌沙步步高大道283号
-
ID产品外观工程师(电子烟) 10000-20000元宝安区 应届毕业生 大专深圳市杰仕博科技有限公司
-
咨询经理/高级咨询经理(房地产管理咨询) 15000-20000元福田区 应届毕业生 硕士深圳市康达信房地产管理顾问有限公司
-
私人银行财富顾问 20000-40000元福田区 应届毕业生 大专中国银河证券股份有限公司深圳龙华证券营业部
-
售后技术支持 6000-10000元龙岗区 应届毕业生 大专武汉睿智视讯科技有限公司
-
售后工程师 6000-8000元光明区 应届毕业生 不限深圳市众创鑫科技有限公司
-
售前技术支持 9000-12000元福田区 应届毕业生 本科深圳巨灵信息技术有限公司