崗位需求
? 負責主導全生命周期行業大模型開發的技術領袖,兼具戰略規劃能力(技
術路線制定/風險預判)與實戰經驗(至少 1 個完整大模型項目閉環經
驗),能帶領團隊突破技術瓶頸;
? 負責主導航天領域大模型開發,重點解決航天特色場景下的模型優化問
題。
專業要求:
u 5 年以上大模型架構設計相關經驗,主導過千億參數級模型從開發到形
成產品的全流程工作(需提供項目文檔/論文/代碼倉庫等證明),精通
Transformer 架構優化;
u 精通分布式訓練框架(Megatron/DeepSpeed),具備分布式訓練與推理
優化經驗(如混合精度訓練、ZeRO 優化);
u 精通計算-通信平衡策略、MoE 架構在稀疏計算中的應用(如Google Switch Transformer 實戰經驗);
u 掌握 CoT 技術的落地方法,掌握 CoT 提示工程和訓練方法;
u 具備知識圖譜與大模型融合經驗;
u 掌握多模態大模型(如 Qwen-VL、DeepSeek-V2)的微調策略;
u 成功應用過模型蒸餾技術,如用 GPT-4 生成仿真數據訓練輕量化模型。
