🧠 大模型职业发展与学习路径指南
🎯 大模型岗位分类与定位
三大核心开发岗位
1. 大模型应用工程师
- 核心职责:使用现成模型/工具,快速结合业务开发应用(Demo、初级产品)
- 技术特点:重应用、重工具使用、轻底层算法
- 学历要求:相对较低,本科及以上(非统招也可),更看重项目经验和动手能力
- 别名:Agent工程师、大模型工程师(需看JD描述)
2. 大模型研发工程师
- 核心职责:使用现成模型进行深度应用,包括模型微调、推理优化、构建复杂系统
- 技术特点:需要理解算法原理和实现,但不深究数学推导
- 学历要求:本科及以上,计算机相关专业优先
3. 大模型算法工程师
- 核心职责:模型预训练、算法研发与优化、发布新模型
- 技术特点:深入算法数学原理,要求极高的理论基础和创新能力
- 学历要求:极高,通常要求985/211名校硕士/博士,科班出身,有顶会论文更佳
- 招聘企业:极少(全国约10-20家),如字节、阿里、DeepSeek、智谱等
如何辨别岗位
- 不要只看职位名称,一定要**仔细阅读职位描述(JD)**和要求
- 在招聘网站搜索时,关键词用"大模型"即可,然后根据JD筛选
📚 各岗位技术栈与学习深度
通用必学基础
低代码平台工具
- 作用:快速搭建Demo、验证想法、提升个人效率
- 学习深度:了解和使用级别,所有岗位都应会
编程语言与框架
- Python:核心语言,必须熟练掌握
- Spring AI (Java):优势在于与Java微服务生态整合,注意:目前不支持复杂的Agent/工作流开发
- LangGraph:专门开发Agent和多Agent以及工作流的主流框架
- LangChain:在下一版本中不会有任何Agent相关的API
大模型种类认知
通用大语言模型 (LLM)
- 例如:DeepSeek、GPT-4、Claude、通义千问
- 特点:通用能力强,文本生成、推理、对话
文本嵌入模型 (Embedding Model)
- 例如:BGE系列、OpenAI的text-embedding系列
- 作用:将文本转化为向量,用于构建知识库、语义搜索
多模态大模型
- 例如:GPT-4o、千问-VL、智谱GLM-4V
- 特点:能同时理解文本、图片、音频、视频
多模态嵌入模型
- 例如:千问的GME-VL、OpenCLIP
- 作用:将不同模态(图/文/音/视频)数据映射到同一向量空间,实现"Any to Any"的跨模态检索
多模态解析模型
- 例如:达摩院的DocOwl、小红书发布的dots.ocr
- 作用:解析复杂格式文件(PDF/PPT),精准提取其中的文本、表格、图片结构
垂直领域大模型
- 例如:AlphaFold(生物)、360安全大脑(安全)
- 特点:专攻某一领域,通用能力弱
分岗位学习重点与深度
大模型应用工程师
- 学习范围:应用层 + 部分工具层
- 关键能力:快速应用、工具使用、业务流程理解
- 学习深度:
- 模型:掌握上述多种模型的调用(API/SDK)
- 框架:掌握LangChain / LlamaIndex等应用框架的使用
- 算法:不需要学习数学推导,知道概念和用途即可
大模型研发工程师
- 学习范围:全部(应用层+工具层+算法层)
- 耗时:约在应用工程师基础上增加100-150学时
- 学习深度:
- 模型:掌握模型的调用、微调、私有化部署
- 推理框架:掌握VLLM、Transformers、LMDeploy等企业级推理框架的使用和优化
- 算法:掌握机器学习/深度学习算法的应用和调参,不需要深入数学推导
- 高级主题:复杂Agent开发、多智能体架构、工作流、模型评估(RAGAS)
大模型算法工程师
- 学习范围:全部,且深度最深
- 学习深度:
- 算法:必须掌握40+种常用算法的数学推导、原理和优化,能创新
- 模型:深入研究模型架构(如Transformer)、预训练、量化、蒸馏等
- 关键能力:算法创新、模型研发、解决复杂理论问题
🏗️ 项目经验与简历撰写
项目是核心
- 面试中80%的问题会围绕项目经验展开
- 项目复杂度是关键区分点:
- 简单项目:仅文本处理、简单向量检索、使用轻量数据库
- 复杂项目:多模态处理、复杂Agent(含动态路由、评估)、图数据库应用、模型微调/优化、高并发高性能要求
简历撰写建议
专业技能栏
- 分点列出掌握的技术、模型、框架
- 例如:"熟练掌握DeepSeek、GPT等大模型调用与微调";"精通LangChain框架进行Agent开发";"熟悉VLLM等推理框架的部署与优化"
项目经验栏
- 采用 "使用XXX技术,解决了XXX问题,实现了XXX效果(最好有量化指标)" 的句式
- 突出项目的复杂性和你个人的贡献
- 例如:"基于千问-VL和DOS-OCR,开发了一个多模态企业知识库系统,解决了非结构化文档(PDF/PPT)的精准解析和检索难题,使查询准确率提升至95%。"
工作经验栏
- 过往的软件开发经验(Java/Python等)一定要写,这是工程能力的基础证明
- 如果是转行,可以将大模型项目经验单独作为"项目经历"模块突出展示
🚀 学习建议与就业规划
学习路径
- 应用工程师:聚焦应用层技术,2个月左右可完成学习
- 研发工程师:全面学习,约需3个月
- 算法工程师:深度攻关算法,需5-6个月甚至更长
- 核心:一定要动手写代码,跟着项目一行一行地敲
城市选择
- 岗位主要集中在:北京、上海、深圳、广州、杭州、成都、武汉、南京、重庆、长沙等城市
- 其他城市机会相对较少,建议优先选择以上城市求职
现状分析
- 应用工程师:需求量大,暂未内卷,是转行的热点
- 研发工程师:门槛稍高,需求旺盛,竞争相对缓和
- 算法工程师:极度稀缺,薪资高昂,但门槛极高
未来预判
- 应用工程师:预计在明年(2026年)中下旬开始内卷
- 研发工程师:内卷时间会稍晚一些
- 算法工程师:长期内仍将保持稀缺状态
✅ 总结
- 明确定位:根据自身基础(学历、代码能力、学习时间)选择目标岗位
- 精准学习:不要盲目贪多,按照目标岗位的技术栈深度要求去学习
- 项目为王:投入主要精力做出1-2个有复杂度的项目,这是简历和面试的硬通货
- 理性求职:认清市场现状,选择机会多的城市,合理规划预期