# AI算法工程师 # 对应岗位:AI算法工程师 # 一、项目经历 ### (一)项目名称:大规模AI模型训练与部署全链路实战 ### (二)实习岗位:AI算法工程师助理 ### (三)实习时间:2024.05-2024.06 ### (四)实习单位:**北京君南圣达信息技术有限公司** ### (五)岗位职责: 1. 协助导师进行数据收集与预处理,使用 Python 与 MySQL 工具对文本数据进行清洗、标注与版本管理,~~掌握异常样本处理与增强策略,确保输入数据的完整性与一致性,为后续模型训练提供高质量数据支撑~~ **在指导下学习异常样本处理与数据增强方法,保证输入数据基本可用,为后续模型训练提供支撑**。 2. 参与预训练模型加载与架构实验,~~在导师指导下尝试 LoRA 与 P-Tuning 微调方法,学习将开源大模型(如LLaMA、ChatGLM)适配到特定任务场景~~ **接触过 LoRA 与 P-Tuning 微调,在导师带领下尝试将开源大模型(如 LLaMA、ChatGLM)做简单适配**,并通过提示词迭代来体验任务优化。 3. 协助执行大规模训练实验,使用 PyTorch 框架 ~~配置混合精度训练(AMP)、梯度累积等加速方法~~ **学习配置混合精度训练(AMP)、梯度累积等方法**,记录训练曲线与日志文件,并在老师指导下观察过拟合与收敛情况。 4. ~~学习并参与 RAG 系统的实验性搭建,协助调用 Faiss 向量数据库 完成混合检索流程的验证,探索文本召回与问答优化的实现路径~~ **初步接触 RAG 系统,跟随导师尝试用 Faiss 向量数据库做简单的检索实验,理解问答优化的大致思路**。 5. 协助开展模型压缩与部署准备实验,~~参与 剪枝、量化与知识蒸馏 测试~~ **在团队带领下接触过剪枝、量化等实验**,学习使用 ONNX 与 TensorRT 工具进行格式转换,记录性能对比。 6. ~~参与推理服务与上线监控实验,协助配置 TorchServe/Triton 服务 并测试延迟与吞吐表现~~ **跟随导师学习 TorchServe/Triton 服务的基本配置,帮忙整理延迟、吞吐日志数据**,理解上线监控的重要性。 7. ~~跟随导师进行技术总结与文档撰写,协助记录实验配置、参数组合与结果对比,学习通过开源社区与论文资料解决模型调优问题,培养良好的技术沉淀与复盘习惯~~ **参与实验配置和结果的记录,整理参数组合,尝试查阅社区资料来解决简单问题,逐渐养成写总结的习惯**。 # 二、专业技能 ### (一)核心能力 1. ~~精通Python编程,具备优秀的编码习惯与代码规范~~**熟悉 Python 编程,能写出规范的基础代码**;掌握 PyTorch 框架的常用训练方法,了解 MySQL 基础操作,具备常见数据结构与算法的理解。 2. ~~深入理解大语言模型的推理、微调(Fine-tuning)、提示词工程等关键技术~~**初步掌握大语言模型的推理与微调流程**,接触过 LoRA、P-Tuning 等方法,能在老师指导下做领域适配实验,并尝试通过提示词调整效果。 3. ~~熟悉 RAG 技术全链路,具备构建向量数据库、混合检索系统的能力~~**对 RAG 技术有基础认知,跟随导师尝试过 Faiss 向量检索实验**,理解其在问答系统里的作用。 4. ~~了解多模态模型的基本原理与应用场景。熟悉向量数据库(如Milvus)、图数据库(如Neo4j)的概念及其在知识库构建中的应用~~**听取过相关介绍,知道多模态和数据库技术的大致应用**,但还处在学习和尝试阶段。 5. ~~具备出色的逻辑分析能力,能通过技术文档、开源社区和项目实践快速攻克技术难题~~**具备一定逻辑分析和问题排查能力,能借助文档、社区资源解决简单问题,逐渐积累经验**。 ### (二)复合能力 1. Agent智能体开发基础能力:理解Agent的基本结构与工作机制,了解其在物联网、自动化控制和多任务协同中的应用模式,初步具备使用LangChain等主流框架实现简单任务编排和功能调用的能力。 2. 人工智能应用能力:了解人工智能的发展路径与主流算法框架(如Transformer、多模态模型),初步掌握LLM调用、Prompt编写与图文生成工具的使用方法,具备AI基础素养与合规意识。 3. 基础编程能力:掌握数组、链表、哈希表、堆栈、树与图等核心数据结构的原理与使用场景,具备使用Python进行数据处理与基础编程的能力。 4. 计算机系统基础理解能力:具备从计算机底层结构(CPU架构、缓存设计、指令系统)到上层操作系统演进(Linux、虚拟化、边缘OS)的系统理解能力,能够初步分析软硬件协同机制与设备运行原理。 5. Linux系统操作能力:能够在Linux环境下完成磁盘管理、用户权限配置、网络设置等常规操作,熟悉文件系统与命令行工具,具备脚本自动化与远程运维的初步经验。 6. 持续学习能力:关注技术前沿趋势,如扩散模型、多模态大模型等方向,具备持续学习的意愿与主动探索的习惯,能够主动跟进新技术动态并将其应用于实际学习或项目尝试中。 7. 自动化脚本应用能力:会使用Python对本地数据进行基础处理、接口调用任务,能够使用小型自动化工具来提升开发与运维效率,具备基础的异常处理与日志记录能力。 8. 网络通信协议理解能力:理解TCP/IP模型、Wi‑Fi、蜂窝通信、BGP路由等核心网络协议,了解云计算架构下的网络基础设施与数据传输机制,具备构建连接与排查通信问题的基础能力。 9. 嵌入式与边缘设备部署基础:了解物联网设备中的嵌入式系统架构,具备边缘设备操作系统、驱动管理与资源调度机制的基本认知,能够协助完成设备配置与系统调优任务。 10. 版本管理与协同开发能力:掌握Git的本地提交、远程仓库操作流程,具备多人协作开发、代码评审与冲突解决的工作经验。 # 三、个人评价 在项目实践中,~~积累了较为完整的AI算法开发与应用经验,能够独立完成数据收集、清洗与标注~~**积累了一定的 AI 算法开发基础经验,能在老师指导下完成数据收集、清洗与标注**,并结合简单的数据增强策略提升输入质量。熟悉 PyTorch 框架下的训练流程,接触过 LoRA、P-Tuning 等微调方法,并尝试通过提示词优化任务表现。对 RAG 系统有过实验体验,能使用 Faiss 做基础验证。对模型压缩与部署有初步理解,尝试过 ONNX、TensorRT 转换和性能对比。学习使用过 TorchServe/Triton 的推理服务,理解上线监控的重要性。注重实验记录与总结,喜欢通过社区和论文学习解决问题,虽然经验有限,但学习能力和适应力强,愿意在未来继续积累,逐步成长为合格的 AI 算法工程师。