Files
KQL a7242f0c69 Initial commit: 教务系统在线平台
- 包含4个产业方向的前端项目:智能开发、智能制造、大健康、财经商贸
- 已清理node_modules、.yoyo等大文件,项目大小从2.6GB优化至631MB
- 配置完善的.gitignore文件

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2025-12-12 18:16:55 +08:00

7.1 KiB
Raw Permalink Blame History

AI算法工程师

对应岗位AI算法工程师

一、项目经历

项目名称大规模AI模型训练与部署全链路实战

实习岗位AI算法工程师助理

实习时间2024.05-2024.06

(四)实习单位:北京君南圣达信息技术有限公司

(五)岗位职责:

  1. 协助导师进行数据收集与预处理,使用 Python 与 MySQL 工具对文本数据进行清洗、标注与版本管理,掌握异常样本处理与增强策略,确保输入数据的完整性与一致性,为后续模型训练提供高质量数据支撑

    在指导下学习异常样本处理与数据增强方法,保证输入数据基本可用,为后续模型训练提供支撑

  2. 参与预训练模型加载与架构实验,在导师指导下尝试 LoRA 与 P-Tuning 微调方法学习将开源大模型如LLaMA、ChatGLM适配到特定任务场景

    接触过 LoRA 与 P-Tuning 微调,在导师带领下尝试将开源大模型(如 LLaMA、ChatGLM做简单适配,并通过提示词迭代来体验任务优化。

  3. 协助执行大规模训练实验,使用 PyTorch 框架 配置混合精度训练AMP、梯度累积等加速方法

    学习配置混合精度训练AMP、梯度累积等方法,记录训练曲线与日志文件,并在老师指导下观察过拟合与收敛情况。

  4. 学习并参与 RAG 系统的实验性搭建,协助调用 Faiss 向量数据库 完成混合检索流程的验证,探索文本召回与问答优化的实现路径

    初步接触 RAG 系统,跟随导师尝试用 Faiss 向量数据库做简单的检索实验,理解问答优化的大致思路

  5. 协助开展模型压缩与部署准备实验,参与 剪枝、量化与知识蒸馏 测试

    在团队带领下接触过剪枝、量化等实验,学习使用 ONNX 与 TensorRT 工具进行格式转换,记录性能对比。

  6. 参与推理服务与上线监控实验,协助配置 TorchServe/Triton 服务 并测试延迟与吞吐表现

    跟随导师学习 TorchServe/Triton 服务的基本配置,帮忙整理延迟、吞吐日志数据,理解上线监控的重要性。

  7. 跟随导师进行技术总结与文档撰写,协助记录实验配置、参数组合与结果对比,学习通过开源社区与论文资料解决模型调优问题,培养良好的技术沉淀与复盘习惯

    参与实验配置和结果的记录,整理参数组合,尝试查阅社区资料来解决简单问题,逐渐养成写总结的习惯

二、专业技能

(一)核心能力

  1. 精通Python编程具备优秀的编码习惯与代码规范熟悉 Python 编程,能写出规范的基础代码;掌握 PyTorch 框架的常用训练方法,了解 MySQL 基础操作,具备常见数据结构与算法的理解。
  2. 深入理解大语言模型的推理、微调Fine-tuning、提示词工程等关键技术初步掌握大语言模型的推理与微调流程,接触过 LoRA、P-Tuning 等方法,能在老师指导下做领域适配实验,并尝试通过提示词调整效果。
  3. 熟悉 RAG 技术全链路,具备构建向量数据库、混合检索系统的能力对 RAG 技术有基础认知,跟随导师尝试过 Faiss 向量检索实验,理解其在问答系统里的作用。
  4. 了解多模态模型的基本原理与应用场景。熟悉向量数据库如Milvus、图数据库如Neo4j的概念及其在知识库构建中的应用听取过相关介绍,知道多模态和数据库技术的大致应用,但还处在学习和尝试阶段。
  5. 具备出色的逻辑分析能力,能通过技术文档、开源社区和项目实践快速攻克技术难题具备一定逻辑分析和问题排查能力,能借助文档、社区资源解决简单问题,逐渐积累经验

(二)复合能力

  1. Agent智能体开发基础能力理解Agent的基本结构与工作机制了解其在物联网、自动化控制和多任务协同中的应用模式初步具备使用LangChain等主流框架实现简单任务编排和功能调用的能力。
  2. 人工智能应用能力了解人工智能的发展路径与主流算法框架如Transformer、多模态模型初步掌握LLM调用、Prompt编写与图文生成工具的使用方法具备AI基础素养与合规意识。
  3. 基础编程能力掌握数组、链表、哈希表、堆栈、树与图等核心数据结构的原理与使用场景具备使用Python进行数据处理与基础编程的能力。
  4. 计算机系统基础理解能力具备从计算机底层结构CPU架构、缓存设计、指令系统到上层操作系统演进Linux、虚拟化、边缘OS的系统理解能力能够初步分析软硬件协同机制与设备运行原理。
  5. Linux系统操作能力能够在Linux环境下完成磁盘管理、用户权限配置、网络设置等常规操作熟悉文件系统与命令行工具具备脚本自动化与远程运维的初步经验。
  6. 持续学习能力:关注技术前沿趋势,如扩散模型、多模态大模型等方向,具备持续学习的意愿与主动探索的习惯,能够主动跟进新技术动态并将其应用于实际学习或项目尝试中。
  7. 自动化脚本应用能力会使用Python对本地数据进行基础处理、接口调用任务能够使用小型自动化工具来提升开发与运维效率具备基础的异常处理与日志记录能力。
  8. 网络通信协议理解能力理解TCP/IP模型、WiFi、蜂窝通信、BGP路由等核心网络协议了解云计算架构下的网络基础设施与数据传输机制具备构建连接与排查通信问题的基础能力。
  9. 嵌入式与边缘设备部署基础:了解物联网设备中的嵌入式系统架构,具备边缘设备操作系统、驱动管理与资源调度机制的基本认知,能够协助完成设备配置与系统调优任务。
  10. 版本管理与协同开发能力掌握Git的本地提交、远程仓库操作流程具备多人协作开发、代码评审与冲突解决的工作经验。

三、个人评价

在项目实践中,积累了较为完整的AI算法开发与应用经验能够独立完成数据收集、清洗与标注积累了一定的 AI 算法开发基础经验,能在老师指导下完成数据收集、清洗与标注,并结合简单的数据增强策略提升输入质量。熟悉 PyTorch 框架下的训练流程,接触过 LoRA、P-Tuning 等微调方法,并尝试通过提示词优化任务表现。对 RAG 系统有过实验体验,能使用 Faiss 做基础验证。对模型压缩与部署有初步理解,尝试过 ONNX、TensorRT 转换和性能对比。学习使用过 TorchServe/Triton 的推理服务,理解上线监控的重要性。注重实验记录与总结,喜欢通过社区和论文学习解决问题,虽然经验有限,但学习能力和适应力强,愿意在未来继续积累,逐步成长为合格的 AI 算法工程师。