Files

51 lines
9.6 KiB
Markdown
Raw Permalink Normal View History

# AI技术工程师
# 对应岗位AI技术工程师
# 一、项目经历
### 项目名称AI语音识别智能家居系统开发项目
### 实习岗位AI技术工程师助理
### 实习时间2024.06-2024.07
### (四)实习单位:**上海数趣信息科技有限公司**
### (五)岗位职责:
1. 协助导师完成语音识别数据的预处理与特征工程,~~使用 Pandas/NumPy 进行音频数据清洗与异常值处理,参与特征选择与噪声过滤实验,确保语音命令样本在不同环境下具备较高的数据质量,为模型训练提供可靠输入~~**跟着导师学着用 Pandas/NumPy 对音频数据做清洗和异常处理,也尝试做特征选择和噪声过滤,让语音样本在不同环境下更稳定,为后续训练提供靠谱的数据;**
2. 参与语音识别算法的验证实验,~~在工程师指导下使用 PyTorch 对小规模语音模型进行微调测试,学习并尝试 LoRA 微调与梯度裁剪 方法,记录不同参数组合下的识别准确率与延迟表现,为后续优化提供数据支持~~**在工程师指导下用 PyTorch 对小模型做了一些微调实验,尝试过 LoRA 微调和梯度裁剪,记录不同参数下的准确率和延迟表现,积累了优化的基础经验;**
3. 协助工程师完成智能家居系统的联动控制实验,~~基于 Flask 搭建简易的接口调用流程,完成传感器数据采集、阈值逻辑控制与设备状态反馈测试,整理控制延迟与功耗对比表,推动执行器稳定运行~~**用 Flask 搭建了简单接口,完成传感器数据采集、阈值逻辑和设备状态反馈的测试,并整理了延迟和功耗对比,帮助保证执行器运行更稳;**
4. 参与系统集成与远程控制功能调试,~~协助配置 Docker 容器环境 并在导师指导下完成服务部署进行Wi-Fi模块与移动端App的联调测试记录通信加密与远程访问延迟数据保证系统在实验场景中的稳定性~~**协助配置 Docker 环境,在导师指导下完成服务部署,做了 Wi-Fi 模块和App的联调测试记录了延迟和加密情况确保实验系统能稳定跑**
5. 协助完成模型优化与加速实验,~~学习使用 ONNX 模型转换 与 TensorRT 加速工具,配合工程师进行模型压缩与推理速度测试,观察优化前后的性能差异,并整理实验数据形成对比报告~~**学习用 ONNX 做模型转换,尝试用 TensorRT 做加速,对比了优化前后的推理速度,并整理成实验报告;**
6. ~~参与项目过程管理,使用 Git 进行版本控制与代码提交,协助导师整理阶段性测试问题清单,借助 Jira 跟踪任务进展配合团队完成系统调试、A/B测试与改进建议推动项目进入迭代优化环节~~**在项目管理上也有参与,会用 Git 提交代码,帮导师整理测试问题清单,学着用 Jira 跟踪进度,协助团队做调试和改进。**
# 二、专业技能
### (一)核心能力
1. ~~掌握从数据预处理到模型部署的全流程技术栈熟练使用PyTorch/TensorFlow框架进行模型开发掌握ONNX模型转换与量化技术能够使用Docker容器化部署模型并具备Flask/FastAPI等框架的RESTful API开发能力实现AI系统的生产环境集成~~**掌握从数据预处理到模型部署的基本流程,会用 PyTorch 框架做模型开发,学过 ONNX 转换和简单的模型量化,能用 Docker 部署模型,也能用 Flask/FastAPI 做 API**
2. ~~精通基于Transformer架构的模型微调技术具有丰富的Hugging Face生态实战经验。能够针对分类、生成、预测等场景通过Layer冻结、LoRA微调、梯度裁剪等高级技术在数据稀缺条件下有效提升模型性能实现95%+的准确率优化~~**对 Transformer 架构的模型微调有一定了解,用过 Hugging Face 的工具,尝试过 Layer 冻结、LoRA 微调、梯度裁剪等方法来提升模型效果;**
3. ~~具备将业务需求转化为技术方案的系统能力熟练使用UML图、时序图进行方案设计。能够完成技术可行性分析及投入产出评估撰写专业的技术方案文档并协调前后端开发团队推动方案落地~~**能把业务需求转成技术方案,画过简单的流程图,能写基础的技术文档,并在团队里协助推动方案落地;**
4. ~~精通使用Pandas/NumPy进行大规模数据清洗与分析掌握特征选择、维度压缩、异常值处理等高级特征工程技术。能够运用Spark进行分布式数据处理解决实际业务中的特征稀疏、样本不平衡等挑战~~**会用 Pandas/NumPy 做数据清洗和分析,接触过特征选择和异常值处理等方法;**
5. ~~持续跟踪LLM、多模态、AIGC等前沿方向具备阅读和实现顶会论文的能力。已在个人项目中应用LangChain、向量数据库等新技术探索RAG系统在垂直领域的创新应用并完成效果验证~~**平时会关注 LLM、多模态、AIGC 等前沿方向,尝试过用 LangChain 和向量数据库做一些小实验;**
6. ~~熟悉Agile/Scrum开发流程精通Git版本控制与CI/CD流水线搭建。具有丰富的跨团队协作经验能够使用Jira进行任务管理推动模型开发、A/B测试、迭代优化的完整闭环确保项目高质量交付~~**熟悉 Agile/Scrum 的基本流程,会用 Git 做版本管理,也能配合团队用 Jira 跟踪任务,参与过 A/B 测试和迭代优化;**
7. ~~掌握模型压缩、蒸馏、量化等优化技术能够通过TensorRT加速推理过程实现推理速度300%+的提升。精通模型评估指标体系,能够设计多维度测试方案,确保模型在生产环境的稳定性和可靠性~~**学习过模型压缩、蒸馏和量化,尝试用 TensorRT 做过推理加速,对比过优化前后的差异。**
### (二)复合能力
1. 人工智能应用能力了解人工智能的发展路径与主流算法框架如Transformer、多模态模型初步掌握LLM调用、Prompt编写与图文生成工具的使用方法具备AI基础素养与合规意识。
2. 基础编程能力掌握数组、链表、哈希表、堆栈、树与图等核心数据结构的原理与使用场景具备使用Python进行数据处理与基础编程的能力。
3. Agent智能体开发基础能力理解Agent的基本结构与工作机制了解其在物联网、自动化控制和多任务协同中的应用模式初步具备使用LangChain等主流框架实现简单任务编排和功能调用的能力。
4. 嵌入式与边缘设备部署基础:了解物联网设备中的嵌入式系统架构,具备边缘设备操作系统、驱动管理与资源调度机制的基本认知,能够协助完成设备配置与系统调优任务。
5. 计算机系统基础理解能力具备从计算机底层结构CPU架构、缓存设计、指令系统到上层操作系统演进Linux、虚拟化、边缘OS的系统理解能力能够初步分析软硬件协同机制与设备运行原理。
6. 网络通信协议理解能力理解TCP/IP模型、WiFi、蜂窝通信、BGP路由等核心网络协议了解云计算架构下的网络基础设施与数据传输机制具备构建连接与排查通信问题的基础能力。
7. 持续学习能力:关注技术前沿趋势,如扩散模型、多模态大模型等方向,具备持续学习的意愿与主动探索的习惯,能够主动跟进新技术动态并将其应用于实际学习或项目尝试中。
8. Linux系统操作能力能够在Linux环境下完成磁盘管理、用户权限配置、网络设置等常规操作熟悉文件系统与命令行工具具备脚本自动化与远程运维的初步经验。
9. 自动化脚本应用能力会使用Python对本地数据进行基础处理、接口调用任务能够使用小型自动化工具来提升开发与运维效率具备基础的异常处理与日志记录能力。
10. 版本管理与协同开发能力掌握Git的本地提交、远程仓库操作流程具备多人协作开发、代码评审与冲突解决的工作经验。
# 三、个人评价
~~在项目实践中,具备从数据预处理到模型部署的完整技术能力,能够使用 Pandas/NumPy 进行语音数据清洗、特征选择与异常值处理,确保数据质量稳定。熟练掌握 PyTorch 框架,能够开展语音识别模型的微调实验,并尝试 LoRA 微调与梯度裁剪等优化方法,积累了性能提升的实践经验。熟悉 Flask 接口开发,能够完成智能家居场景下的联动控制与设备状态反馈测试。具备 Docker 容器化与 ONNX 模型转换的初步经验,能够协助完成模型压缩与推理加速实验,并通过 TensorRT 优化观察性能差异。掌握 Git 与 Jira 等工具的使用,能支持版本管理与任务跟踪,参与团队的迭代优化流程。学习过程中保持对 Hugging Face、LangChain 等前沿技术的关注能够结合论文与开源代码提出优化思路展现出持续学习和探索精神为未来AI技术工程师岗位积累了扎实基础~~**在实习中积累了从数据处理到模型部署的经验,比如用 Pandas/NumPy 做语音数据清洗和特征处理,用 PyTorch 试着做过模型微调,接触过 LoRA 和梯度裁剪等优化方法。也做过 Flask 接口实验,让设备能联动控制;尝试用 Docker 和 ONNX 做部署和转换,学习了 TensorRT 加速。平时会用 Git 和 Jira 辅助团队协作。对 Hugging Face、LangChain 等新技术保持关注,喜欢动手尝试并总结经验,具备一定的探索精神和学习潜力。**