原文:
www.kdnuggets.com/2022/09/7-machine-learning-portfolio-projects-boost-resume.html
作者提供的图片
对机器学习工程师职位的需求很高,但招聘过程很难突破。公司希望聘用有经验处理各种机器学习问题的专业人士。
1. Google 网络安全证书 - 快速进入网络安全职业生涯。
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你所在的组织的 IT 工作
对于新手或应届毕业生来说,展示技能和经验的方式很少。他们可以选择实习、参与开源项目、在非政府组织项目中做志愿者,或进行组合项目。
在这篇文章中,我们将重点介绍能够提升你简历的机器学习组合项目,并在招聘过程中帮助你。单独进行项目也能让你在解决问题方面更有能力。
图片来自 OpenVaccine Kaggle
mRNA 降解项目是一个复杂的回归问题。这个项目的挑战在于预测降解率,这可以帮助科学家设计更稳定的疫苗。
这个项目已经进行 2 年了,但你将会学到很多关于使用复杂的 3D 数据处理和深度学习 GRU 模型解决回归问题的知识。此外,我们还将预测 5 个目标:反应性、deg_Mg_pH10、deg_Mg_50C、deg_pH10、deg_50C。
图片来自 AnalyticsVidhya
自动图像描述 是你简历中必备的项目。你将了解计算机视觉、CNN 预训练模型以及用于自然语言处理的 LSTM。
最终,你将在 Streamlit 或 Gradio 上构建应用程序以展示你的结果。图像标题生成器将生成简单的文本来描述图像。
你可以在线找到多个类似项目,甚至可以创建自己的深度学习架构来预测不同语言的字幕。
作品集项目的主要目的是解决一个独特的问题。可以是相同的模型架构但使用不同的数据集。处理各种数据类型将提高你的招聘机会。
图片由Soham Nandi提供
使用深度学习进行预测是一个流行的项目想法,你将学习时间序列数据分析、数据处理、预处理和时间序列问题的神经网络等许多内容。
时间序列预测并不简单。你需要理解季节性、假期、趋势和日常波动。大多数时候,你甚至不需要神经网络,简单的线性回归就能提供最佳表现的模型。但在风险较高的股市中,即使是一百分之一的差异也可能为公司带来数百万美元的利润。
Gif 由xtma提供
在你的简历上有一个强化学习项目可以在招聘过程中为你带来优势。招聘人员会认为你擅长解决问题,并且渴望拓展自己的界限,学习复杂的机器学习任务。
在自动驾驶汽车项目中,你将训练 OpenAI Gym 环境中的 Proximal Policy Optimization (PPO)模型(CarRacing-v0)。
在开始项目之前,你需要学习强化学习的基础知识,因为它与其他机器学习任务有很大不同。在项目中,你将尝试各种模型和方法,以提高代理性能。
图片来自LamaAl聊天机器人
对话式 AI是一个有趣的项目。你将学习 Hugging Face Transformers、Facebook Blender Bot、处理对话数据以及创建聊天机器人界面(API 或 Web 应用)。
由于 Hugging Face 上提供了大量的数据集和预训练模型库,你基本上可以在新的数据集上微调模型。这可以是《瑞克与莫提》的对话、你喜欢的电影角色,或者你喜爱的任何名人。
除此之外,你可以根据特定的使用案例改进聊天机器人。在医疗应用的情况下,聊天机器人需要具备技术知识并理解患者的情感。
作者提供的图片 | Hugging Face
自动语音识别是我最喜欢的项目。我学到了有关变换器、处理音频数据和提升模型性能的所有知识。我花了 2 个月时间理解基础知识,又花了 2 个月时间创建了一个可以在 Wave2Vec2 模型之上的架构。
你可以通过使用 n-grams 和文本预处理来提升 Wav2Vec2 模型的性能。我甚至预处理了音频数据以改善音质。
有趣的是,你可以在任何语言上微调 Wav2Vec2 模型。
作者提供的图片
端到端机器学习项目经验是必须的。没有它,你被录用的机会相当渺茫。
你将学到:
-
数据分析
-
数据处理
-
建模、构建和训练
-
实验追踪
-
编排和机器学习管道
-
模型部署
-
云计算
-
模型监控
-
MLOps 最佳实践
这个项目的主要目的不是构建最好的模型或学习新的深度学习架构。主要目标是熟悉行业标准和构建、部署、监控机器学习应用的技术。你将学习很多有关开发运维的知识,并了解如何创建一个完全自动化的系统。
在做了几个项目之后,我强烈建议你在 GitHub 或任何代码共享网站上创建一个个人资料,以便分享你的项目发现和文档。
从事项目的主要目的是提高你被录用的机会。展示项目并在潜在招聘人员面前展示自己是一种技能。
所以,在完成一个项目后,开始在社交媒体上推广它,使用 Gradio 或 Streamlit 创建一个有趣的网络应用,并写一篇引人入胜的博客。不要担心别人会说什么。继续做项目并不断分享。我相信很快会有多个招聘人员联系你。
Abid Ali Awan (@1abidaliawan) 是一名认证的数据科学专业人士,热衷于构建机器学习模型。目前,他专注于内容创作和撰写有关机器学习和数据科学技术的技术博客。Abid 拥有技术管理硕士学位和电信工程学士学位。他的愿景是使用图神经网络构建一个人工智能产品,帮助那些在心理健康方面挣扎的学生。