Stefan Mićić,诺维萨德开发商,伏伊伏丁那,塞尔维亚
Stefan is available for hire
Hire Stefan

Stefan Mićić

Verified Expert  in Engineering

机器学习工程师和开发人员

Location
诺维萨德,伏伊伏丁那,塞尔维亚
至今成员总数
July 20, 2022

Stefan是一位经验丰富的机器学习和机器学习操作(MLOps)工程师,拥有大数据系统的实践经验. 他拥有十年的专业知识,还拥有人工智能硕士学位. Stefan研究过物体检测等问题, classification, 情绪分析, 命名实体识别, 推荐系统. 他一直期待参与端到端机器学习项目.

Portfolio

百事全球- DPS
机器学习操作(MLOps), api,机器学习,Python, Databricks...
Motius
Spark, Apache Spark, PySpark, Snowflake, Python, Python 3...
Lifebit
Amazon EC2, Valohai, Keras, TensorFlow, Python 3, Lens Studio, Kubernetes...

Experience

Availability

Part-time

首选的环境

PyCharm, Python 3, Python, GitHub, Amazon S3 (AWS S3), JSON,分布式系统

最神奇的...

...我创建的端到端机器学习解决方案多次优化了机器学习管道的成本,并获得了最先进的结果.

Work Experience

MLOps Engineer

2022 - 2023
百事全球- DPS
  • 使用PySpark机器学习管道实现端到端管道.
  • 使用GitHub操作实现了单元和集成测试的CI/CD.
  • 实现了处理大容量数据(150tb)的Spark和scikit-learn/Pandas ETL作业.
Technologies: 机器学习操作(MLOps), api,机器学习,Python, Databricks, Big Data, Spark, Scikit-learn, Pandas, CI / CD管道, REST APIs

技术主管数据工程师

2022 - 2023
Motius
  • 带领一个小团队实现ELT管道,从GraphQL数据库获取数据并将其放入Azure SQL中. 所有内容都被Dockerized并推送到Azure映像注册表.
  • 使用PySpark实现KPI计算,PySpark与Snowflake通信. 为Snowflake定义了表模式,并创建了迁移脚本.
  • 遵循Scrum方法论,包括每日Scrum、复古和计划,并使用Jira.
  • 带领一个小团队使用Apache气流作为编排器实现ETL Spark作业, AWS是基础设施,Snowflake是数据仓库.
技术:火花, Apache Spark, PySpark, Snowflake, Python, Python 3, 亚马逊网络服务(AWS), Databases, 分布式系统, Azure SQL, Azure, AWS Glue, Apache Airflow, 软件架构, Data Pipelines, Data Analysis, CI / CD管道

MLOps Engineer

2021 - 2022
Lifebit
  • 使用量化进行深度学习模型优化, ONNX Runtime, and pruning, among others.
  • 监控模型性能,包括内存、延迟和CPU使用情况.
  • 使用Valohai自动化CI/CD过程,使用GitHub Actions自动化MLOps生命周期的某些部分.
  • 使用Amazon CloudWatch创建了自动实验跟踪, Valohai, Python, GitHub Actions, and Kubernetes.
技术:Amazon EC2, Valohai, Keras, TensorFlow, Python 3, Lens Studio, Kubernetes, Codeship, GitHub, 开放神经网络交换(ONNX), Visual Studio Code (VS Code), Optimization, 神经网络, NumPy, Monitoring, Amazon S3 (AWS S3), Cloud, Scikit-learn, 亚马逊网络服务(AWS), AI Design, 深度神经网络, 软件工程, Pytest, JSON, 源代码审查, Code Review, Task Analysis, Databases, Data Science, CI / CD管道, DevOps, REST APIs

机器学习工程师

2020 - 2021
HTEC Group
  • 使用Open Neural network Exchange (ONNX)优化已经在训练网络上的机器学习编译器,而无需重新训练,并使用PyTorch和c++实现自定义操作符.
  • 致力于Android机器学习解决方案,并指导经验不足的开发人员训练和准备对象检测器和分类器,以便在Android设备上顺利运行.
  • 增强了一个旨在将图像升级到尽可能完美的4K分辨率的项目.
  • 参与船舶路线的SDP问题. 从零开始实现了一个算法来引导船只. 油耗和预计到达时间被用于计算.
  • 致力于开源ONNX运行时,以增加对MIGraphX库的支持.
技术:Python 3, Python, Docker, 计算机视觉, PyTorch, 人工智能(AI), 机器学习, 团队的领导, 机器学习操作(MLOps), GitHub, 卷积神经网络, 开放神经网络交换(ONNX), Visual Studio Code (VS Code), 神经网络, NumPy, Cloud, Pandas, Scikit-learn, 计算机视觉算法, AI Design, 深度神经网络, 软件工程, Pytest, JSON, 技术招聘, 源代码审查, Code Review, Task Analysis, Interviewing, Databases, Data Science, REST APIs

机器学习工程师

2019 - 2020
SmartCat
  • 使用MLflow进行模型版本控制,为完成MLOps生命周期做出贡献, 用于数据版本控制的LakeFS, 用于数据存储的AWS S3, 和TensorFlow在Docker中服务.
  • 作为数据工程师,使用Apache Spark完成ETL作业,使用Prefect和Apache Airflow进行调度.
  • 训练了几种不同的目标检测和分类体系结构.
技术:Python 3, Scala, Python, Docker, SQL, 计算机视觉, MongoDB, 人工智能(AI), 机器学习, 工程数据, 机器学习操作(MLOps), GitHub, 递归神经网络(rnn), 卷积神经网络, ETL, Visual Studio Code (VS Code), 神经网络, NumPy, Amazon S3 (AWS S3), Big Data, 图像处理, Cloud, Pandas, Scikit-learn, 对象检测, 计算机视觉算法, 对象跟踪, Apache Spark, 亚马逊网络服务(AWS), AI Design, 深度神经网络, 软件工程, Pytest, ETL Tools, JSON, Jupyter笔记本, 源代码审查, Code Review, Task Analysis, PySpark, Databases, Data Science, 分布式系统, Data Pipelines, REST APIs

机器学习工程师

2016 - 2019
Freelance
  • 从各个网站搜集欧博体育app下载, 然后使用自然语言处理-长短期记忆(LSTM)对抓取的数据进行分析和准备。, Word2Vec, 和转换器——因为数据是塞尔维亚语,所以添加了NER.
  • 使用亚马逊SageMaker实现机器学习流水线数据预处理自动化, model training, and deployment. 执行模型的自动再培训和部署, 在客户端更新新数据之前完成机器学习过程.
  • 使用Apache Spark, Kafka, Hadoop和MongoDB进行大数据项目.
  • 作为数据工程师,使用Spark创建优化的ETL管道. 将客户的需求转换为SQL.
技术:Python 3, Spark, 亚马逊SageMaker, Python, Docker, 计算机视觉, MongoDB, 人工智能(AI), 机器学习, 工程数据, Kubernetes, 机器学习操作(MLOps), GitHub, Amazon EC2, 递归神经网络(rnn), 卷积神经网络, 开放神经网络交换(ONNX), 推荐系统, 自然语言理解(NLU), 自然语言处理(NLP), GPT, 生成预训练变压器(GPT), Visual Studio Code (VS Code), Time Series, Data Modeling, Data Mining, 神经网络, NumPy, Amazon S3 (AWS S3), Big Data, Apache Kafka, Hugging Face, Transformers, Cloud, Pandas, Scikit-learn, 对象检测, 计算机视觉算法, Apache Spark, 亚马逊网络服务(AWS), AI Design, Web开发, 深度神经网络, 软件工程, Pytest, JSON, Jupyter笔记本, 源代码审查, Code Review, Task Analysis, PySpark, Databases, Data Science, 分布式系统, 项目管理, CI / CD管道, 谷歌云平台(GCP), DevOps, REST APIs

自动化端到端(E2E)计算机视觉解决方案

创建了一个实时执行几件事的系统,包括:
•检测房间中的物体
•分类人的姿势
•自动再培训(主动学习)
•模型和数据版本控制
•码头化管道
利用这些模型和预测, 我们创建了一个后处理管道,用于为客户创建报告或关键绩效指标(kpi).

Android COVID-19测试分类

目标是创建一个COVID-19测试分类模型. 我们的数据集很小,必须在最短的时间内(两周)建立最佳模型。.
我在这个项目上领导了一个两个人的团队. 我们使用MobileNet是因为它的规模,所有与业务相关的指标都很棒. 我们使用了许多优化技术将模型部署到Android上, 比如量子化, pruning, 知识的提炼.

MLOps Engineer

参与了一个项目,我的工作是使用量化优化整个机器学习系统, pruning, ONNX, and more. 我在减少五倍延迟的情况下达到了同样的精度, 缩小模型尺寸的两倍, 成本降低了四倍. 我还更改了底层EC2实例的类型,以获得更多的系统信息.

图像超分辨率

目标是通过研究和开发SOTA研究论文中的方法来改进升级和超分辨率模型. 有很多不同的自定义损失函数, layers, metrics, 甚至自定义反向传播.

ETL Jobs

•创建批量ETL作业,用于计算kpi.
•优化解决方案,降低成本和计算时间.
•通过气流和Prefect计划作业.
技术栈是:Spark、Scala、AWS S3、Kafka、Apache气流和Prefect.

NLP文章处理

这个项目的目标是开发物品处理的两个阶段:
1. 找到所有相关的标签(事件、地点、名称等).)在文章中.
2. 找到在某种程度上相关的标签对.

拥抱脸变压器主要用来解决这个问题(基于bert的模型). 总体指标高于95%.

Data Ingestion

领导一个团队,目标是从GraphQL数据库中获取数据并将其插入Azure SQL. 每次推送到GitLab的主分支时,所有内容都被Dockerized并推送到EKS. 为了优化解决方案,使用了并发线程.

DE项目的技术领导

我的职责是从架构到实现细节的所有决策. 我们使用AWS的基础设施(CloudWatch、Glue、S3)和Airflow来编排Spark作业. Spark作业的每个结果都保存到Snowflake.

Languages

Python 3, Python, SQL, Scala, Java, Snowflake, GraphQL

Frameworks

Spark, Apache Spark

Libraries/APIs

PyTorch, Keras, NumPy, Scikit-learn, REST api, TensorFlow, Pandas, PySpark

Tools

PyCharm, GitHub, Apache Airflow, Pytest, 亚马逊SageMaker, Codeship, AWS Glue

Paradigms

数据科学、ETL、DevOps

Platforms

亚马逊网络服务(AWS), Jupyter笔记本, Visual Studio Code (VS Code), Docker, Kubernetes, Amazon EC2, Apache Kafka, Azure, Databricks, 谷歌云平台(GCP)

Storage

Amazon S3 (AWS S3), JSON,数据库,NoSQL, MongoDB,数据管道,Azure SQL

Other

Deep Learning, 机器学习, 人工智能(AI), 计算机视觉, 自然语言处理(NLP), 自然语言理解(NLU), 卷积神经网络, 递归神经网络(rnn), 机器学习操作(MLOps), 神经网络, AI Design, 深度神经网络, 软件工程, 技术招聘, 源代码审查, Code Review, Task Analysis, Interviewing, GPT, 生成预训练变压器(GPT), 工程数据, 推荐系统, 开放神经网络交换(ONNX), Lens Studio, Optimization, 团队的领导, Valohai, Time Series, Data Modeling, Data Mining, Monitoring, Big Data, 图像处理, Transformers, Cloud, 对象检测, 计算机视觉算法, 对象跟踪, Web开发, 语音识别, 语音识别, Cloud Services, ETL Tools, 分布式系统, Data Analysis, CI / CD管道, Hugging Face, BERT, Back-end, APIs, 软件架构

行业专业知识

项目管理

2020 - 2021

人工智能硕士学位

诺维萨德大学-诺维萨德,塞尔维亚

2022年7月- 2025年7月

AWS认证机器学习-专业

亚马逊网络服务

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring