Adam Ivansky,加拿大安大略省多伦多的开发者
Adam is available for hire
Hire Adam

Adam Ivansky

Verified Expert  in Engineering

Machine Learning Developer

Location
Toronto, ON, Canada
Toptal Member Since
November 6, 2018

Adam在数据工程和数据科学方面有六年的经验. 他选择的工具包括Python 3、Spark和SQL. 他的主要关注领域包括etl和机器学习营销管道. Adam能够与高技术和非技术专家进行有效的沟通.

Portfolio

Apple
Python 3, Python API, Amazon EKS, Docker, Kubernetes, Amazon S3 (AWS S3)...
BJ's Wholesale Club
Jenkins, AWS CLI, Amazon S3 (AWS S3), Redshift, Python 3, Spark...
eBay
SQL, TensorFlow, Scikit-learn, Tableau, PySpark, Apache Hive, Python, Teradata

Experience

Availability

Part-time

Preferred Environment

Amazon Web Services (AWS), Python, Terraform, Snowflake, PostgreSQL, PySpark, Amazon弹性容器服务(Amazon ECS), ETL, GitHub

The most amazing...

...我参与的项目是开发一个Spark元存储数据仓库.

Work Experience

Data Engineer

2020 - PRESENT
Apple
  • 担任数据工程师,负责两个端到端项目,涉及从第三方云供应商收集数据.
  • 基于Python和Spark开发了一个定时etl,从各种api收集数据,并将数据加载到AWS S3和PostgreSQL数据库中. etl部署到气流和Kubernetes.
  • 构建了许多api,将数据仓库中的数据公开给数据的使用者.
  • 基于AWS Glue创建和修改etl. 基于Amazon SQS和Lambda创建了一个无服务器ETL.
Technologies: Python 3, Python API, Amazon EKS, Docker, Kubernetes, Amazon S3 (AWS S3), Amazon Simple Queue Service (SQS), Amazon Elastic MapReduce (EMR), Redshift, PostgreSQL

Data Engineer

2019 - 2020
BJ's Wholesale Club
  • 基于运行在AWS EMR上的PySpark开发了一个ETL管道,用于从Redshift提取数据到S3.
  • 对基于Spark机器学习的产品推荐引擎做出贡献.
  • 在PySpark中开发一个数据质量评估工具.
  • Owned cloud cost reporting. 在AWS CLI和AWS控制台中管理EMR集群的创建/终止.
  • 完全自动化的ETL/营销管道在詹金斯.
  • 对基于第三方数据识别新潜在成员的算法做出了贡献.
Technologies: Jenkins, AWS CLI, Amazon S3 (AWS S3), Redshift, Python 3, Spark, Amazon Elastic MapReduce (EMR)

高级数据库市场分析师

2017 - 2018
eBay
  • 为旗舰营销活动开发目标脚本,重点是电子邮件, mobile push notification, social, and on-site channels. 这些活动的目标用户通常超过5000万,有时收益超过100美元,000 in iGMB annually.
  • Designed, developed, implemented, 维护用Python编写的多臂强盗算法,同时遵守eBay的营销标准和流程. 据估计,该算法将产生500万美元的收益. annually.
  • 训练了一个发送时间优化算法. 这使得在实施了这一策略的活动中点击率提高了15%.
  • Assessed existing email, social, 以及基于kpi(如iGMB)的手机营销活动, OR, and CTR.
  • 在Tableau中创建仪表板,报告我创建的不同营销算法的性能.
  • 创建在HIVE和Teradata服务器之间移动数据的脚本.
  • 使用世界上最大的Teradata DWH,经常查询具有1000多亿行的表.
  • 与跨多个时区的利益相关者沟通.
技术:SQL, TensorFlow, Scikit-learn, Tableau, PySpark, Apache Hive, Python, Teradata

Machine Learning SW Developer

2016 - 2017
Valeo
  • 开发并训练了一种机器视觉算法,用于识别车辆前方的行人. 此后,该算法已在包括通用2019款雪佛兰在内的多款车型上实施.
  • 训练了相机镜头污物检测的算法. 该算法在支持其他更复杂的自动驾驶功能方面发挥了至关重要的作用.
  • 评估用于算法训练的非结构化注释视频数据的质量.
  • 创建了一个脚本,用于在参与项目的多个团队之间同步结构化和非结构化数据.
  • 参加计算机科学会议,学习科学文献,了解机器学习和计算机科学的最新趋势. 与其他团队成员进行知识交流.
  • 与来自法国和爱尔兰的队友和利益相关者进行沟通和联系.
技术:协议缓冲区,Intel TBB, c++, OpenCV, SQL, MATLAB, Python

Credit Risk Analyst

2014 - 2015
Erste Group
  • 根据巴塞尔协议2计算风险参数CCF, LGD和PD.
  • 由于改进了用于计算风险参数CCF的统计引擎,将Erste Bank子公司的总体准备金要求降低了7%以上, 我介绍过的LGD和PD.
  • 在SAS中设计并训练了一个数学模型,用于预测客户违约时的总体损失. 这有助于Erste改善回收流程并降低成本.
  • 为Erste子公司执行临时压力测试. 结果后来直接提交给了欧洲国家银行.
  • 用自举和蒙特卡罗方法评估风险投资组合的稳定性.
  • 在MS SQL和Excel中为风险参数报告创建了交互式仪表板.
  • 开发数据质量测试系统.
技术:Microsoft Excel, MATLAB, Microsoft SQL Server, SAS

教研助理

2012 - 2014
University of Rochester
  • 主持本科生实验室讲座.
  • 开发实验自动化软件,分析实验数据.
  • 写了几篇科学论文,可以在网上找到.
Technologies: MATLAB

eBay应用程序推送通知发送时间优化项目

-该项目的目的是提高手机推送通知的点击率
-算法的引入使移动推送通知的点击率提高了15%
我决定通过开发一种机器学习算法来实现这一目标,该算法可以预测每个用户的最佳接触时间
-该算法是用Python开发的,并使用scikit-learn进行训练
—获取培训数据需要使用HIVE和PySPARK
-我已经成功地将算法应用到营销生产环境中,并指导营销分析师如何使用

动态内容优化与定制模型

-该项目的目的是通过使用机器学习来提高eBay优惠券活动的点击率
-该算法的开发是成功的,经测量可使点击率和iGMB提升20%
-算法的早期版本是基于多臂强盗. 后来的版本使用了基于上下文nlp的多臂强盗
-该算法是使用Teradata SQL和Python组合开发的
-我还开发了一个交互式Tableau仪表板,以监控算法的功能并测量算法带来的KPI提升

用于自动驾驶车辆的行人检测模型

-该项目的目的是开发一种机器视觉算法,能够通过分析车载摄像头的输入来检测车辆前方的行人
-该算法现在功能齐全,并已嵌入到包括通用2019年雪佛兰在内的许多新车型中
-我们决定使用的机器学习算法是ada-boost级联分类器结合深度神经网络
-我们用c++从头开始编写培训应用程序. 为了提高效率,培训必须是多线程的.
-测试和验证是用Python完成的
-使用大型带注释的视频数据数据库进行算法训练

给定违约的损失预测模型

-准确预测客户违约后的最终损失总额是降低不同贷款产品相关风险的关键
-我开发了一个基于贷款价值比和抵押品价值的模型
-开发使用SAS和MS SQL的组合
-模型的开发需要大量的数据清理和数据质量测试

产品推荐算法

-参与开发基于协同过滤模型的推荐引擎.
-该引擎甚至能够推荐特定客户过去不一定购买的产品
-该解决方案在PySPARK中实现,并基于SPARK ML

ETL推荐算法

-在PySPARK中开发ETL,用于将数据从Redshift传输到S3数据湖
-开发客户级数据聚合和历史记录代码
-评估数据质量,调查和纠正数据质量问题

Languages

SQL, Python 3, Python 2, c++ 14, Python, c++, SAS, Snowflake

Frameworks

Spark, Hadoop

Libraries/APIs

PySpark, Scikit-learn, TensorFlow, OpenCV, Intel TBB, Amazon EC2 API, Python API

Tools

Amazon Elastic MapReduce (EMR), Apache Airflow, Git, Spark SQL, AWS Glue, Bitbucket, Tableau, MATLAB, Microsoft Excel, Jenkins, AWS CLI, Amazon EKS, Amazon Simple Queue Service (SQS), Terraform, Amazon弹性容器服务(Amazon ECS), GitHub

Paradigms

单元测试、敏捷、持续集成(CI)、ETL

Storage

Amazon S3, Teradata, Redshift, Microsoft SQL Server, Apache Hive, PostgreSQL

Industry Expertise

Marketing

Other

Data Analytics, Data Engineering, Recommendation Systems, Machine Learning, Data Quality Analysis, Deep Learning, Protocol Buffers, ETL Tools, Physics

Platforms

iOS, Windows, Linux, Amazon EC2, Spark Core, Docker, Kubernetes, Amazon Web Services (AWS), Visual Studio Code (VS Code)

2012 - 2014

物理学理学硕士学位

罗切斯特大学-纽约,美国

2008 - 2012

Bachelor's Degree in Physics

爱尔兰国立大学,戈尔韦-戈尔韦,爱尔兰

JANUARY 2023 - JANUARY 2026

AWS Certified Developer

AWS

JANUARY 2023 - JANUARY 2026

AWS认证云从业者

AWS

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

Top talent is in high demand.

Start hiring