Adrian Dominiczak,波兰华沙的开发者
Adrian is available for hire
Hire Adrian

Adrian Dominiczak

验证专家  in 工程

数据工程师和开发人员

Location
波兰华沙
至今成员总数
2020年7月21日

Adrian是一名拥有近十年专业经验的高级大数据工程师. 艾德里安的职业生涯是从三星R&他在Santander和Lingaro从事过一系列项目,从银行和制药行业的机器学习和大数据工程到大数据和云架构. Adrian的专业领域主要是Hadoop和Spark.

Portfolio

Roche
Bamboo, GitLab CI / CD, Docker, SQL, Conda, Pandas, Python, YARN, Hadoop, Spark
Lingaro
Spark, Kubernetes, Apache气流, Microsoft Power BI, SQL, Python, Redis...
桑坦德消费技术服务有限公司
Kudu, Apache蜂巢, SQL, Pandas, Python, Scala, Bash, RHEL, Spark, Cloudera...

Experience

Availability

Full-time

首选的环境

IntelliJ IDEA, PyCharm, Linux

最神奇的...

...我所做的事情是通过测量ML模型的准确性来优化Spark应用程序,同时监控客户端机器的健康状态.

工作经验

大数据和机器学习工程师

2019 - 2020
Roche
  • Designed, 实现, 以及用Spark编写的产品化软件,用于监测监测医疗机器健康状态的统计模型的准确性.
  • 在自动医疗文档生成领域进行部署之前,通过重构现有项目来设计和改进项目结构, 以及从医疗文件中检索知识.
  • 设计和开发加工解决方案, 自动生成, 从医学文献中提取知识.
技术:Bamboo, GitLab CI / CD, Docker, SQL, Conda, Pandas, Python, YARN, Hadoop, Spark

大数据架构师|技术负责人

2019 - 2019
Lingaro
  • 代表一家软件公司,准备一份包含建筑设计的报价, scope, 连接多个独立数据平台的项目定价, 与批处理和NRT生成的数据, 在微软Azure中开发了数据集市和仪表板.
  • 在收购项目中提供架构和团队领导支持.
  • 分析客户的业务需求,并将其转化为技术需求.
  • 使用敏捷方法协调项目的开发和交付.
  • 参与改进和重构代码,并指导年轻的开发人员.
  • 参与销售活动.
技术:火花, Kubernetes, Apache气流, Microsoft Power BI, SQL, Python, Redis, 微软Azure

大数据架构师

2018 - 2019
桑坦德消费技术服务有限公司
  • 监控Hadoop集群的生产并提供改进, ETL过程, 资源利用.
  • Coordinated projects by serving as a single point of contact for stakeholders from the business domain and a team of developers; also monitored, planned, 并在项目上线前进行报告.
  • 指导和管理一个由初级开发人员组成的小团队,同时使用敏捷方法领导PySpark报表应用程序的开发.
  • 设置开发环境, test deployments of software from external providers; also created reports, 文件, 和教程.
  • 分析来自外部供应商的解决方案的体系结构、功能和性能.
  • 参加外部软件供应商的会议,包括经理和架构师.
技术:捻角羚, Apache蜂巢, SQL, Pandas, Python, Scala, Bash, RHEL, Spark, Cloudera, YARN, HDFS, Hadoop

大数据和机器学习工程师

2017 - 2018
Roche
  • Served as a machine learning and big data expert while obtaining external software (实现 in AWS) for extracting data from a medical origin document; also prepared for the internal knowledge transfer to a support team.
  • 通过在部署前按需重构现有项目,设计并改进了项目结构.
  • 设计和开发医疗来源文件分析解决方案, processing, 和自动生成.
技术:Elasticsearch, Bamboo, GitLab CI / CD, Docker, SQL, Conda, Pandas, Python, YARN, Hadoop, Spark

大数据工程师

2015 - 2017
mBank S.A.
  • 实现了与S实时交易的算法交易软件(使用ML方法)&标准普尔500指数股票.
  • 设计并实现基于机器学习的信用评分模型.
  • 为托管在Hadoop集群上的业务数据的自定义可视化实现了一个web服务.
技术:JavaScript, H2, Play, SQL, R, Scala, Python, Java, Apache Sqoop, YARN, Hadoop, Spark

软件工程师

2014 - 2015
三星电子波兰,R&D中心,人工智能集团
  • 设计、实现并支持NLP用户话语识别引擎模块.
  • 实现了一个由语言学家内部使用的web服务平台,作为收集工具, cleaning, 以及标记数据集,用于训练NLP(自然语言处理)的机器学习模型。.
  • 实现了封闭领域的知识数据库和作为采购工具的web抓取器.
  • 实现了从Prolog到Java的连接器,以便利用内部Java库中以Prolog格式存储的知识数据库,在NLP领域构建统计模型.
技术:Weka, Prolog, JavaScript, SQL, Python, Java

Programmer

2013 - 2014
波兰科学院
  • 利用机器学习和时间序列分析方法,找到了一种基于散射超声信号准确识别和区分骨骼内部结构的方法.
  • 利用先进的时间序列分析和复杂的网络数学框架,提出了一种基于超声信号识别皮肤癌变化的新方法.
  • 利用时间序列与复杂网络映射的数学框架,提出了一种研究医学原点时间序列的新方法.
技术:Mathematica, MATLAB, Python

算法交易

项目:一个基于机器学习的算法交易应用程序,运行在S&标准普尔500指数股票.

我实现了用于培训的模块,并使用构建的模型进行日常预测,并参与了关于投资组合处理和再平衡的数学方法的讨论. 我还集成了来自各种数据源的数据:互联网、数据提供商等等.

带有仪表板的MS Azure中的数据集市

项目:一个满足客户需求的MS Azure云解决方案.

我的架构, designed, 并支持微软Azure云解决方案的开发,该解决方案将独立的数据平台与不同频率的生成数据同步, 从一天批次到NRT. 我还设计了ETL管道, 数据存储, data mart, 还有一个fast, 高效的仪表板解决方案.

统计模型验证软件

项目:一个基于spark的应用程序,用于计算从所有传感器发送的预测医疗机器健康状态的统计模型的准确性.

我优化并实现了先进的PoC算法,并为生产部署做好了准备.

用户话语识别

项目:为一家领先的电子制造商提供基于java的自然语言处理框架.

我用纯Java设计和实现了这个框架,并打算将其用作内部库. 该框架使用混合引擎进行句子识别, 哪个是由基于机器学习和基于规则的预测器提供的.
2011 - 2014

应用物理学理学硕士(MSc)学位

华沙理工大学物理系-华沙,波兰

2008 - 2011

物理学学士学位

华沙理工大学物理系-华沙,波兰

2020年6月至今

基本的谷歌云基础设施:基础

Coursera

2020年6月至今

谷歌云平台基础:核心基础设施

Coursera

2020年6月至今

基本的谷歌云基础设施:核心服务

Coursera

Languages

Python, Java, SQL, JavaScript, Prolog, Scala, R, Bash

Frameworks

Spark, Hadoop, YARN, Play

Other

Big Data, 数据分析, 工程数据, 大数据架构, 应用数学, 机器学习, Statistics, 计算物理学, Conda, RHEL, 微软Azure

Paradigms

ETL实施 & 设计,ETL,数据科学

Platforms

亚马逊网络服务(AWS),谷歌云平台(GCP), Linux, Docker, Kubernetes

Storage

数据库,H2, Elasticsearch, HDFS, Apache蜂巢, Redis

库/ api

Pandas

Tools

PyCharm, IntelliJ IDEA, MATLAB, Mathematica, Weka, Apache Sqoop, GitLab CI / CD, Bamboo, Cloudera, Kudu, Microsoft Power BI, Apache气流

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

开始招聘