Ich bin Data Scientist im Bereich Machine Learning, und verbinde ein tiefes mathematisches Verständnis der relevanten Algorithmen mit der Fähigkeit, komplexe Analysen in klarer und umsetzbarer Form zu kommunizieren.
Schwerpunkte |
|
Branchenerfahrungen | Energie, Pharma, Finanzen, Marktforschung, Start-Ups, Universitäten |
Sprachen | fließend Deutsch und Englisch |
Ein Auszug meiner bisherigen Projekte (vollständige Projekthistorie als PDF verfügbar)
10/2023-heute | Data Scientist / Data Engineer, Pharma-Unternehmen, München
|
11/2022-03/2023 | Data Scientist, Shape Risk Management, E.ON SE, Essen
|
05/2020-10/2022 | Data Engineer, Energy Trading, EnBW AG, Karlsruhe
|
08/2018-03/2020 | Full Stack Data Scientist, Energy Analytics, E.ON SE, München
|
12/2014-heute | Dozent, Essential Data Science Training GmbH, München Halten und Weiterentwickeln der Kurse "Data Science Methodenkurs", "Praktische Datenanalyse mit R", und "Programmieren mit R" Link zur Homepage |
04/2018-07/2018 | Big Data Engineering, aifora GmbH, Düsseldorf Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R. Verwendete Tools: AWS, Spark, Hadoop, Python, Hive, Databricks, R |
06/2016-07/2016 05/2017-03/2018 |
Berechnungen von Price Forward Curves für Energiepreise, Bayerngas Energy GmbH Drei Folgeaufträge:
|
01/2017-06/2017 | Mitentwicklung an einem Produktempfehlungssystem, BASF, Ludwigshafen
|
04/2015-06/2017 | Effiziente Parameterschätzung in R, IBE, LMU München Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten Verwendete Tools: R, R mit C++, Parallel Processing (BatchJobs-Paket), Cluster Computing (Sun Grid Engine) |
mlr | Machine Learning in R. (R-Paket) Contributor des R-Pakets mlr. Diverse Erweiterungen und Bugfixes als Pull-Requests auf GitHub |
sng | Startup Name Generator Deep Learning-basiertes Python-Paket zum Generieren von Namensvorschlägen für Unternehmen und Software. |
GenoGAM | A GAM based framework for analysis of ChIP-Seq data Miterstellung eines R-Pakets zum Berechnen parallelisierter statistischer Modelle auf DNA. |
Blogging | Zwei Blogs über Statistik und Machine Learning Crashkurs Statistik - Statistik für Nicht-Statistiker All Things Data Science - Der Alpha Epsilon Blog |
10/2018 | Interpretable Machine Learning, PyConDE 2019, Berlin
|
10/2019 | Adversarial Machine Learning, PyConDE 2019, Berlin
|
10/2018 | Generate Company Names With Neural Networks, PyConDE 2018, Karlsruhe
|
2023 | Microsoft Certified: Azure Developer Associate |
2018 | Amazon Web Services (AWS) - Certified Solutions Architect - Associate |
2018 | Professional Scrum Master I - Scrum.org |
2017 | 2. Platz, IT-Freelancer des Jahres 2017 |
2017 | Cloudera Certified Spark and Hadoop Developer License: 100-019-222 |
2013 | Certificate of Proficiency in English, Grade A, University of Cambridge |
2013-2017 | Promotion (Dr. rer. nat) in der Statistik am IBE der Ludwig-Maximilians-Universität München. Dissertation: Efficient estimation algorithms for large and complex data sets |
2011-2013 | Master-Studium der Statistik an der Ludwig-Maximilians-Universität München |
2008-2011 | Bachelor-Studium der Statistik an der Ludwig-Maximilians-Universität München |
2005-2008 | Ausbildung zum Fachinformatiker, Fachrichtung Anwendungsentwicklung |