Alpha Epsilon Logo
    Dr. Alexander Engelhardt
 engelhardt@alpha-epsilon.de
 0176 5690 6728

Profil

Alexander Engelhardt

Dr. Alexander Engelhardt

Eine PDF-Version meines Profils können Sie hier herunterladen.

An English version of my profile is available for download here.

Auf einen Blick

Ich bin Data Scientist im Bereich Machine Learning, und verbinde ein tiefes mathematisches Verständnis der relevanten Algorithmen mit der Fähigkeit, komplexe Analysen in klarer und umsetzbarer Form zu kommunizieren.

Schwerpunkte
Data Science
Machine Learning, Deep Learning, maßgeschneiderte Algorithmen
Programmieren
Python, R, SQL, Linux/UNIX shell
Big Data
Spark, Databricks, Amazon AWS, Microsoft Azure
Optimierung
Laufzeitoptimierung von Programmen und Algorithmen, Automatisierung von komplexen Arbeitsabläufen
Kommunikation
Schulungen, anwenderfreundliches "Übersetzen" von Methoden und Ergebnissen, technisches sowie angewandtes Schreiben
Branchenerfahrungen Energie, Pharma, Finanzen, Marktforschung, Start-Ups, Universitäten
Sprachenfließend Deutsch und Englisch
Projekthistorie (Auszug)

Ein Auszug meiner bisherigen Projekte (vollständige Projekthistorie als PDF verfügbar)

10/2023-heute Data Scientist / Data Engineer, Pharma-Unternehmen, München
  • Refaktorierung und Erweiterung einer Software für die Vorhersage von Medikamenten-Absatz in Krankenhäusern
  • Migration der Software von lokalen Servern nach AWS
Verwendete Tools: Python, AWS
11/2022-03/2023 Data Scientist, Shape Risk Management, E.ON SE, Essen
  • Entwicklung browserbasierter interaktiver Risiko-Reports für Shape und Performance einer PFC für Strompreise
Verwendete Tools: Python, streamlit, pandas, Azure DevOps
05/2020-10/2022 Data Engineer, Energy Trading, EnBW AG, Karlsruhe
  • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
  • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
  • Erstellung von Analysen und Reports für Anwender aus dem Handel
Verwendete Tools: Palantir Foundry, AWS (Lambda, Glue, S3, SageMaker), Python, pySpark, SQL, Azure DevOps
08/2018-03/2020 Full Stack Data Scientist, Energy Analytics, E.ON SE, München
  • End-to-End Deployment eines Prognosemodells für Stromgeneration auf Microsoft Azure
  • Entwickelte tagesgenaue Prognosemodelle für Energieverbrauch von Privathaushalten
  • Entwickelte Modelle zur Anomalieerkennung von ungewöhnlichem Stromverbrauch
Verwendete Tools: Python, xgboost, Spark, SQL, Azure Cloud, Docker, Databricks
12/2014-heute Dozent, Essential Data Science Training GmbH, München
Halten und Weiterentwickeln der Kurse "Data Science Methodenkurs", "Praktische Datenanalyse mit R", und "Programmieren mit R"
Link zur Homepage
04/2018-07/2018 Big Data Engineering, aifora GmbH, Düsseldorf
Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R.
Verwendete Tools: AWS, Spark, Hadoop, Python, Hive, Databricks, R
06/2016-07/2016
05/2017-03/2018
Berechnungen von Price Forward Curves für Energiepreise, Bayerngas Energy GmbH
Drei Folgeaufträge:
  • Erstellte ein Programm zum automatischen Pricing von Kundenanfragen
  • Entwarf und programmierte einen Algorithmus zur Generierung von Price Forward Curves für Strompreise, von Stunden- bis Monatsgranularität
  • Programmierte eine Shiny-Applikation zur explorativen Einstellung von Parametern für einen Handelsalgorithmus
  • Optimierte die Laufzeit eines R-Programms zum realtime-Pricing von Handelsdaten von 120 Sekunden pro Iteration auf 15 Sekunden
Verwendete Tools: R, RStudio, Shiny, VBA
01/2017-06/2017 Mitentwicklung an einem Produktempfehlungssystem, BASF, Ludwigshafen
  • Implementierte einen Algorithmus zur Interpretation von Interaktionen in xgboost-Modellen
  • Benchmarking gegen Warenkorbanalyse / Assoziationsregeln
Verwendete Tools: R, xgboost
04/2015-06/2017 Effiziente Parameterschätzung in R, IBE, LMU München
Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten
Verwendete Tools: R, R mit C++, Parallel Processing (BatchJobs-Paket), Cluster Computing (Sun Grid Engine)
Community & Open-Source
mlr Machine Learning in R. (R-Paket)
Contributor des R-Pakets mlr. Diverse Erweiterungen und Bugfixes als Pull-Requests auf GitHub
sng Startup Name Generator
Deep Learning-basiertes Python-Paket zum Generieren von Namensvorschlägen für Unternehmen und Software.
GenoGAM A GAM based framework for analysis of ChIP-Seq data
Miterstellung eines R-Pakets zum Berechnen parallelisierter statistischer Modelle auf DNA.
Blogging Zwei Blogs über Statistik und Machine Learning
Crashkurs Statistik - Statistik für Nicht-Statistiker
All Things Data Science - Der Alpha Epsilon Blog
Vorträge
10/2018 Interpretable Machine Learning, PyConDE 2019, Berlin
10/2019 Adversarial Machine Learning, PyConDE 2019, Berlin
10/2018 Generate Company Names With Neural Networks, PyConDE 2018, Karlsruhe
Veröffentlichungen
Bücher
  • Crashkurs Statistik. 2020. Verfügbar auf Amazon.
In Magazinen Wissenschaftliche Veröffentlichungen
Ausbildung
2013-2017Promotion (Dr. rer. nat) in der Statistik am IBE der Ludwig-Maximilians-Universität München.
Dissertation: Efficient estimation algorithms for large and complex data sets
2011-2013Master-Studium der Statistik an der Ludwig-Maximilians-Universität München
2008-2011Bachelor-Studium der Statistik an der Ludwig-Maximilians-Universität München
2005-2008Ausbildung zum Fachinformatiker, Fachrichtung Anwendungsentwicklung
Sonstiges