Descrierea activității la nivel înalt: Regexurile vor fi utilizate în procesele Spark Structured Streaming care citesc date din Kafka. (Aproximativ 1.000.000 de înregistrări / 1s.). După procesare (îmbogățire, categorizare, filtrare), acestea sunt încărcate în Elasticsearch.
- Crearea și iterația expresiilor regulate eficiente prin identificarea tiparelor și a elementelor cu prioritate ridicată.
- Gestionați fondul de expresii regulate existent, actualizând și modificând după cum este necesar
- Căutați optimizarea proceselor de afaceri cu ajutorul puterii datelor
- Analizați datele și identificați posibilele cazuri de utilizare și de aplicare a analizei datelor în cadrul afacerii
- Veți avea ocazia să lucrați cu o varietate de activități de data mining și analiza datelor
Candidatul ideal
- Diplomă universitară în domeniul tehnologiei informației
- Entuziasmat de Big Data și Data Analytics, sau ai deja o primă experiență de lucru în acest sens
- Experiență cu operațiunile cu date, inclusiv implementarea expresiilor regulate (RegEx) și a variabilelor
- Interesat să înveți Spark, Scala, Hadoop, Ariflow, Kafka, ElasticSearch (sau experiența în acest domeniu ar fi un plus)
- Jucător de echipă, deschis la un mediu internațional și poti călători ocazional în Europa
- Gânditor analitic, aveți o afinitate pentru structură, înțelegi lucrurile rapid și lucrexi sistematic.
- 0 – 2 ani de experiență în dezvoltare
- Vorbești și scrii fluent în limba engleză, cunoștințele de germană sunt benefice
- Creativitate, dedicare și atitudine de tipul “pot face”