W świecie rządzonym przez nowe technologie, w dobie wykorzystywania sztucznej inteligencji i uczenia maszynowego wciąż potrzebny jest człowiek. Ktoś, kto potrafi ogarnąć nieskończone ilości danych, przełoży algorytmy i szeregi liczb na sensowne dane i wyciągnie z tego wnioski. Potrzebny jest specjalista, który oprócz znajomości matematyki statystyki i programowania, potrafi się dobrze komunikować i współpracować w zespole. Jak zacząć przygodę z Data Science, jakie kompetencje są przydatne? Jaki język programowania warto znać oraz czy studia przydają się w dalszej drodze zawodowej opowiada Mateusz Kotarski, Solutions Architekt.
Zespół IT-Leaders: Od kiedy zacząłeś się interesować tematyką Data Science? Czy była to „miłość od pierwszego wejrzenia”? 😊
Mateusz Kotarski, Solutions Architekt: Z danymi (jeśli można to tak nazwać) zacząłem pracować podczas ostatnich lat studiów. Były to głównie dane czysto numeryczne dotyczące sygnałów z zakresu częstotliwości audio (do 48 kHz). I chyba można powiedzieć, że była to “miłość od pierwszego wejrzenia” aczkolwiek na początku bez wzajemności. Moja praca magisterska dotyczyła algorytmów przetwarzania sygnałów cyfrowych (strumień danych numerycznych) i od tamtej pory starałem się kierować moją karierą tak aby moja praca zawodowa lub naukowa związana była z tematyką przetwarzania danych. Chciałem tu zaznaczyć, że z perspektywy czasu moją pracę magisterska zorganizowałbym w zupełnie inny sposób… i dlatego uważam że na początku była to miłość bez wzajemności.
Po zrobieniu przysłowiowej magisterki, która mimo wszystko zakończyła się sukcesem, zacząłem studia doktoranckie. Na drugim roku tych studiów podjąłem się pracy w Intelu. Pewnie wielu osobom będzie sobie to trudno wyobrazić ale w tamtych czasach ofert pracy w branży IT nie było wiele a na trójmiejskim rynku działały może dwie duże firmy i dwie korporacje. Przez cały czas próbowałem kierować moją ścieżkę zawodową w kierunku danych i tak po dwóch latach pracy jako tester, zostałem programistą Audio DSP (digital signal processing) a następnie po trzech latach zająłem się “machine learningiem”. Około trzy lata temu opuściłem korporacyjny świat i zacząłem współpracę Londyńską firmą PredictX. Na co dzień pomagam im uporać się ze sporą ilością danych finansowych największych korporacji na świecie.
Zespół IT-Leaders: Ukończyłeś studia na Politechnice Gdańskiej i miałeś możliwość robienia kariery na uczelni, a jednak poszedłeś w stronę biznesu… dlaczego?
Mateusz Kotarski: Zacznę od końca i powiem że moja kariera naukowa zostanie zapewne jeszcze w przyszłości reaktywowana. Co więcej od czasu do czasu mam okazję brać udział w różnych projektach badawczych.
Robienie doktoratu dzieliłem z pracą w biznesie a dokładnie w Intelu. Muszę przyznać że w dużej mierze do podjęcia takiej decyzji skłoniły mnie względy finansowe. W tamtych czasach trudno było o stałe źródło dochodu z pracy naukowo dydaktycznej aczkolwiek mój promotor dbał o sferę materialną i dzięki niemu nie była to praca czysto “pro bono”.
Na uczelni miałem okazję współpracować z profesorem Januszem Smulko, wspomnianym promotorem mojej pracy doktorskiej, który wprowadził mnie w świat nauki. Muszę przyznać że miałem trochę szczęścia gdyż była to rzeczywista współpraca a nie tak mocno utarty na Polskich uczelniach model “przełożony – podwładny”
Natomiast świat biznesu, to dla mnie świat inżynierów którzy próbują “sproduktyzować” (nie przepadam za tym słowem) idee powstające na uczelniach i w placówkach badawczych. Gdy zaczynałem pracę w Intelu pracowało tam ok. 300 inżynierów od których można było czerpać wiedzę garściami. Część z nich sprowadziła nowe biznesy do trójmiasta (przykładem może być centrum kompetencji Nike w Gdańsku) a inni wciąż realizują ambitne projekty w Intelu czego przykładem może być budowa i rozwój centrum badawczo rozwojowego dotyczącego Audio. Z autorami tych projektów miałem szansę osobiście pracować i muszę przyznać że była to współpraca wymagająca i fascynująca.
Z perspektywy czasu zauważam jak dużo praca naukowa pomogła mi w biznesie i jak często te dziedziny się przecinają.
Zespół IT-Leaders: Jakie kompetencje, uzyskane podczas studiów, utorowały Ci drogę do pracy jako Data Scientist?
Mateusz Kotarski: Mam wrażenie, że w dużej mierze pomogły mi moje cechy charakteru tj. ambicja i nieustępliwość. W połączeniu ze studiami inżynierskimi zbudowało to we mnie pewną etykę pracy która nie pozwala mi skończyć zadania dopóki w pełni nie rozumiem problemu.
Praca z danymi a w szczególności z modelami klasyfikacyjnymi lub predykcyjnymi wymaga od inżyniera ambitnego podejścia aby za każdym razem próbował dostarczyć lepsze wyniki.
Zawsze jak pada podobne pytanie przypominam sobie słowa pewnego wykładowcy który mówił “tylko jeden 1% wiedzy którą zdobędziecie w ciągu studiów być może wam się przyda, problem w tym że nie wiadomo który to procent”. To prawda jeśli chodzi o wiedzę sensu stricte i tutaj na pewno przydatna była wiedza matematyczna, przetwarzanie sygnałów oraz statystyka. Należy jednak zauważyć że studia na Politechnice uczą czegoś więcej tj. sposobu i podejścia do rozwiązywania problemów. Jeśli problemem jest wytyczenie drogi z punktu A do B to Politechnika uczy jak wytyczyć tę drogę na wszystkie możliwe sposoby oraz przedstawić wady i zalety każdego z rozwiązań.
Zespół IT-Leaders: Czy kompetencje miękkie też są ważne? Jeśli tak, to na jakie powinni zwrócić uwagę kandydaci do tej specjalizacji?
Mateusz Kotarski: Jest to pytanie na które nie lubię odpowiadać bo wydaje mi się dosyć oczywiste. Trzeba pamiętać że w pracy będziemy zazwyczaj częścią zespołów co najmniej kilku osobowych. Kompetencje miękkie są tutaj tak samo ważne jak w innych profesjach. Nikt nie lubi pójść do zarozumiałego lekarza a opryskliwa ekspedientka nie sprzeda nam produktu. Poza podstawowym zbiorem tzw. kompetencji miękkich dobrze jakby kandydaci zwrócili uwagę na umiejętności opowiadania o danych i wnioskach z nich płynących w sposób przystępny dla ludzi z biznesu. Np. zamiast mówić, że klasyfikator klasyfikuje transakcje lotnicze ze skutecznością 95%, lepiej brzmi, że mój “algorytm potrafił sklasyfikować X transakcji jako lotnicze z czego Y wcześniej było pominięte a Z klasyfikowane jako wydatki na hotel. Pozwoli to znacznie lepiej przypisać wydatki a co za tym idzie postawi naszą firmę w lepszej pozycji negocjacyjnej z liniami lotniczymi.”
Zespół IT-Leaders: Na czym dokładnie polega praca z danymi od przysłowiowej kuchni?
Mateusz Kotarski: Na żmudnej i ciężkiej pracy z danymi! Myślę że 95% czasu to praca, która ma na celu przygotowanie danych. Tzw. “sexy things” to może 5% czasu pracy data scientist’a. Słyszałem że są organizacje w których istnieją zespoły z dedykowanymi inżynierami danych ale osobiście nie miałem szansy pracować w takiej firmie. Co więcej mówi się że na jednego data scientista przypada dziesięciu inżynierów danych – to tylko pokazuje proporcje.
Zespół IT-Leaders: Zawód rośnie w siłę i coraz więcej firm poszukuje analityków. Skąd wynika to coraz większe zapotrzebowanie?
Mateusz Kotarski: Można sprawdzić ile danych aktualnie produkuje nasze społeczeństwo (https://www.forbes.com/sites/bernardmarr/2018/05/21/how-much-data-do-we-create-every-day-the-mind-blowing-stats-everyone-should-read/?sh=1e2b5fc560ba). Mówi się, że samo gromadzenie i posiadanie danych to koszt. Dlatego próbuje się te dane zamienić w rzeczywistą informację którą próbuje się zmonetyzować. Same korporacje również gromadzą coraz więcej danych na temat funkcjonowania i próbują optymalizować swoje procesy biznesowe. I chyba ostatnim aspektem wzrostu zapotrzebowania jest próba automatyzacji wszelakich procesów (np. “chat boty”, analiza zdjęć rentgenowskich itp.).
Zespół IT-Leaders: Jakich języków programowania używasz w codziennej pracy?
Mateusz Kotarski: Kiedyś większość oprogramowania pisałem w języku C++. Aktualnie to język Python co chyba nikogo nie zaskakuje. Są jeszcze inne jak R, Julia ale nie miałem okazji skorzystać.
Zespół IT-Leaders: Jakie 3 rady dałbyś osobom, które chcą wejść w fascynujący świat Data Science?
Mateusz Kotarski: Po pierwsze: pokora tylko w ten sposób można zajść naprawdę daleko. Mam tu na myśli podejście do problemu – nie ma trywialnych problemów.
Po drugie: programowanie, jest ono naprawdę ważne. Waszym celem zazwyczaj nie będzie jednorazowe odpowiedzenia na pytanie ale napisanie oprogramowania które będzie w sposób automatyczny odpowiadać na te same pytania dla różnych zestawów danych.
Po trzecie: pamiętajcie to nie żadna “sztuczna inteligencja” tylko matematyka i statystyka!
Zespół IT-Leaders: Mateuszu, dziękujemy za podzielenie się z nami swoim spojrzeniem. Samych sukcesów! 🙂
📣📣 Trwa emisja akcji Tech Hire S.A., właściciela platformy IT-Leaders. Dołącz i zostań akcjonariuszem. Sprawdź: www.emisja-itleaders.pl
Mateusz Kotarski – Pasjonat przetwarzania danych i wydobywania z nich wiedzy w celach biznesowych oraz naukowych. Aktualnie zajmuje się analizą dużych zbiorów danych finansowych dotyczących podróży służbowych mających miejsce w największych światowych korporacjach.