Z wykształcenia jestem inżynierem mechanikiem. Karierę rozpocząłem od pracy w branży stalowej. Wędrowałem w ciężkich gumowych butach wzmocnionych stalą i plastikowym hełmie wokół wielkich pieców i walcowni. To były dość kiepskie środki bezpieczeństwa jak na tamtejsze warunki pracy. Wiedziałem, że nic mnie nie uratuje.. No, może pomogłyby buty do biegania. Gdy uświadomiłem sobie na podstawie mojego ciągłego strachu, że ta praca nie była dla mnie, postanowiłem przenieść się do przestrzeni Analytics i Data Science. Było to ok. 2011 roku. Obecnie w 2020 r., gdy dziedzina Data Science zmienia się bardzo szybko, nie brakuje zasobów do nauki danych. Ale to gdzie zacząć się uczyć – i czego się uczyć – często stanowi problem dla początkującego programisty. W Internecie jest wiele świetnych zasobów, ale niestety, że jest też wiele złych.
W swojej książce The Paradox of Choice – Why More Is Less Schwartz twierdzi, że wyeliminowanie wielości wyborów konsumenckich może znacznie zmniejszyć niepokój kupujących. To samo dotyczy również kursów Data Science. W tym poście przedstawiam zalecenia dla zagubionych dusz z dużą ilością opcji, od których można rozpocząć podróż do nauki danych.
Uwaga! Niżej wymienione kursy odbywają się w języku angielskim.
1.Specjalizacja w języku Python 3
Po pierwsze, potrzebujesz języka programowania. Ta specjalizacja z „University of Michigan” polega na nauce używania Pythona 3 i samodzielnym tworzeniu kodu. Dowiesz się o podstawach programowania i uzyskasz dostęp do niektórych materiałów specyficznych, takich jak parametry słów kluczowych, wyliczenia list, wyrażenia lambda i dziedziczenie klas.
2.Data Science + Pythonem
Zanim w pełni zrozumiemy Machine Learning, musimy poznać jego „smak”. Ten kurs w dziedzinie nauki o danych stosowanych w Pythonie stanowi wprowadzenie do wielu nowoczesnych metod uczenia maszynowego, o których powinieneś wiedzieć. Nie będzie to dokładne szlifowanie, ale otrzymasz podstawowe narzędzia do budowy modeli.
3.Teoria i podstawy Machine Learning
Po ukończeniu powyższych kursów uzyskasz status, który nazwałbym „początkującym”. Gratulacje! Jednak pewne nie do końca rozumiesz jeszcze całej matematykę i zawiłości, które stoją za wszystkimi modelami. Z pomocą przychodzi kurs Game Changer Machine Learning. Zawiera tajniki matematyki stojącej za wieloma algorytmami uczenia maszynowego. Ten kurs zawiera trochę wszystkiego – regresję, klasyfikację, wykrywanie anomalii, systemy rekomendacji, sieci neuronowe oraz wiele świetnych porad.
4.Naucz się wnioskowania statystycznego
Mine Çetinkaya-Rundel uczy tego kursu na temat wnioskowania statystycznego. I żaden inny kurs nie będzie bardziej klarowny, niż ten. Mine jest świetnym instruktorem i prosto wyjaśnia podstawy wnioskowania statystycznego – jest to kurs obowiązkowy. Dowiesz się o testowaniu hipotez, przedziałach ufności i metodach wnioskowania statystycznego dla danych liczbowych i kategorycznych.
5.Naucz się podstaw SQL w Data Science
Choć czujemy się już o wiele lepiej dzięki tworzeniu modeli i przedstawianiu różnych hipotez, nie da się przecenić roli przetwarzania danych. SQL stał się de facto standardem pracy z Big Data Tools, takimi jak Apache Spark. Ta specjalizacja SQL od UC Davis nauczy Cię o SQL, a także o tym, jak używać SQL do przetwarzania rozproszonego.
6. Zaawansowane uczenie maszynowe
Być może się z tym nie zgodzisz, jednak do tej pory wszystko czego się uczyliśmy było dziecinnie proste – proste struktury, minimalna matematyka.. Jednak doprowadziło nas do miejsca, z którego możemy pójść dalej. Ta specjalizacja zaawansowanego uczenia maszynowego przez najlepszych praktyków Kaggle i naukowców z CERN przyjmuje inne podejście do uczenia się, przechodząc przez wiele trudnych koncepcji w zrozumiały sposób.
7. Deep Learning
Andrew NG powrócił z nową specjalizacją Deep Learning. Osiągnął mistrzostwo w wyjaśnianiu trudnych pojęć w łatwy do zrozumienia sposób. Nomenklatura, którą stosuje, różni się od wszystkich innych samouczków i kursów w sieci i mam nadzieję, że się przyda, ponieważ jest bardzo pomocny w zrozumieniu wszystkich podstawowych pojęć.
8. Pytorch
Zwykle nigdy nie namawiam na nauką narzędzia, ale tutaj zrobię wyjątek. A to dlatego, że dzięki Pytorch zrozumiesz kod w wielu najnowszych artykułach naukowych. Pytorch stał się domyślnym językiem programowania dla badaczy zajmujących się Deep Learning.
9. Zapoznanie się z AWS w ramach uczenia maszynowego
Przy budowie doskonałego systemu uczenia maszynowego należy wziąć pod uwagę wiele rzeczy. Ale często zdarza się, że my, badacze danych, martwimy się tylko o niektóre części projektu. Ale czy kiedykolwiek zastanawiamy się, jak wdrożyć w całości nasze modele? Widziałem wiele projektów Machine Learning i wiele z nich jest skazanych na niepowodzenie, ponieważ od początku nie mają ustalonego planu produkcji. Posiadanie dobrej platformy i zrozumienie, w jaki sposób platforma ta wdraża aplikacje uczenia maszynowego, spowoduje zmianę widzenia tego aspektu. Ten kurs na temat AWS dotyczący wdrażania aplikacji Machine Learning to zapewni.
10. Struktury danych i algorytmy
Tak, potrzebujesz ich. Algorytmy i struktury danych są integralną częścią nauki o danych. Chociaż większość z nas nie skupia się na algorytmach podczas nauki, są one jednak niezbędne. Wiele firm pyta o struktury danych i algorytmy w ramach procesu rekrutacji dotyczącego zatrudniania specjalistów zajmujących się danymi. Będą wymagały tego samego zapału do przełamania, jak wywiady z Data Science, a zatem warto poświęcić trochę czasu na badanie algorytmów oraz struktury danych i pytań dotyczących algorytmów. Jednym z najlepszych zasobów, które znalazłem do nauki algorytmów, jest Kurs Algorytmów na Coursera autorstwa UCSanDiego.
Źródło: https://towardsdatascience.com/top-10-resources-to-become-a-data-scientist-in-2020-99a315194701
Rahul jest specjalistą Data Scienist. Pracuje w WalmartLabs. Uwielbia skupianie się na skomplikowanych problemach związanych z obróbką danych i wciąż szuka nowych pomysłów na ich rozwiązywanie.