Wpływ uczenia maszynowego na inżynierię oprogramowania jest niezaprzeczalny i nieustannie rośnie. Aby tworzyć znakomite, przydatne i w pełni działające algorytmy programiści potrzebują dobrego zestawu narzędzi, który im w tym pomoże. Na rynku dostępnych jest wiele opcji, dlatego my przedstawiamy Ci TOP 10 najlepszych narzędzi dla specjalisty Machine Learning!

1. TensorFlow

TensorFlow to darmowe narzędzie obliczeniowe typu open source. Jest to bardzo popularna i potężna biblioteka JS, stworzona do obliczeń numerycznych, która pomoże Ci w rozwoju uczenia maszynowego, szczególnie w przypadku projektów na dużą skalę. Interfejsy API TensorFlow pomagają tworzyć i trenować zarówno modele uczenia maszynowego, jak i deep learning. Minusem TensorFlow może być to, że dosyć trudno się go nauczyć.

2. Apache Mahout

Apache Mahout to darmowa platforma typu open source do tworzenia aplikacji do uczenia maszynowego, skoncentrowana przede wszystkim na algebrze liniowej. Mahout dostarcza również biblioteki Java / Scala służące do operacji matematycznych. Jest to narzędzie, które przede wszystkim pomaga matematykom, statystykom i analitykom danych w wykonywaniu algorytmów. Działa dla dużych zbiorów danych i jest stosunkowo proste.

3. Accord.NET

Accord.NET to platforma uczenia maszynowego .NET, która jest połączona z bibliotekami przetwarzania obrazu i dźwięku, napisanymi w C#. Składa się ona z wielu bibliotek o szerokich zastosowaniach – służących do rozpoznawania wzorców, statystycznego przetwarzania danych i algebry liniowej. Oferuje ogromną ilość funkcji, np. wykrywanie twarzy w czasie rzeczywistym.

Czytaj również: Machine Learning (uczenie maszynowe). Od czego zacząć? Wywiad z Martą Kaczmarską, Deep Learning Engineer.

4. Shogun

Shogun to darmowa biblioteka open source służąca do uczenia maszynowego. Napisana w C++, oferuje algorytmy i struktury danych dla problemów związanych z uczeniem maszynowym. Obsługuje wiele języków, takich jak R, Python, Java, Octave, C#, Ruby, Lua itp. Może przetwarzać ogromną ilość danych (nawet 10 milionów próbek!). Podsumowując, Shogun jest łatwy w użyciu i oferuje wiele bardzo przydatnych funkcji.

5. Oryx 2

Oryx 2 został napisany w Javie, przy użyciu Apache Spark, Hadoop, Tomcat, Kafka, Zookeeper i innych. Zapewnia ogólną warstwę architektury lambda i oferuje techniki takie jak filtrowanie grupowe, klasyfikacja, regresja i klastrowanie. Programiści stosują Oryx 2 przede wszystkim do uczenia maszynowego na dużą skalę, w czasie rzeczywistym. Składa się z kilku, współpracujących obok siebie warstw takich jak np. warstwa prędkości, warstwa wsadowa, obsługująca czy też warstwa transportu danych.

6. RapidMiner

RapidMiner oferuje platformę do uczenia maszynowego, deep learning, przygotowywania danych, eksploracji tekstu i analiz predykcyjnych. Można używać go do badań, edukacji i rozwoju aplikacji. Poprzez GUI pomaga w projektowaniu przepływu pracy i przygotowywaniu danych oraz wizualizacji wyników. Można go łatwo rozbudować za pomocą wtyczek, jest też bardzo łatwy w użyciu. Jego minusem może być to, że poza podstawową, darmową wersją, jest dosyć kosztowny.

7. Keras.io

Keras to API dla sieci neuronowych. Może być używany do łatwego I szybkiego prototypowania, obsługuje sieci konwolucyjne. Jest również przyjazny w obsłudze, modułowy, napisany w Pythonie. Aby z niego korzystać, potrzebny jest TensorFlow, Theano lub CNTK.

8. H2O.ai

H2O zapewnia otwartą, rozproszoną, szybką i skalowalną platformę uczenia maszynowego, która obejmuje szeroką gamę algorytmów statystycznych i ML. Jest szybki, dzięki dystrybucji danych w skompresowanym formacie kolumnowym, tak więc skutecznie usprawnia proces rozwoju projektu. H2O jest z pewnością jednym z wiodących narzędzi oprogramowania typu open source, zintegrowanym z platformą sztucznej inteligencji, dla programistów i firm. Może być również używany do analizy zbiorów danych w różnych systemach plików w chmurze i Apache Hadoop.

9. PyTorch

Na liście TOP 10 narzędzi dla specjalisty Machine Learning nie może zabraknąć PyTorch. Jest to biblioteka open source oparta na Torch – pakiecie uczenia maszynowego open source, który został zaprojektowany w Lua. Narzędzie to służy do budowania i trenowania modeli uczenia maszynowego, a zaprojektowane zostało przez Facebook. Przede wszystkim dobrze nadaje się do badań deep learning, pomaga w tworzeniu wykresów obliczeniowych i posiada prosty interfejs.

10. Apache SINGA

Apache SINGA to kolejna biblioteka uczenia maszynowego typu open source, bardzo często stosowana w rozpoznawaniu obrazów i przetwarzaniu języka naturalnego. Obsługuje również szeroką gamę popularnych modeli uczenia głębokiego. Ma 3 główne komponenty: IO, Core i Model. Apache SINGA został opracowany przez grupę DB System z National University of Singapore, w celu wspierania złożonych procesów analitycznych.

Podsumowanie

Które ze wszystkich narzędzi dla specjalisty Machine Learning są najlepsze? Na to pytanie nie ma jednoznacznej odpowiedzi. Wybór odpowiednich narzędzi zależy od wielu czynników: wymagań dotyczących projektu, poziomu wiedzy, ceny narzędzi i wielu innych. Większość z bibliotek jest płatna, jednak za niektóre trzeba zapłacić. Twoje potrzeby mogą być też zupełnie inne w zależności od tego, czy pracujesz indywidualnie, czy w zespole. Narzędzi jednak jest tak wiele, że na pewno znajdziesz coś, co sprosta Twoim wymaganiom!

Jeśli spodobał Ci się nasz narzędziownik, zobacz również inne artykuły z tej serii: