Jako jedna z najpotężniejszych platform programistycznych o otwartym kodzie źródłowym, Hadoop jest ważnym narzędziem dla każdego, kto ma nadzieję na znalezienie pracy związanej z Big Data. Jeśli chcesz odświeżyć swoje umiejętności Hadoop lub nauczyć się go opanować, najlepszą opcją jest wzięcie udziału w kursie online. Jeśli to nie jest dla Ciebie dostępne, obejrzyj bezpłatne samouczki online i skorzystaj z materiałów referencyjnych, aby rozwiązać określone problemy. Gdy już opanujesz podstawy, poćwicz na małych zestawach danych ze świata rzeczywistego, aby poprawić swoje umiejętności.
Kroki
Metoda 1 z 2: Uczestnictwo w kursach i korzystanie z samouczków
Krok 1. Zarejestruj się w Cloudera na 6-częściowy kurs i interaktywne samouczki
Cloudera daje ci rzeczywiste przykłady do ćwiczenia w środowisku tylko do odczytu, więc nie musisz się martwić o popełnienie ogromnych błędów. Oferują również narzędzia analityczne, które pomogą Ci eksperymentować z zapytaniami o dane, a także bezpłatne demo na żywo o nazwie Cloudera Live, które pomoże Ci poznać środowisko Hadoop.
Chociaż pełny, dogłębny kurs z certyfikacją kosztuje 295 USD, na pewno będzie tego wart, jeśli będziesz wykorzystywać te umiejętności w swojej pracy. Korzystanie z kursu Cloudera pomoże Ci wyłapać błędy i zaoszczędzić czas, co sprawi, że szybko się zwróci
Krok 2. Wypróbuj darmowe kursy online za pośrednictwem Cloudera, jeśli znasz już podstawy
Jeśli masz doświadczenie z Hadoopem i chcesz tylko odświeżyć, być może nie będziesz musiał wydawać pieniędzy na 6-częściowy kurs. Zamiast tego sprawdź bezpłatne kursy online na stronie Cloudera University.
Dostępne są zasoby dla administratorów, programistów i analityków danych, więc bez względu na to, jaką pełnisz rolę, powinieneś być w stanie znaleźć odpowiedni kurs
Krok 3. Weź udział w kursie na Coursera na poziomie uniwersyteckim, jeśli chcesz mieć więcej teorii
Coursera to znane, cenione źródło kursów programowania. Chociaż instrukcje są na ogół bardziej teoretyczne i nie zawierają tylu przykładów biegania, możesz ćwiczyć razem z samouczkiem i korzystać z projektów kursów, aby zdobyć praktyczne doświadczenie.
- Możesz znaleźć ten kurs online na
- Koszt różni się w zależności od kursu, ale Coursera oferuje również opcję pomocy finansowej dla tych, którzy się kwalifikują.
Krok 4. Weź udział w bezpłatnym kursie na Big Data University, aby uzyskać przyjazną kosztowo opcję
Jeśli nie chcesz płacić za kurs online, Big Data University to świetna opcja. Mają dwuczęściowy kurs, który koncentruje się najpierw na podstawach Hadoop, a następnie na programowaniu za pomocą Hadoop, a format online ułatwia poruszanie się we własnym tempie.
- Możesz znaleźć te kursy na
- Oferują wiele samouczków w języku angielskim, a także japońskim, hiszpańskim, portugalskim i rosyjskim.
Krok 5. Wyszukaj instrukcje na YouTube, jeśli potrzebujesz bezpłatnego, konkretnego szkolenia
Istnieją tysiące filmów, które wyjaśniają Hadoop i jak z niego korzystać. Szeroka gama filmów zapewnia elastyczność i jest bezpłatna. Jeśli napotkasz konkretny problem, wyszukaj w YouTube film, który przeprowadzi Cię przez cały proces.
Samouczki dotyczące Hadoop powinny być również dość łatwe do znalezienia, ponieważ „hadoop” jest unikalnym terminem wyszukiwania
Krok 6. Skorzystaj z bezpłatnych samouczków Yahoo, jeśli chcesz ćwiczyć na wirtualnym przykładzie
Te samouczki są podzielone na 7 modułów i od samego początku instruują Cię o instalacji i obsłudze Hadoop. To świetna opcja do odświeżenia określonych umiejętności, jeśli są trochę zardzewiałe.
Krok 7. Zapoznaj się z dokumentem IBM Open Source, aby uzyskać bezpłatne, szczegółowe instrukcje
Jest to niezwykle dokładny dokument PDF o otwartym kodzie źródłowym, stworzony w ramach inicjatywy szkoleniowej IBM. Szczegółowo przeprowadzi Cię przez Hadoop, krok po kroku, i daje jasne instrukcje na piśmie.
Te instrukcje działają również dobrze w połączeniu z demo na żywo, takim jak Cloudera
Metoda 2 z 2: Przejście do rzeczywistej aplikacji
Krok 1. Zapytaj, czy możesz wdrożyć Hadoop w pracy, aby ćwiczyć z prawdziwymi danymi
Złóż wniosek do swojego szefa lub przełożonego albo porozmawiaj z nimi w cztery oczy na temat wprowadzenia tych nowych umiejętności w miejscu pracy. Jest to szczególnie ważne, jeśli Twoja firma zapłaciła za jakiekolwiek szkolenia lub kursy online.
Im szybciej zaczniesz wdrażać nabyte umiejętności, tym szybciej będziesz w stanie je opanować
Krok 2. Szukaj prostych projektów, na których możesz ćwiczyć swoje umiejętności
Wybierz projekty, które są stosunkowo proste i o niskim ryzyku, takie jak liczenie i klasyfikowanie liczby interakcji na agenta klienta, takie jak e-maile i sesje czatu.
- Niektóre inne aplikacje do obsługi prawdziwych danych obejmują skanowanie dzienników internetowych w poszukiwaniu błędów lub monitorowanie kanałów mediów społecznościowych pod kątem sentymentu marki.
- Możesz także ćwiczyć z przykładowymi danymi z witryn takich jak https://www.kaggle.com/datasets lub
Krok 3. Regularnie sprawdzaj swój kod za pomocą małych podzbiorów, aby znaleźć ewentualne błędy
Przed uruchomieniem całego zestawu danych przenieś mniejszy testowy zestaw danych na komputer lokalny i uruchom go w kilku różnych trybach. Na przykład, możesz uruchomić go iteracyjnie w trybie Local Jobrunner Mode, następnie w trybie pseudodystrybuowanym, a następnie w trybie w pełni rozproszonym.
- Pozwoli to rozpoznać wszelkie wady lub błędy, zanim zostaną wzmocnione w pełnym zbiorze danych.
- Tryb Local Jobrunner Mode umożliwia lokalne testowanie i debugowanie kodu mapowania i redukcji kodu, tryb pseudo-dystrybuowany naśladuje środowisko produkcyjne, a tryb w pełni rozproszony pozwala spojrzeć na rzeczywisty klaster produkcyjny.
Krok 4. Skorzystaj z rocznej bezpłatnej wersji próbnej, aby ćwiczyć w środowisku maszyny wirtualnej
Firmy takie jak Amazon i Microsoft oferują płatne subskrypcje za swoje usługi praktyki Hadoop. Maszyna wirtualna Amazona nazywa się Amazon Web Service (AWS), a usługa Microsoftu nazywa się Microsoft Azure. W przypadku obu usług pierwszy rok jest bezpłatny po wprowadzeniu danych karty kredytowej.
Nie zapomnij anulować subskrypcji po 1 roku, aby uniknąć obciążenia
Porady
- Należy pamiętać, że Hadoop jest bardziej wyspecjalizowanym, wąskim językiem programowania. Z pewnością da ci przewagę w świecie big data, ale nie zawsze trzeba zostać programistą.
- Możesz także czytać książki i artykuły o Hadoop, takie jak Hadoop: The Definitive Guide, 3rd Edition autorstwa Toma White'a.