Jak ćwiczyć Hadoop online: 11 kroków (ze zdjęciami)

Spisu treści:

Jak ćwiczyć Hadoop online: 11 kroków (ze zdjęciami)
Jak ćwiczyć Hadoop online: 11 kroków (ze zdjęciami)

Wideo: Jak ćwiczyć Hadoop online: 11 kroków (ze zdjęciami)

Wideo: Jak ćwiczyć Hadoop online: 11 kroków (ze zdjęciami)
Wideo: How to Build a Simple Calculator Using HTML, CSS, and JavaScript 2024, Kwiecień
Anonim

Jako jedna z najpotężniejszych platform programistycznych o otwartym kodzie źródłowym, Hadoop jest ważnym narzędziem dla każdego, kto ma nadzieję na znalezienie pracy związanej z Big Data. Jeśli chcesz odświeżyć swoje umiejętności Hadoop lub nauczyć się go opanować, najlepszą opcją jest wzięcie udziału w kursie online. Jeśli to nie jest dla Ciebie dostępne, obejrzyj bezpłatne samouczki online i skorzystaj z materiałów referencyjnych, aby rozwiązać określone problemy. Gdy już opanujesz podstawy, poćwicz na małych zestawach danych ze świata rzeczywistego, aby poprawić swoje umiejętności.

Kroki

Metoda 1 z 2: Uczestnictwo w kursach i korzystanie z samouczków

Ćwicz Hadoop online Krok 1
Ćwicz Hadoop online Krok 1

Krok 1. Zarejestruj się w Cloudera na 6-częściowy kurs i interaktywne samouczki

Cloudera daje ci rzeczywiste przykłady do ćwiczenia w środowisku tylko do odczytu, więc nie musisz się martwić o popełnienie ogromnych błędów. Oferują również narzędzia analityczne, które pomogą Ci eksperymentować z zapytaniami o dane, a także bezpłatne demo na żywo o nazwie Cloudera Live, które pomoże Ci poznać środowisko Hadoop.

Chociaż pełny, dogłębny kurs z certyfikacją kosztuje 295 USD, na pewno będzie tego wart, jeśli będziesz wykorzystywać te umiejętności w swojej pracy. Korzystanie z kursu Cloudera pomoże Ci wyłapać błędy i zaoszczędzić czas, co sprawi, że szybko się zwróci

Ćwicz Hadoop online Krok 2
Ćwicz Hadoop online Krok 2

Krok 2. Wypróbuj darmowe kursy online za pośrednictwem Cloudera, jeśli znasz już podstawy

Jeśli masz doświadczenie z Hadoopem i chcesz tylko odświeżyć, być może nie będziesz musiał wydawać pieniędzy na 6-częściowy kurs. Zamiast tego sprawdź bezpłatne kursy online na stronie Cloudera University.

Dostępne są zasoby dla administratorów, programistów i analityków danych, więc bez względu na to, jaką pełnisz rolę, powinieneś być w stanie znaleźć odpowiedni kurs

Ćwicz Hadoop online Krok 3
Ćwicz Hadoop online Krok 3

Krok 3. Weź udział w kursie na Coursera na poziomie uniwersyteckim, jeśli chcesz mieć więcej teorii

Coursera to znane, cenione źródło kursów programowania. Chociaż instrukcje są na ogół bardziej teoretyczne i nie zawierają tylu przykładów biegania, możesz ćwiczyć razem z samouczkiem i korzystać z projektów kursów, aby zdobyć praktyczne doświadczenie.

  • Możesz znaleźć ten kurs online na
  • Koszt różni się w zależności od kursu, ale Coursera oferuje również opcję pomocy finansowej dla tych, którzy się kwalifikują.
Ćwicz Hadoop online Krok 4
Ćwicz Hadoop online Krok 4

Krok 4. Weź udział w bezpłatnym kursie na Big Data University, aby uzyskać przyjazną kosztowo opcję

Jeśli nie chcesz płacić za kurs online, Big Data University to świetna opcja. Mają dwuczęściowy kurs, który koncentruje się najpierw na podstawach Hadoop, a następnie na programowaniu za pomocą Hadoop, a format online ułatwia poruszanie się we własnym tempie.

  • Możesz znaleźć te kursy na
  • Oferują wiele samouczków w języku angielskim, a także japońskim, hiszpańskim, portugalskim i rosyjskim.
Ćwicz Hadoop Online Krok 5
Ćwicz Hadoop Online Krok 5

Krok 5. Wyszukaj instrukcje na YouTube, jeśli potrzebujesz bezpłatnego, konkretnego szkolenia

Istnieją tysiące filmów, które wyjaśniają Hadoop i jak z niego korzystać. Szeroka gama filmów zapewnia elastyczność i jest bezpłatna. Jeśli napotkasz konkretny problem, wyszukaj w YouTube film, który przeprowadzi Cię przez cały proces.

Samouczki dotyczące Hadoop powinny być również dość łatwe do znalezienia, ponieważ „hadoop” jest unikalnym terminem wyszukiwania

Ćwicz Hadoop online Krok 6
Ćwicz Hadoop online Krok 6

Krok 6. Skorzystaj z bezpłatnych samouczków Yahoo, jeśli chcesz ćwiczyć na wirtualnym przykładzie

Te samouczki są podzielone na 7 modułów i od samego początku instruują Cię o instalacji i obsłudze Hadoop. To świetna opcja do odświeżenia określonych umiejętności, jeśli są trochę zardzewiałe.

Ćwicz Hadoop online Krok 7
Ćwicz Hadoop online Krok 7

Krok 7. Zapoznaj się z dokumentem IBM Open Source, aby uzyskać bezpłatne, szczegółowe instrukcje

Jest to niezwykle dokładny dokument PDF o otwartym kodzie źródłowym, stworzony w ramach inicjatywy szkoleniowej IBM. Szczegółowo przeprowadzi Cię przez Hadoop, krok po kroku, i daje jasne instrukcje na piśmie.

Te instrukcje działają również dobrze w połączeniu z demo na żywo, takim jak Cloudera

Metoda 2 z 2: Przejście do rzeczywistej aplikacji

Ćwicz Hadoop online Krok 8
Ćwicz Hadoop online Krok 8

Krok 1. Zapytaj, czy możesz wdrożyć Hadoop w pracy, aby ćwiczyć z prawdziwymi danymi

Złóż wniosek do swojego szefa lub przełożonego albo porozmawiaj z nimi w cztery oczy na temat wprowadzenia tych nowych umiejętności w miejscu pracy. Jest to szczególnie ważne, jeśli Twoja firma zapłaciła za jakiekolwiek szkolenia lub kursy online.

Im szybciej zaczniesz wdrażać nabyte umiejętności, tym szybciej będziesz w stanie je opanować

Ćwicz Hadoop online Krok 9
Ćwicz Hadoop online Krok 9

Krok 2. Szukaj prostych projektów, na których możesz ćwiczyć swoje umiejętności

Wybierz projekty, które są stosunkowo proste i o niskim ryzyku, takie jak liczenie i klasyfikowanie liczby interakcji na agenta klienta, takie jak e-maile i sesje czatu.

  • Niektóre inne aplikacje do obsługi prawdziwych danych obejmują skanowanie dzienników internetowych w poszukiwaniu błędów lub monitorowanie kanałów mediów społecznościowych pod kątem sentymentu marki.
  • Możesz także ćwiczyć z przykładowymi danymi z witryn takich jak https://www.kaggle.com/datasets lub
Ćwicz Hadoop online Krok 10
Ćwicz Hadoop online Krok 10

Krok 3. Regularnie sprawdzaj swój kod za pomocą małych podzbiorów, aby znaleźć ewentualne błędy

Przed uruchomieniem całego zestawu danych przenieś mniejszy testowy zestaw danych na komputer lokalny i uruchom go w kilku różnych trybach. Na przykład, możesz uruchomić go iteracyjnie w trybie Local Jobrunner Mode, następnie w trybie pseudodystrybuowanym, a następnie w trybie w pełni rozproszonym.

  • Pozwoli to rozpoznać wszelkie wady lub błędy, zanim zostaną wzmocnione w pełnym zbiorze danych.
  • Tryb Local Jobrunner Mode umożliwia lokalne testowanie i debugowanie kodu mapowania i redukcji kodu, tryb pseudo-dystrybuowany naśladuje środowisko produkcyjne, a tryb w pełni rozproszony pozwala spojrzeć na rzeczywisty klaster produkcyjny.
Ćwicz Hadoop online Krok 11
Ćwicz Hadoop online Krok 11

Krok 4. Skorzystaj z rocznej bezpłatnej wersji próbnej, aby ćwiczyć w środowisku maszyny wirtualnej

Firmy takie jak Amazon i Microsoft oferują płatne subskrypcje za swoje usługi praktyki Hadoop. Maszyna wirtualna Amazona nazywa się Amazon Web Service (AWS), a usługa Microsoftu nazywa się Microsoft Azure. W przypadku obu usług pierwszy rok jest bezpłatny po wprowadzeniu danych karty kredytowej.

Nie zapomnij anulować subskrypcji po 1 roku, aby uniknąć obciążenia

Porady

  • Należy pamiętać, że Hadoop jest bardziej wyspecjalizowanym, wąskim językiem programowania. Z pewnością da ci przewagę w świecie big data, ale nie zawsze trzeba zostać programistą.
  • Możesz także czytać książki i artykuły o Hadoop, takie jak Hadoop: The Definitive Guide, 3rd Edition autorstwa Toma White'a.

Zalecana: