Danologia to najszybciej rozwijająca się dziedzina na świecie. Przewiduje się, że do roku 2026 stworzy 11,5 mln nowych miejsc pracy, tak więc osoby poszukujące pracy i posiadające ten zestaw umiejętności mają tu wiele możliwości. Jednym z najbardziej pożądanych obszarów w dziedzinie danologii jest wydobywanie informacji ze stron internetowych. Jeśli jesteś początkującym danologiem, który chce się nauczyć różnych technik eksplorowania stron sieci Web, ta książka jest właśnie dla Ciebie.

Na początku tej książki omawiane są kluczowe koncepcje związane z eksploracją danych w sieci Web i jej taksonomią. Następnie omawiane są podstawy dotyczące procesu ekstrakcji danych ze stron, jego zastosowania i komponenty, a także inne tematy, jak choćby aspekty prawne związane z procesem ekstrakcji, wyodrębnianiem i wstępnym przetwarzaniem danych, ekstrakcją danych z dynamicznych stron internetowych czy zabezpieczeniem CAPTCHA. Przedstawia również koncepcję eksploracji opinii oraz struktury stron internetowych. Ponadto omawia ona eksplorację grafów, wyodrębnianie informacji ze stron internetowych, wyszukiwanie na stronach i hiperłącza, wyszukiwanie algorytmem Hyperlink Induced Topic Search (HITS) oraz algorytmy partycjonowania, które używane są przy eksploracji danych w sieci Web. Na końcu książki prezentowane są różne techniki eksploracji ułatwiające odkrywanie interesujących wzorców użycia z danych na stronach internetowych.

Kluczowe elementy

Pełny przegląd podstawowych i zaawansowanych koncepcji dotyczących eksploracji danych w sieci Web.

Pracuj z łatwymi w użyciu bibliotekami open source języka Python do eksplorowania danych.

Zapoznaj się z różnymi korzystnymi obszarami i zastosowaniami dla eksploracji danych w sieci Web.

CZEGO SIĘ NAUCZYSZ?

Dokonywać ekstrakcji danych z dowolnej witryny internetowej z użyciem języka Python.

Zapoznasz się z koncepcjami dotyczącymi eksploracji opinii i analizy nastrojów.

Użyjesz eksploracji struktury do odkrywania informacji o strukturze danej strony.

Nauczysz się zbierać i analizować dane z mediów społecznościowych z użyciem języka Python.

Użyjesz eksploracji korzystania ze strony do przewidywania zachowań internautów podczas przeglądania stron.

Dla kogo jest ta książka

Ta książka jest przeznaczona dla każdego, kto chce się nauczyć eksplorować dane na stronach sieci Web. Będzie najbardziej pomocna dla początkujących danologów, inżynierów danych i analityków danych, którzy chcą opanować techniki eksplorowania danych na stronach internetowych.

status

Nowość, W sprzedaży