Obliczenia statystyczne dla programistów, naukowców, analityków, użytkowników Excela i innych profesjonalistów
Przy użyciu języka R możesz budować skuteczne modele statystyczne i znaleźć odpowiedzi na wiele spośród najtrudniejszych pytań. Tworzony w ramach open source język R tradycyjnie uważany jest za trudny do opanowania dla nie-statystyków, zaś większość dostępnych książek zakłada zbyt dużą już obecną wiedzę na ten temat, aby były prawdziwie pomocne. Rozwiązaniem tego problemu jest ten tytuł: R dla każdego.
Opierając się na swoich rozległych doświadczeniach w nauczaniu nowych użytkowników, Jared P. Lander przygotował doskonały tutorial dla każdego, kto dopiero wkracza w świat programowania i modelowania statystycznego. Przewodnik ten, zaplanowany tak, aby nauka była prosta i intuicyjna, skupia się na tych 20 procentach funkcjonalności R, których potrzebujemy, aby móc zrealizować 80 procent nowoczesnych zadań.
Wykład rozpoczyna się od absolutnych podstaw, oferując liczne ćwiczenia praktyczne i przykładowy kod. Trzeba pobrać i zainstalować R, poznać środowisko, opanować podstawowe sterowanie pro-gramu, importowanie danych, przetwarzanie ich i wizualizację, a także wykonywanie podstawowych testów. Na tym fundamencie można konstruować pełne modele, zarówno liniowe, jak i nieliniowe i używać technik drążenia danych. A na koniec sprawimy, aby nasz kod był reprodukowalny przy użyciu LaTeX, RMarkdown oraz Shiny.
Po ukończeniu lektury nie będziesz po prostu wiedział, jak pisać programy w R – będziesz gotów rozwiązywać problemy statystyczne, na których ci zależy.
Jared P. Lander zajmuje stanowisko Chief Data Scientist w Lander Analytics, zlokalizowanej w Nowym Jorku firmie specjalizującej się w analizach statystycznych i usługach szkoleniowych, jednej z organizatorów New York Open Statistical Programming Meetup – największego na świecie spotkania użytkowników i twórców R – oraz New York R Conference. Jest wykładowcą statystyki na Uniwersytecie Columbia. Posiadając dyplom M.A. z Uniwersytetu Columbia w dziedzinie staty-styki oraz B.S. z matematyki uzyskany w ­Muhlenberg College, ma doświadczenie zarówno w badaniach naukowych, jak i komercyjnych zastosowaniach. Jared często występuje na różnorod-nych konferencjach i spotkaniach na całym świecie. Jego artykuły na temat statystyki można znaleźć na stronie jaredlander.com. Jego prace są cytowane w takich czasopismach, jak Forbes i Wall Street Journal.
informit.com/awdataseries  |  informit.com/aw |  jaredlander.com/r-for-everyone/
Cover design by Chuti Prasertsith
Cover illustration by VikaSuh/ShutterStock
OMAWIANE ZAGADNIENIA
• Podstawy R, RStudio i pakietów R
• Używanie R dla obliczeń: typy zmiennych, wektory, wywoływanie funkcji i więcej
• Korzystanie ze struktur danych, w tym ramek danych, macierzy i list
• Wczytywanie danych z różnych typów źródeł
• Tworzenie atrakcyjnych, intuicyjnych grafik statystycznych
• Pisanie funkcji zdefiniowanych przez użytkownika
• Sterowanie przepływem programu przy użyciu wyrażeń warunkowych i złożonych testów
• Usprawnianie wydajności dzięki manipulacjom grupowym
• Łączenie i przekształcanie wielu zbiorów danych
• Manipulowanie ciągami znakowymi przy użyciu funkcji R i wyrażeń regularnych
• Tworzenie rozkładów prawdopodobieństwa – w tym normalnego, dwumianowego i Poissona
• Budowanie modeli liniowych, uogólnionych liniowych i nieliniowych
• Programowanie podstawowych statystyk: średnich, odchyleń standardowych i testów t
• Trenowanie modeli uczenia maszynowego
• Ocenianie jakości modelu i wybieranie zmiennych
• Ochrona przed nadmiernym dopasowaniem i wybieranie zmiennych przy użyciu metod Elastic Net i Bayesa
• Analizowanie jedno- i wieloczynnikowych serii danych czasowych
• Grupowanie danych poprzez k-średnie i gromady hierarchiczne
• Przygotowywanie raportów, pokazów slajdów i stron Web przy użyciu knitr
• Interaktywne wyświetlanie danych przy użyciu RMarkdown i htmlwidgets
• Implementowanie tablic kontrolnych przy użyciu Shiny
• Budowanie pakietów R za pomocą ­devtools i Rcpp