Kompleksowa analiza statystyczna danych
Blok | Typ analizy statycznej | Szczegóły | Cena netto (PLN)* |
---|---|---|---|
Blok 1 | Przygotowanie danych (przekodowanie danych, kodowanie danych, przypisywanie rang, scalanie plików) | 100 | |
Blok 2 | Statystyka opisowa | Testy różnic (parametryczne, nieparametryczne), korelacje, tabele, wykresy | N/A |
Blok 3 | Analiza wariancji + Blok 2 | Analiza wariancji (jedno- i wieloczynnikowa), testy wielokrotnych porównań (post-hoc), wielowymiarowa analiza wariancji | N/A |
Blok 4 | Analiza regresji + Blok 2 | Jedno-, wielowymiarowa, logistyczna, uogólniony model liniowy, predykcja | N/A |
Blok 5 | Blok 2+ Blok 3 + Blok 4 | N/A | |
Blok 6 | Analiza wielowymiarowa + Blok 2 | Analiza dyskryminacyjna, klasterowa, składowych głównych, czynnikowa, korespondencji, przeżycia | N/A |
Blok 6 ** | Eksploracja danych | Interakcje, drzewa decyzyjne, lasy losowe (random forest) | N/A |
*Cena obejmuje komentarz, który w prosty i jasny sposób wyjaśnia zastosowanie określonego typu analizy, oraz interpretację otrzymanych wyników w kontekście hipotezy badawczej.
** Poszukiwanie zależności/powiązań miedzy zmiennymi gdy nie ma sprecyzowanej hipotezy badawczej
N/A – w celu oszacowania kosztu usługi prosimy skontaktować się z biurem: translmed@translmed.com
Jak przygotować dane:
– Klient musi dokładnie uściślić w jakiej formie występują dane. Czy jest to tablica wielorozdzielcza (ramka danych) w Microsoft Excel (.xls), Microsoft Word (.doc, .docx), czy dane są kodowane (system 0,1,2), czy ramka danych zawiera informacje niezakodowane w formie odpowiedzi (np. tak/nie; bądź bardziej rozbudowane zdania). Jeśli dane mają formę zdań, muszą być właściwie przygotowane, zgodnie ze wskazówkami ze strony Klienta.
– Niezbędna jest „legenda”, wyjaśniająca znaczenie zmiennych wykorzystywanych w analizie.
Wyniki analizy statystycznej a jakość danych:
– Trzeba pamiętać, że analizy, które można wykonać w ogromnej mierze zależą od jakości danych. Niektóre analizy mogą być trudno interpretowalne lub mogą być obarczone dużym błędem np. gdy matryca zawiera dużo wartości brakujących (missing values), lub gdy liczebność populacji jest ograniczona. Z tego względu etap zbierania danych jak i właściwe ich przygotowanie stanowią jeden z najważniejszych etapów analizy danych.
Jako narzędzie do analizy danych, wykorzystujemy m.in. program R (R Project for Statistical Computing). Analizy są wykonywane przez specjalistkę z biostatystyki, która doświadczenie zdobywała w Centro Nacional de Investigaciones Oncológicas (CNIO) w Madrycie, gdzie zajmowała się analizą danych z zakresu genetyki, kliniki i epidemiologii w kontekście zachorowalności na choroby nowotworowe. Ponadto ukończyła kursy: Application of biostatistics in biomedical studies using R; Classification and Modelling course, oraz warsztaty Zastosowania statystyki i data mining w badaniach naukowych.