Prezentacja danych o nieruchomościach

W aspekcie nieruchomości, prezentacja danych o nieruchomościach jest trzecim etapem statystyki opisowej, która ma na celu pomóc w wyciągnięciu wniosków z zebranych danych liczbowych. Opracowany i uporządkowany materiał, można zaprezentować w postaci:

tabelarycznej – dane zestawione w szeregi i tablice,
graficznej – dane przedstawione w postaci wykresów, np. histogramu, wykresu punktowego, słupkowego itp.

Zacznijmy od najprostszego, czyli szeregów statystycznych.

Szereg statystyczny

Szereg statystyczny to zbiór wyników obserwacji sklasyfikowanych według pewnej cechy. Wyróżniamy:

A. Szereg szczegółowy – uporządkowany według określonego kryterium ale nie pogrupowany materiał statystyczny.

B. Szereg rozdzielczy – to szereg, w którym zbiorowość statystyczna została podzielona na części według wariantów cechy. W zależności od cechy wyróżnia się:

szereg strukturalny – powstaje w wyniku grupowania cechy jakościowej,
szereg punktowy – powstaje w wyniku grupowania cechy ilościowej skokowej, (szereg rozdzielczy jednostopniowy), np. liczba mieszkań posiadających jeden pokój, dwa pokoje, trzy pokoje itp. Nie będziemy przecież tworzyć w tym przypadku szeregu o liczbie pokoi od 0,5 do 2,5… to jest bez sensu. Pokój albo jest, albo go nie ma. Podobnie sprawa ma się z balkonami, windami, przyłączami itp.
szereg przedziałowy – powstaje w wyniku grupowania cechy ciągłej, której warianty zostały sklasyfikowane w formie przedziałów, np. ceny jednostkowe w przedziale od … do …, powierzchnia użytkowa w przedziale od … do …

A. Szereg szczegółowy

Jako przykład, posłużymy się cenami za 1m² lokali mieszkalnych w jednej z gdańskich dzielnic (dane zostały uporządkowane w kolejności od najniższej do najwyższej):

4 180,00, 4 231,63, 4 582,03, 4 882,11, 4 921,83, 5 370,79, 5 417,28, 5 559,82, 5 574,40, 5 584,24, 5 865,52, 5 975,10, 6 032,43, 6 217,28, 6 257,45, 6 270,53, 6 273,87, 6 362,51, 6 563,40, 6 731,76, 6 804,84, 6 864,99, 6 928,71, 6 971,90, 7 204,80, 7 297,76, 7 430,57, 7 574,13, 8 026,76, 8 134,14

Przyznaj, że taka forma prezentacji danych jest mało atrakcyjna. Dzięki uporządkowaniu w kolejności rosnącej możemy co prawda odnaleźć cenę minimalną i maksymalną, można wyznaczyć medianę i inne kwartyle, ale na tym koniec. Dodatkowych informacji o naszej zbiorowości dostarczy nam szereg rozdzielczy.

B. Szereg rozdzielczy

Szereg rozdzielczy to materiał statystyczny uporządkowany i pogrupowany w taki sposób, że poszczególnym wariantom cechy przyporządkowane są odpowiadające im liczebności.

Na czym to polega?

Na utworzeniu kilku przedziałów (o tym później) i zliczeniu, ile transakcji wpada do każdego z przedziałów. Poniżej przedstawiono dane z wyżej zamieszczonego szeregu szczegółowego, przy czym tym razem zostały one pogrupowane w szereg rozdzielczy przedziałowy.

Patrząc na tak przygotowaną tablicę od razu widać, że najwięcej transakcji, bo aż 10, miało miejsce w przedziale 6155-6945 zł/m² powierzchni użytkowej. Również sporo, bo 8 transakcji dokonano w przedziale 5365-6155 zł/m² powierzchni użytkowej. Natomiast wśród najniższych i najwyższych cen odnotowano po dwie transakcje.

Jak z szeregu szczegółowego uzyskać widoczny w tablicy 1 szereg rozdzielczy? Za chwilę się dowiesz 😊

Prezentacja danych o nieruchomościach – tworzenie szeregu rozdzielczego przedziałowego

Jeżeli chcemy utworzyć szereg rozdzielczy przedziałowy, najpierw musimy określić:

Liczbę przedziałów klasowych (k).
Rozpiętość przedziałów klasowych (h).
Dolną granicę pierwszego przedziału klasowego (x₀).
Sposób określania granic przedziałów klasowych.

Na początek zła wiadomość. Dobór liczby przedziałów, rozpiętość i ustalenie dolnej granicy w statystyce nie został precyzyjnie określony – panuje w tym zakresie pewna dowolność. Trzeba więc zrobić tak, żeby było dobrze 😉 I tu z pomocą przychodzi kilka praktycznych wskazówek, które dobrze jest uwzględnić, aby szereg rozdzielczy dawał w miarę czytelny i prawidłowy obraz:

przedziały nie mogą na siebie zachodzić,
liczba przedziałów powinna być uzależniona od obszaru zmienności cechy (różnica między min a max), tj. im większy obszar zmienności cechy i większa liczebność, tym większa powinna być liczba przedziałów,
należy dążyć do wyeliminowania przedziałów o zerowej liczebności,
rozkład powinien być jednomodalny, co oznacza, że liczebności w poszczególnych klasach stopniowo rosną aż do osiągnięcia maksimum, a następnie maleją,
należy redukować klasy o niewielkiej liczebności, a także niewyraźnie zaznaczonej liczebności,
dobrze by było, o ile jest to możliwe, aby rozpiętości przedziałów były jednakowe.

Bierzmy się zatem za tworzenie szeregu rozdzielczego.

1. Ustalenie liczby przedziałów

Do ustalenia liczby przedziałów k w zależności od liczebności próby n można wykorzystać opracowane wzory. Jest ich kilka, ale żaden z nich nie jest idealny. Oto wzory najczęściej wykorzystywane w praktyce:

Można także skorzystać z gotowych tablic, które podają liczbę przedziałów, jaką należy uwzględnić w grupowaniu przy danej liczbie obserwacji. Jedną z takich tablic opracował T. Kelley.

Przykład

Opierając się na danych z punktu o szeregu szczegółowym, wyznaczmy liczbę przedziałów wg trzech wzorów i tablicy T. Kelleya, wiedząc, że liczebność wynosi 30. Obliczenia i wyniki prezentują się następująco:

Z obliczeń wynika, że liczba klas nie może przekroczyć 7 (wzór 2), a w dwóch przypadkach wyszło nam 6. Do dalszych obliczeń proponuję przyjąć 6 – zobaczymy co nam z tego wyjdzie.

2. Ustalenie rozpiętości przedziałów

Rozpiętość h przedziału obliczamy wg wzoru:

Przykład c.d.

Podstawiając dane do wzoru 4 otrzymujemy rozpiętość przedziału po zaokrągleniu 790 zł/m².

I teraz bardzo ważna uwaga – jeżeli w kolejnym kroku „pójdziemy na łatwiznę” i jako początek dolnej granicy pierwszego przedziału przyjmiemy cenę minimalną, to rozpiętość h przedziału powinniśmy obliczyć następująco:

3. Obliczenie dolnej granicy pierwszego przedziału klasowego

Ustaliliśmy rozpiętość przedziału wg wzoru 4, więc obliczmy teraz dolną granicę pierwszego przedziału klasowego. Poniższy wzór powoduje wyjście poza odnotowaną rozpiętość (Cmin, Cmax).

Dlaczego to robimy?

Weź pod uwagę, że w chwili gdy liczymy przedziały, na rynku są realizowane nowe transakcje sprzedaży, których wyniki póki co nie są nam znane. Po drugie, nie bazujemy na cenach uzyskanych za wszystkie nieruchomości, tylko na jakiejś próbie nieruchomości sprzedanych, toteż w celu budowy szeregu rozdzielczego, rozsądne jest przyjęcie założenia o możliwości wystąpienia wartości mniejszych od Cmin i większych od Cmax. Potraktowanie ceny minimalnej jako początku przedziału nie jest błędem i jest powszechnie stosowane – tak np. jest ustalana cena minimalna w Excelu w automatycznym wykresie histogramu. Wybór należy do Ciebie. Pamiętaj, że to tylko wykres, który ma służyć zobrazowaniu danych, więc nie ma się co przejmować drobiazgami.

Przykład c.d.

4. Sposób określenia granic przedziałów

Mamy już liczbę przedziałów, ich rozpiętość i dolną granicę. Teraz trzeba wybrać sposób określenia granic przedziałów. O co tutaj chodzi? O to, by przedziały nie zachodziły na siebie i aby nikt nie miał wątpliwości do którego przedziału zalicza się dana cena. Postaram się to wytłumaczyć na przykładzie:

Przedziały cen za 1 m²

3 785 – 4 575
4 575 – 5 365
…

Do którego przedziału zaliczysz cenę 4 575 zł/m², do pierwszego czy drugiego? Hmmm… no właśnie.

Przyjęło się traktować tak zapisane przedziały jako lewostronnie domknięte, co oznacza, że nieruchomość o cenie jednostkowej 4 575 zł/m² znajdzie się w drugim przedziale.

Inny sposób prezentacji przedziałów:

3 785,00 – 4 574,99
4 575,00 – 5 364,99
…

albo

3 785,01 – 4 575,00
4 575,01 – 5 365,00
…

Można także użyć symboli nawiasów, gdzie „(” oznacza przedział otwarty a „<” oznacza przedział domknięty, np.:

(3 785 – 4 575>
(4 575 – 5 365>

w takim zastosowaniu nawiasów, transakcja o cenie jednostkowej 4 575 zł/m² znajdzie się w pierwszym przedziale.

Przykład c.d.

Określmy przedziały z wykorzystaniem nawiasów i policzmy ile transakcji wpada do każdego przedziału. Dla przypomnienia:

liczba przedziałów = 6
rozpiętość przedziałów = 790 zł/m²początek dolnego przedziału = 3 785 zł/m²

Zliczmy teraz nasze ceny transakcyjne z szeregu szczegółowego do poszczególnych przedziałów:

w pierwszym przedziale są 2 transakcje: 4 180,00, 4 231,63,
w drugim przedziale są 3 transakcje: 4 582,03, 4 882,11, 4 921,83,
w trzecim przedziale jest 8 transakcji: 5 370,79, 5 417,28, 5 559,82, 5 574,40, 5 584,24, 5 865,52, 5 975,10, 6 032,43,
w czwartym przedziale jest 10 transakcji: 6 217,28, 6 257,45, 6 270,53, 6 273,87, 6 362,51, 6 563,40, 6 731,76, 6 804,84, 6 864,99, 6 928,71,
w piątym przedziale jest 5 transakcji: 6 971,90, 7 204,80, 7 297,76, 7 430,57, 7 574,13,
w szóstym przedziale są 2 transakcje: 8 026,76, 8 134,14.

Tak pogrupowane dane umieszczamy w tabeli. W ostatniej kolumnie dodajmy wskaźnik struktury.

Wskaźnik struktury to nic innego jak procentowy udział liczebności danego przedziału w całkowitej liczebności, np. dla pierwszego przedziału wskaźnik struktury = (2/30) x 100 = 6,7%.

Odnosząc się do wskaźników struktury można powiedzieć, że najwięcej transakcji, bo aż 60%, odnotowano w przedziale od 5365 do 6945 zł/m². Skąd te 60%? To suma dwóch największych przedziałów: 26,7% + 33,3%.

Dla osób, które nie lubią czytać tabel, polecam wykresy. Są one co prawda mniej precyzyjne i szczegółowe, ale bardziej sugestywne. Potrafią też wskazać właściwy kierunek do dalszej analizy.

Prezentacja danych o nieruchomościach – histogram

Na bazie szeregu rozdzielczego z tablicy 3. możemy utworzyć wykres zwany histogramem. Prawda, że histogram jest bardziej zjadliwy niż tabelka? Nie wspominając już o przewadze histogramu nad szeregiem szczegółowym.

Przeczytaj także, jak utworzyć histogram w Excelu. <temat w opracowaniu>

Prezentacja danych o nieruchomościach – wykres kołowy

Uzyskane dane z szeregu rozdzielczego można przedstawić również w formie wykresu kołowego.

Prezentacja danych o nieruchomościach – wykres punktowy

Wykres punktowy ma postać punktów, z których każdy prezentuje jedną obserwację (daną). Bardzo dobrze się sprawdza w przedstawieniu trendu czasowego, gdzie na osi poziomej umieszcza się daty transakcji a na osi pionowej ceny jednostkowe.

Można go używać także do uwidocznienia innych zależności lub ich braku.

Zamieszczony poniżej wykres punktowy pokazuje wpływ powierzchni użytkowej lokalu mieszkalnego na cenę jednostkową za 1m². Przerywana linia to linia trendu. Najdroższe, w przeliczeniu na 1m² są mieszkania małe. Im większa powierzchnia, tym cena jednostkowa jest niższa. Oczywiście nie zawsze musi tak być. Wszystko zależy od rynku nieruchomości. Taki wykres jednak, potrafi bardzo ładnie wskazać panującą tendencję.

Prezentacja danych o nieruchomościach – wykres punktowy II

Wykres punktowy można także wykorzystać do pokazania rozkładu cen jednostkowych w obrębie danej cechy rynkowej. Poniżej wykres przygotowany dla cechy „standard wykończenia”.

Z tak przygotowanego wykresu możemy wywnioskować jakie przedziały cenowe występują dla każdej z cech na analizowanym rynku nieruchomości:

standard wykończenia niski – ceny od 4,18 do 6,36 tys. zł/m²,
standard wykończenia średni – ceny od 4,88 do 7,57 tys. zł/m²,
standard wykończenia podwyższony – ceny od 5,37 do 8,13 tys. zł/m².

Widać występującą zależność: im lepszy standard wykończenia, tym wyższe ceny jednostkowe.

Przedstawienie tych samych danych w formule tablicowej będzie wyglądać następująco:

Prezentacja danych o nieruchomościach – wykres kombi

Wykres kombi jest przykładem umieszczenia na jednym wykresie dwóch informacji. Mamy więc do czynienia z jedną osią x (poziomą) oraz dwiema pionowymi osiami y, zawierającymi różne wartości, np.

Na osi x zostały umieszczone jakościowe cechy analizowanych nieruchomości (ponownie na przykładzie standardu wykończenia). Jasnoniebieskie słupki prezentują liczebność w danej ocenie cechy i odnoszą się do prawej osi pionowej, czyli mamy 8 transakcji nieruchomościami w standardzie niskim, 16 w standardzie średnim i 6 w standardzie podwyższonym. Granatowe słupki obrazują średnią cenę uzyskaną w danym standardzie i odnoszą się do lewej osi pionowej z ceną średnią za 1m².

Nie powinno więc dziwić, że za nieruchomości:

w standardzie niskim uzyskano średnio 5,31 tys. zł/m²,
w standardzie średnim uzyskano średnio 6,43 tys. zł/m²,
w standardzie podwyższonym uzyskano średnio 6,78 tys. zł/m².

Dane te można zaprezentować także w postaci tablicowej:

Prezentacja danych o nieruchomościach – wykres pudełkowy (skrzynka i wąsy)

Wykres pudełkowy, zwany też „skrzynka i wąsy” jest świetnym narzędziem wspomagającym analizę i interpretację danych. Pozwala ująć na jednym wykresie parametry dotyczące położenia, rozproszenia i kształtu rozkładu badanej zbiorowości. Zazwyczaj jest on prezentowany w wersji poziomej, ale Excel daje do dyspozycji tylko pionową wersję wykresu (jak poniżej). Nie pozostaje nic innego jak się do niej przyzwyczaić.

Dolna granica skrzynki to kwartyl 1 (Q1), górna granica skrzynki to kwartyl 3 (Q3), tak więc szerokość skrzynki odpowiada rozstępowi ćwiartkowemu. Symbol X to średnia arytmetyczna, a pozioma linia wewnątrz skrzynki to mediana, czyli kwartyl 2. Do pełni szczęścia brakuje jeszcze wartości dominanty.

„Wąsy” rozciągaj się od najmniejszej do największej wartości danej zmiennej, chyba że występują wartości odstające (nietypowe). Wartości odstające (nietypowe) pokazane są na wykresie jako kropki poniżej i/lub powyżej wąsów. Są to wartości, które wychodzą (zbliżają się) o 1,5 krotność odstępu międzykwartylowego.

Przykład wykresu pudełkowego z wartościami odstającymi:

Wartościami odstającymi (nietypowymi) są ceny za 1m² w wysokości: 8 603,56 i 8 137,46. Widać na wykresie również dodatnią asymetrię rozkładu (średnia jest powyżej wartości mediany).

Przeczytaj także, jak utworzyć wykres pudełkowy w Excelu. <temat w opracowaniu>

Przedstawione tu przykłady tablic i wykresów są podstawowymi formami prezentacji danych. Wiele zależy od naszej kreatywności, potrzeb a w szczególności od celu badania.

Dla kandydatów na RzM, Statystyka w wycenie

Szereg statystyczny

A. Szereg szczegółowy

B. Szereg rozdzielczy