Mitä teemme
Asuntokaupat.io on hintatransparenssityökalu Helsingin asuntomarkkinoille. Jokaiselle markkinoille tulevalle asunnolle julkaisemme ennustetun käyvän hinnan ja näytämme, miten ennuste on rakennettu — piirre kerrallaan, vertailukohta kerrallaan.
Jos asunto on listattu 17 % ennusteemme alle, kerromme sen. Mittaamme myös omia ennusteitamme viikoittain toteutuneita kauppoja vasten ja julkaisemme virhejakauman, jotta voit arvioida, kuinka paljon painoa yksittäiselle ennusteelle pitää antaa.
Miten ennusteet toimivat
Jokaiselle ilmoitukselle julkaisemme ennustetun käyvän hinnan. Malli on gradienttipuumallin regressori (XGBoost), joka on koulutettu liukuvasta 365 päivän ikkunasta Helsingin asuntoilmoituksia — tyypillisesti noin 23 000 riviä, kun pudotamme bulk-yhdistelmäpäivät koulutusjoukosta. 24 syöttöpiirrettä ovat:
- Koko: asuinpinta-ala, huoneluku
- Sijainti: postinumero, postinumeron mediaani €/m² (laskettu out-of-fold-tavalla vuotojen välttämiseksi)
- Rakennuksen ikä: rakennusvuosi
- Kerros: asunnon kerros, rakennuksen kerrosten kokonaismäärä
- Kunto: Ilmoituksesta jäsennetyt suomenkieliset luokitukset (hyvä, tyydyttävä, huono…) sekä "kunto tiedossa" -indikaattori
- Putkiremontti: luokiteltu: tehty / suunniteltu / kuntotutkimus / ei mitään / tuntematon, vuosi ja luottamustaso (90 % tarkkuus suomenkielisellä testijoukolla)
- Tontin omistus: oma tontti vs. vuokra (vaikutus hintaan noin 2–7 %)
- Vastikkeet: kuukausittainen hoito- ja rahoitusvastike, velkaosuus jos ilmoitettu
- Mukavuudet: hissi, sauna, parveke
- Ilmoituspalvelumerkit: lähde, ilmoituksen tilan indikaattorit
Koulutusaineisto käyttää aikajaksolista jakoa — vanhempi data koulutukseen, uudempi validointiin ja tuoreimmat testiin — jolloin pidätetty arvio kuvaa mallin toimintaa tulevilla, ennen näkemättömillä kohteilla, ei satunnaisotosta samalta jaksolta.
Kuinka tarkka se on
Kaksi lukua merkitsee, mitattuna kahta eri asiaa vasten:
- Pidätetyllä testijoukolla (tuorein viipale pyyntihintoja, joita malli ei nähnyt koulutuksen aikana): MAE 40 000 €, MAPE 12,0 %, R² 0,92.
- Toteutuneilla Helsingin kaupoilla (ennusteidemme ja toteutuneiden kauppahintojen vertailut, painotettuna laajempaan Helsingin markkinaan): MAPE 17,3 %, R² 0,91. 46 % kaupoista päättyy ±10 % päähän mallin ennusteesta; 70 % päättyy ±20 % sisään.
Toteutuneiden kauppojen luku kannattaa ottaa vertailukohdaksi, kun arvioit yksittäisen ennusteen ”oikeellisuutta”. Se sisältää pyyntihinnan ja lopullisen kauppahinnan välisen eron (neuvottelu) sekä ajan, joka kuluu pisteytyksen ja kaupanteon välillä — kumpaakaan ei testijoukko huomioi. Mittaus toistetaan viikoittain.
Tarkkuus vaihtelee postinumeron ja hintaluokan mukaan. Ennusteet ovat tarkimpia eteläisessä keskustassa (00100–00250, MAPE noin 6–10 %); ne hajaantuvat halvemmissa kohteissa (alle 150 000 €), reuna-alueiden postinumeroilla ja erittäin arvokkaissa kohteissa.
Malli koulutetaan uudelleen, kun validaattori havaitsee tarkkuuden ajautumista — tyypillisesti 1–3 kuukauden välein. Jokaisen kandidaatin on läpäistävä seitsemän kriteerin ylennyskoe (R², MAE, MAPE, koulutus/testi-ero, vuotoindikaattorit), ennen kuin se tulee käyttöön, ja edellinen versio säilytetään välitöntä rollbackia varten.
Mitä ennusteet eivät ole
Käytä ennustetta kuin toista mielipidettä: pyyntihinnan järkevyyden tarkistuksena, neuvottelun lähtökohtana ja keinona huomata aidosti markkinahinnastaan poikkeavat kohteet. Käy sitten paikan päällä, juttele isännöitsijän kanssa ja lue dokumentit (yhtiöjärjestys, isännöitsijäntodistus, kuntotutkimukset).
Erityisesti huomioitavaa:
- Halvat kohteet (alle 150 000 €) ovat mallille vaikein segmentti — odota laajempaa virhettä siellä.
- Aivan uudet rakennukset ja erittäin tuoreet täysremontit ovat koulutusjakauman ulkopuolella; malli tuottaa edelleen luvun, mutta vähäisemmällä tuella.
- Lunastuspykälä ja HITAS-sääntely merkitään esiin, mutta emme mallinnu kuinka paljon ne maksavat ostajalle.