用AI分析房地產可行嗎?
買房看房價,投資更要看房價趨勢
疫情對於房價到底有沒有影響?
實價登錄新制於今年7/1正式上路,希望民眾可獲得更透明、即時、正確的不動產交易資訊,而房價問題以及成因一向是社會大眾關心的重要議題,加上今年新冠肺炎疫情,眾說紛紜,有些人說漲,有些人說跌,而我個人對於這個議題也感到十分好奇,所以決定利用公司的數據分析平台JarviX對實價登錄的大數據進行分析,帶大家來快速觀察台灣房價近年的趨勢走向。
要先取得實價登錄資料
要做數據分析當然要先取得資料。直接到內政部網站的Open Data處下載實價登錄的數據集CSV檔就可以了。北市和新北市一直以來都是比較熱門的房屋買賣地點,所以我這邊是先下載了近六年雙北市(2014年1月1日至2020年 5月22日)的房價資料。
用AI快速處理資料
為了更快速、準確地分析這包數據,將整理過後的CSV檔案匯到JarviX 系統中,便能直接建置資料欄位,並編輯篩選資料欄位:選擇交易標的、街道名稱、建物型態、年月、縣市、房屋年齡等6個欄位。並移除備註、編號、非都市土地使用分區、非都市土地使用編定、區段門牌等7個不需要的欄位。
視覺化龐大的數據來理解房價趨勢
數據整理好之後,就可以開始做分析了。透過圖形將龐大資訊視覺化,能省去大量的文字敘述,一般的作法必須要靠寫Python來做進一步的分析,但是JarviX平台本身就內建了許多的演算法,因此在資料匯入後只需要輸入想問的問題,JarviX就能透過自然語言處理的技術自動化挑選最合適的演算法來分析回答。
先從2014年至2020年以來的雙北市價趨勢下手來分析,可以輸入「新北市與臺北市每坪單價的趨勢」這段句子,JarviX就能匯出雙北市這六年間的房價的趨勢圖(圖4.)。
房價隨疫情的和緩逐漸回溫
其中發現台北市相較於新北市,單價元平方公尺的平均約貴30~35萬左右,且新北市的漲幅幅度較低,房價穩定性較好。接下來我們以疫情爆發前後(約2020年2月左右)做圈選,來看一下房價是否有受到影響(圖5.)。可以看到1, 2月在疫情爆發初期房價開始下滑,隨著四月台灣病例數增長(圖6.),房價也達到低點,但隨著在五月的時候又有回升的趨勢。
不同房型受到疫情的影響也大不相同
整體大趨勢看完,我們可以再從其他維度來觀察疫情期間房屋交易情形。由於我自己住在新北市,因此輸入「2020年新北市的建物型態的比例」,就能觀察到即使在疫情期間,民眾們買房的類型依舊以住宅大樓為主(圖7.)。
從店面交易量看景氣變化
當然也可以更細部地去看不同房型交易量的趨勢。直接輸入「新北市的建物型態的每月趨勢」,就能快速看到交易量折線圖。面臨疫情民眾外出量大幅減少,從2020年的2、3月開始,店面的交易量大幅下滑(圖8.),展店的趨勢降低,也意味著景氣走向低迷。
大坪數房屋相對價格穩定
現在我們已經知道疫情對房屋價格是有影響的,甚至連帶影響了交易量和景氣程度,那是否能藉此機會了解一下具備什麼條件的房屋價格相對穩定呢?從坪數方面觀察,則能觀察到小坪數(10~20坪)的房價相較於大坪數(80~90坪)是相對不穩定的,大坪數的房子在疫情間的波動幅度反而較低(圖9.)但是買不起呀(掩面)…
用AI根因分析 不再看圖說故事
除了跑圖表、報表之外,JarviX也能對資料進行深入分析,與其自己看圖表猜,不如讓AI演算法來協助。因此我對這筆實價登錄的資料進行了根因分析:輸入「什麼和每坪單價有關」的問句,系統就將與房價有所相關的因子呈現在畫面左側的關聯列表上,並按照關聯高低程度排列。
房價受地段影響最大 老房子其實意外保值
從數據中能發現,與房價最有相關的是「街道名稱」這一因子(圖10.),這意味著房價與其所處的地段確實有著密不可分的高度相關性。
而比較特別的是,從房屋年齡這一因子的相關性來看,會觀察到屋齡40年以後房子的每坪價格隨著屋齡越大有上升的趨勢(圖11.),但是其實交易量相對40年以下的房屋來說是低的。代表著新房子雖然普遍來說較受到民眾的歡迎,但其實40年以上的老房子相對保值,而這也跟一般人普遍覺得「40年老屋不賣10年後沒人要」的觀念有所不同。
若未來有機會,或許還能繼續針對屋齡與房價的議題,進行更深入的分析與探討。
Eddie Shen,國立臺北科技大學電子所碩士。現任Synergies產品經理,透過其資料分析領域專長協助企業數位轉型,並將成功經驗推廣到教育產業,致力於智慧校園的發展以及落實數據分析應用,目前已經受到台北商業大學、逢甲大學、中原大學等多間學校青睞及合作。