前段时间和几个朋友讨论过关于买房的问题,主要讨论的就是该不该买、买不买得起和去哪买得问题。于是就产生了一个想法,分析一下深圳的房价情况。
数据来源:
房天下:http://sz.fang.com/
小区数量:4067个小区
数据更新时间:2017年9月15日
一、买不买得起,这是一个问题
买不买得起,这是一个问题。我们来看看深圳房价的数据分布:
根据深圳二手房的房价分布,有67%在4万以上,还有小部分分布在10万以上,但是看到这个数据分布,还有8%左右在2.5万以下,似乎还是有点希望。
但是再了解下房价的地理分布,现实好像显得有些骨感。
从深圳二手房房价的地图分布来看,房源主要集中在房价比较高的地方,超过5万/平米的房价主要集中在南山区、福田区和罗湖区,以及宝安的宝安中心区和西乡街道、龙华的民治街道以及龙岗的坂田街道。这样的数据展示不够直观,因此我们来看看,深圳各区县的的房价情况。
从深圳各区房价来看,南山区和福田区的均价超过5.5万;宝安区、罗湖区、盐田区和龙华区相差不多,在4.5万左右;其他区主要距离市中心比较远,均价也都在3万/平米以上。
看完深圳让人绝望的房价,再了解下深圳最贵的10个小区,让我们彻底绝望一下。
最贵的10个小区以别墅偏多,均价基本在15万以上,里面有6个在南山区,主要位于华侨城;福田有3个,主要是在香蜜区域;天园居别墅位于罗湖。
二、是什么在让房价骚动
是什么再让让价骚动?影响房价的因素有哪些?我们利用房天下小区房价数据和百度地图获取的POI(Point of Interest,兴趣点)进行分析。
由于房价变化同时受到多个因素影响,为便于分析,主要选择建筑类别、建筑年龄、容积率、绿化率、地铁站、公交站点、学区、生活与服务设施(购物或生活设施)、文化娱乐设施(体育场馆、旅游景点、文化场馆)、医院(门诊部、卫生服务站、各大医院)十个因素对深圳2017年9月房价进行分析。
数据的来源及指标如下:
Hedonic模型是指美味消费者在进行效用极大化追求中,当提高一单位的某个属性消费时,乐意付出的附加费用,考虑到选取的特征向量数值比较小,而房价的相差比较大,我们选择Hedonic模型对房价的影响因素进行分析。
这里我们引入交叉验证,选取75%的训练样本来构建我们的特征价格模型,选取25%用来测试样本的合理性。通过线性回归,获取的训练结果如下:
根据上图,我们可以得到特征价格模型。结合特征价格模型,对比预测值和测试值,以RMSE(均方根误差)为评价测度,RSME=0.36,算是一个比较满意的误差范围。
根据OLS的回归结果,可以得到以下结论:
(1)建筑特征中类型和绿化率对房价影响比较显著,而容积率影响并不显著,其中,绿化率每提高1%,房价会上涨0.16%。
(2)学区房对房价影响比较显著。深圳市重点小学、重点中学主要集中在南山、福田和罗湖等城区,而南山、罗湖、福田三个区占据了大部分的重点学校和学区房。从回归系数来看,一般学区房比非学区房价要高出15%左右。
(3)生活服务设施随数量变化,对房价呈负相关。由于在市场经济条件下,超市、便利店等生活服务设施得到了充分的发展和配置,已不再成为购房者重点考虑因素;医疗设施对房价的影响并不显著,没有通过10%的显著性检验。医院作为覆盖较大的公共设施,并非就近满足人门的需求,也非居民购房时需要重点考虑的因素。
(4)地铁对房价的影响比较显著。深圳的地铁网主要集中在罗湖、南山和福田,在距离市中心比较远的区域,地铁遍及的地方,房价会有明显的影响。根据回归系数,1000m范围内的地铁房比非地铁房价格要高出16%左右。对于公交系统,对房价呈现负向影响,这说明两个特点:a.深圳市公交系统线路比较密集,站点配置比较均衡,已经不再成为购房者的考虑因素;b.小汽车等出行方式在深圳城市交通中占比较大的份额。
总结
在对深圳房价的影响因素的分析中,直接用数字得出结论的方式,让人阅读起来比较生硬,缺少多样化的可视化呈现方式。另外,在影响因素的结论上面,后期会进行进一步的探讨。