数据智能

大数据之风刮到房地产,信达泰和为各行业决策赋能

信达泰和,用开放的心态构建数据生态

2017年09月14日
指导 | 凯文 撰写 | 关蕾
  • 数据智能
  • 信达泰和
  • 地址校准
  • 房产大数据
  • 房产评估

信达泰和作为房地产大数据服务商,处于产业链中间环节,上游对接数据源,下游服务客户应用。信达泰和在房产评估行业积累多年,转型后,其倾力于多源的数据采集,构建数据生态,打造核心房产大数据平台,服务于政府、金融机构、快递公司、央企等客群。未来,开放房产大数据平台是信达泰和的终极目标。

大数据、云计算等新技术正撬动着一个又一个传统行业,经过数年沉淀,房产大数据正逐步兴起。如今,大数据已渗透到房产产业链的各个环节,从前期的精准选址、产品设计,到中后期的精准营销、评估贷款、物业管理等,大数据为其提供了更精准的决策依据。

信达泰和作为独立的第三方房产大数据服务商,为产业链各类主体提供房地产数据、房产评估、资产管理、房产指数等服务,为各行业提供房产相关决策信息。

近年来,基于数据的房产评估模型悄然兴起,对传统估价师的冲击日益加剧。一般来说,传统估价师需要3-7个工作日出具评估报告,对人力依赖较重,效率和可复制性都较低,无法满足实时、批量、标准化的房产评估需求。

从国内市场来看,估价师职位锐减,2014年,一些估价师职业被取消职业资格许可和认定,如注册资产评估师、土地估价师等。

信达泰和的诞生,源自创始人翟猛曾创立的一家房产评估公司内部孵化项目,基于对上述行业趋势判断,翟猛决定内部变革。作为一家带有房产估价基因的公司,信达泰和将估价师的知识积累转化成估值算法模型,一边完善估价模型,一边收集、校验各种渠道的房产大数据。

原本是想通过大数据技术,为房地产评估师工作带来便捷,提质增效,做一次顺应市场的业务转型,却意外收获新的业务增长点。5年时间,信达泰和的房产大数据平台已完成40个大城市的房产信息积累,包括详尽的地址信息、金融特征信息、估价等多维度数据。

在其大数据平台上,除了房产评估业务,二手房指数报告、房产信息查询、地址校正服务、资产管理等一系列增值产品已陆续落地,服务于政府、金融机构、快递公司、央企等客群。翟猛表示,房产大数据平台需要用开放的心态构建数据生态,向社会开放是最终目标。

二手房交易活跃,估价需求驱动行业增长

相比新房市场,二手房对房产估价、抵押贷款、地址校正、资产管理等数据服务的需求更加旺盛,信达泰和的大数据平台、产品及服务也以沉淀二手房数据为核心,逐步发展。

近年来,我国二手房交易市场活跃,以选取的11个样本城市为例,二手房交易面积从2012年的近5000万平方米,增长到2016年的1亿多万平方米,年复合增速达22.3%。此外,随着城市新建商品房土地供应的逐步减少,在未来一段时间内,二手房成交占总房地产总成交面积的比例将持续增高。

在二手房交易过程中,获客、买卖、贷款、纳税、抵押等环节都需要对房产进行价格评估,二手房交易的快速增长将刺激房产大数据行业发展。

此外,近年来中国房地产市场受政策调控、供需比例等因素影响,房产价格波动较大,分别在2009、2012及2015年出现三次大幅度房价下跌。由此分析,银行风控、押品价值复估的需求将随之增加,批量、实时、标准化的押品复估需求将推动房产大数据进一步发展。

日益增长的估价需求,催生出越来越多的房产数据服务公司,大致分为以下三类:

一,转型中的房产经纪公司。链家在2014年成立数据中心,收集30余个城市的房产数据,推出“楼盘字典”,旨在用数据驱动业务。从数据的角度,经纪公司有房屋的真实交易价格,数据价值高,但由于房产经纪公司身份特殊,在与上下游厂商做数据打通稍显困难,目前以自建生态为主。

二,互联网房产公司。以搜房为代表,用大数据辅助其完成线上的房产交易。但互联网房产公司的线下数据采集能力不强,更多的是依赖网络抓取和自营数据,此外,其估价模型也不算强项。

三,创新型房产评估公司。如信达泰和、世联、云房数据等公司,自带传统房产评估公司的基因,凭借多年的评估经验,这类公司的估价模型准确度最高,但多数房产评估公司不擅长直接获取一手房产数据,对外界数据依赖度较大。

相比之下,互联网房产公司的大数据实力较弱,对外输出能力仍需市场验证;房产经纪公司掌握真实交易数据,价值较高,但在房产交易过程中,经纪公司是利益关联方,数据中立性存疑,自建的数据生态相对封闭;创新的房产评估公司能提供理想的估值模型,但在数据源上不占优势,数据采集是关键挑战。

多样数据源,数据采集是壁垒

房产大数据可分为房产属性数据、市场数据、用户数据三个类别。

第一类,房产属性数据,包括精确到户的楼盘表数据、GIS(地理信息系统)及POI(信息点)数据;第二类,市场数据,能够反映出房产价值,如挂牌、成交价格、宏观数据等;第三类,用户数据,包括房产相关的参与主体数据、行为数据等。

多样繁杂的数据类型和数据来源是房产大数据的特征,各大数据平台厂商在数据获取的方式上也不尽相同。

在数据采集方面,信达泰和有自己的理解,采集方法包括线上抓取、合作互换、购买、线下自采、业务沉淀等方式。

线下自采对于信达泰和较为擅长,以北京为试点,其先后用4种方式采集数据,最终形成一套自有采集体系,通过自有测绘公司与当地房产专家结合的形式采集,对数据质量和采集效率有很大提升,是信达泰和的核心竞争力之一。

信达泰和团队在评估行业经验积累丰富,其创始人翟猛于1997年入行房地产估价领域,先后创立了房产评估公司国信达、房信测绘、思路信息、信达拍卖等公司,资源丰富。房信测绘公司为信达泰和提供定制化的房产数据线下采集服务。从2017年初开始,翟猛不再担任其他公司职位,将全部精力投入信达泰和。

一个指数三个产品、未来或将按流量付费

信达泰和作为房地产大数据服务商,处于产业链中间环节,上游对接数据源,下游服务客户应用。

产品层面,信达泰和公布了一个指数和三个产品。包括:中国城市二手房指数、智慧楼盘、智慧估价、押品估价全程通,年底将继续扩充产品,将推出针对央企客群的房屋资产管理系统。

其核心产品房产大数据平台,产品可视为平台上的模块化应用。在服务不同客群时,能够快速组合封装,有较强的通用性和可复制性。

以房产评估这条业务线分析,信达泰和拥有较强的房产评估输出能力,2016年与工行、建行、中行签订合同,与总行合作,信达泰和或将得到长足的发展,今年客群拓展至多家城商行客户,处于技术对接和POC阶段。

信达泰和在银行领域取得了较强的先发优势,按照银行用户的特点,随着项目合作的深入,银行客群的粘度逐步加大,更换数据供应商的可能性较低。

此外,信达泰和还取得了政府机关、税务局、公积金、互联网金融、房产经纪、快递公司等客群,为其提供二手房指数、房产估价信息、地址整治等产品和服务。

信达泰和的客群以中大型客户为主,在初期合作时定制开发、咨询服务的属性会伴随至项目成熟,与此同时,与大客户服务的经验也能集成到其产品中,打磨行业标准化产品和解决方案,在开拓同行业客群时,产品规模复制率将大幅提升。

据翟猛介绍,大数据平台建设工作将在2018年完成,覆盖全国各级城市的房产信息,2B领域是其未来一段时期的主要目标客群,最终战略是将大数据平台将向社会开放,或将变成按查询流量支付的盈利模式。

对标CoreLogic, 中美市场数据生态存差异

国内外的房产大数据市场差异较大,除了政策、法律、历史等宏观因素以外,数据生态也是明显的差异点之一。

以房源信息为例,在中国,没有一个统一的房源信息汇聚平台,每家房产经纪公司独自拥有不同的房产数据,以此建立相对封闭的数据库和自我数据生态,而同一套房源信息也常被买房者给与多家经纪公司,但各家的数据结构化程度不同,亦无规范可循,因此,中国的底层房产数据呈现分散、繁杂、差异化、沉淀较薄等特点。

在美国,可查询的公共数据资源丰富,有统一的数据平台,如房产数据库、地理信息数据库、房产税数据库等。这类数据库多数由政府、协会统一管理,数据治理的更加规范,很多数据都有数十年的良好积累。

比如,在美国,房源信息来自于一套完善的美国经纪人信息共享系统MLS,由美国房地产经纪人协会NAR统一管理,服务于各类房地产专业人士。在MLS系统中,每套房产由委托经纪人独家代理,房产机构和中介商可在MLS上精准查询,线上考察。在共享的机制下,资源利用率和交易流程均得到大幅提升。在数据层面,美国的底层房产数据更加集中、统一、规模化、积累完善。

现阶段,大数据技术助力中国房产大数据产业快速发展,数据的完整度、更新频次、精准度都将成为各家房产大数据平台的竞争维度。

CoreLogic是信达泰和的对标企业,是美国房产数据领域的龙头企业。1984年,Coerlogic成立,于2010年在纽交所上市,目前总市值40亿美元。业务层面,Corelogic有PI(Property Intelligence)和RWW(Risk Management and Work Flow)两条业务线,提供资产信息、数据分析、估价服务、风险管理等一系列与房产及其他数据相关的产品和服务。

信达泰和与Corelogic进行了4年的咨询合作,借鉴其海外市场的成功经验,将切入更多的房产数据相关场景,打造房地产大数据行业巨头。

近日,爱分析对信达泰和董事长翟猛进行专访,现将精彩内容分享如下。

20年房产估价团队,转型房产大数据

爱分析:在房产大数据行业,信达泰和的定位是什么?

翟猛:从各国的经验看,社会财富70~80%都在房地产上,包括美国、澳大利亚等国家。据我们测算,中国住房市场容量是200万亿,非住宅市场有100万亿。我们的定位是中国财富的守护者,想依托于房地产数据,为中国各个行业做决策的帮手,增加他们做决策的信息。

爱分析:您之前在地产估价20年的经验,对选择转型房产大数据来说,主要沉淀在哪里?

翟猛:第一,对估价的情感;第二,对估价师就业的责任,全球趋势上,传统估价师职位骤减,我想把大家的作业方式改变,通过房产大数据,为大家提供更多的就业机会。

爱分析:据您测算,房产大数据市场空间有多大?

翟猛:参考CoreLogic,它在房地产数据行业的直接收益是50亿美金,但衍生的应用收益300亿美金,依靠Corelogic大数据平台,大家在上面做应用。中国市场将远大于CoreLogic,预计是2-3倍。

爱分析:这个2-3倍是如何测算的?

翟猛:第一,中国房屋总量大,约是美国市场2倍左右;第二,我国人口就业流通性较高,将提高房产流转率,释放一定的市场空间;第三,我们的城市管理有待提高,地址信息等衍生品也有很好的商业化价值。

爱分析:CoreLogic的产品和业务包括哪些?

翟猛:CoreLogic覆盖了整个银行与房产相关的业务,从前端获客、受理审批、中端的风险,后端的贷后管理,全覆盖它的产品,在美国市场占达95%。像房贷、信用卡、资产证券化、房贷政策、外国人投资政策、都会用到CoreLogic的数据支持。

爱分析:房产大数据领域入场玩家并不多,您认为背后的原因是什么?

翟猛:第一,做数据不能封闭,但大多数房产经纪公司都是自我生态,天生有天花板;第二,一定要有专业积累,包括地理信息、数据清洗ETL、数学分析和模型、房地产估价、产品及行业知识,包括银行、保险、税务等。

自采、互换、采购等多种方式获取数据源

爱分析:房产大数据包括哪些数据类型?

翟猛:我们对中国40个地市的房产有记录在案,包括基础的静态数据,及市场的活力数据。我们从三个维度描述房地产数据。

一,空间维度,我们用九级地址描述房产地址,国家-行政区-板块-街道-小区-楼栋-单元-层-户。现阶段,标注地址需要凭借技术设备,对每一栋楼进行采集,再用卫星、谷歌、天地图等影像核实。

二,生命周期,我们对房子的生命周期进行记录和描述,包括土地出让、开发建设、一手房销售、二手房销售、物业管理、到征收拆迁。国外的房子生命周期较长,中国的房子多数在二三十年。

三,特征信息,如价格、变现周期、金融属性、契税等房地产特征数据,现在正积极收集。

爱分析:房地产价格如何维护?

翟猛:我们维护每个单元、楼层的价格。通常,小区和楼的基准价需要人工维护,单元、楼层通过修正系数的方式给出,同一片区用一套修正系数,再会通过不同维度的数据交叉验证,定期更新。

例如,互联网挂牌数据,虽不够精准但能够表现价格涨幅,判断趋势。另外,收集各种渠道回流的成交数据,通过模型计算估价,结合价格涨幅,按月更新。少数存在问题的,再用人工确认,随着数据越全,后期人工参与会逐步减少。

爱分析:如何人工确认房产价格数据?

翟猛:很多方法,看网络数据、向中介核实、估价师去现场等办法考证价格。

爱分析:信达泰和对接了哪些数据源?

翟猛:地址数据,小区-单元-户号等楼盘表信息,依靠我们的测绘公司完成,每个城市有办事处,由专业测绘人员结合当地房产专家共同完成。我们开发工具,如APP、后端系统,他们负责采集和录入。

挂牌数据会以抓取的方式采集,一些矫正过的网签数据部分城市已有公布。评估数据、成交数据多数与评估公司和经纪公司合作获得,以及在客户服务过程中沉淀、核准的数据等。

爱分析:这样的话,采集数据对人力依赖很重?

翟猛:是很重,但效率很高,按APP中问题点选的方式进行。我们将互联网数据、日常业务数据等都与采集系统做关联,所有房地产数据都能互联互通,并用可视化呈现。

爱分析:采集一个城市的成本有多少?

翟猛:北京在千万量级。

爱分析:平台数据这种如何更新?更新的成本如何测算?

翟猛:依靠互联网数据更新,发现一个必须核实。我们平均一个城市有数十人,有业务沉淀和自动化更新规则,只有少数疑难的,需要人工核实,更新的成本不高。另外,快递业务对平台进行了反哺,地址查的越多,平台的准确度越高。

爱分析:与经纪公司如何合作?多久更新一次交易价格?

翟猛:一般是交换为主,我不要人名,只要地址和成交价格,是脱敏的,我们用房地产的数据服务和报告与其交换,与经纪公司的合作方式按月为主。

爱分析:经纪公司合作的有哪些?

翟猛:各个城市不太一样,要分开谈,我们有数据拓展部门,负责谈合作互换。

爱分析:从客户获取哪些数据?

翟猛:房子的相关数据,包括地址、面积、贷款申请、时间、押入期价格等业务数据。

爱分析:每年在数据购买方面花费多少?

翟猛:数据购买在数百万量级,以后会越来越多。大量的数据是互换、业务沉淀、自我采集的。从数量看,互联网数据量占最大,从价值看,来自银行、估价、中介等数据最值钱,以合作方式获取。自我采集的数据最重要,可以验证互联网数据对错。

以平台为核心,主营房产估价、地址服务

爱分析:信达泰和的房产地图有哪些特点?

翟猛:百度、高德的地图、导航精确到小区,我们的应用跟户相关,及周边所有影响价格的因素,包括配套设施等多个维度,集成在我们估价模型里。

爱分析:为客户提供的产品包括哪些?

翟猛:目前以公布了一个指数和三个产品,包括:中国城市二手房指数、智慧楼盘、智慧估价、押品估价全程通,年底将扩充至6个。

我们的核心产品是智慧楼盘,集全国房地产基础信息和市场信息于一体,以地图加载楼盘字典的方式做呈现,包含楼盘信息管理、房产估价、分析统计、挖掘应用等功能。

爱分析:信达泰和发布的中国二手房指数,做指数是商业化困难的事情,这是如何考虑的?

翟猛:基于对我们房产数据的研究,2015年,我们与住建部、清华大学联合发布中国的二手房指数。虽然二手房数据不完善、获取较难,但真正使用价值最大,二手房均匀分布于城市内,它能积极反应房地产是否健康、政策影响等问题。

我们的宏观指数免费向政府、院校、银行、保险、基金等行业提供,但微观的研究需要付费。

爱分析:做二手房指数有哪些核心技术?

翟猛:第一,时效性,目前是按周更新,重大政策调整按天更新,从量、价等波动角度,用房产数据反馈政府及部门的政策落地情况。在美国,大家按房产指数做投资,指数按分钟更新,中国更多的是购买房产,按周或天更新相对合理。

第二,估价的传承,我们有20年的房地产估价经验,传统的估价报告需要3-4天,无法满足互联网经济节奏,美国、澳大利亚,70%以上的估价师岗位已消失,现在更需要实时、自动、批量、精准、专业的评估报告,用技术替代传统估价。

爱分析:指数方面,美国按分钟,中国按周或按天,您认为背后的原因是什么?

翟猛:原因在于数据生态,数据开放程度不同。国外政府数据是公开的,行业数据可互通互联,有30年研究历史。指数带有预测性,需要长久的积累。我们经过多年积累,才逐渐开始。

爱分析:主要客群有哪些?分别提供怎样的产品和服务?

翟猛:房产大数据的应用很广泛,目前我们做估值、快递地址、资产管理等服务。主要客群包括:

第一,银行。种子客户是中国工商银行总行,去年与建设银行总行、中国银行总行合作。我们为银行客户提供:估价全程通、押品重估、风险评价等系统的银行解决方案。

第二,互联网金融。如百度金融的房产抵押业务,我们为其提供查询和房产估价报告。

第三,快递公司。快递行业多数是人工参与地址解析和分级,效率较低。我们平台可以将原始快递地址解析成规则的地址串,进行自动解析,通过API接口反馈给快递公司,为其增效降本,目前在对接顺丰、优速等,我们使用脱敏的地址数据,不涉及个人信息。

第四,资产管理。服务于大型企业等的房产管理,对租售价格、日常费用等数据进行每周报告,对接后续的租售服务。这款产品12月份上线,有两大单位在试用。

第五,政府服务。我们给住建委、房管局及其房产系统软件中标公司提供查询和报告服务。

爱分析:与银行、金融的房产评估是否要针对到人?

翟猛:我们只需要地址、面积等房产信息,不涉及个人信息。

爱分析:产品对接客户的时候,现在应该更多的以项目为主,定制化程度占多少比例?

翟猛:对银行的押品复估产品以实现SaaS的形式。我们服务大型银行,沉淀之后做标准化,再服务几百上千的小行。除此之外,我们能主导80%,为其提供四大核心能力,除此之外,银行可能增加1-2个需求。

爱分析:这四大能力包括哪些?

翟猛:一,地址拆分和服务能力;二,估价模型和精度能力;三,数据分析能力;四,数据质量。我们的数据质量是以生态为标准,不单纯依靠自采和购买数据,通过业务,有自己沉淀数据和模型的能力。

爱分析:与工行、建行的项目是如何实施的?

翟猛:我们与建行共同开发房产估值模型。建行生产了一套银行指数,包括贷款风险指数、资金指数、开发贷等,我们的房产数据是其中一个评价维度。

爱分析:对同一个行业不同客户来说,输出的是同一套东西?

翟猛:我们核心是一个数据服务平台,已经完成大城市的数据采集,剩下的小城市,还需要一年时间。之后,我会把平台向社会开放,做平台化的公司,按查询量付费。

一个人和社会经济80%都与地址相关,未来平台将会服务很多2B公司。目前,还要靠平台把银行、快递的业务模式跑通,但最终是一个房地产的数据生态平台。

爱分析:快递公司的项目是否已经落地?

翟猛:落地了。寄件人通过语音软件描述地址,转成的文字传到我的系统中分析、校正,变成标准地址,传到快递公司的数据中心,再进行配送。

爱分析:信达泰和有哪些核心优势?

翟猛:一,我们与国内最顶级的院校清华大学、北京邮电大学、中科院、住建委、行业学会合作,资源互补。

二,我们以服务大客户为主,像工行、建行,与大客户服务会使得我们成长更快。

三,重视咨询,我们对标企业是全球最大的房产数据公司CoreLogic,我们聘请其前总裁做了4年咨询。此外,德勤、普华永道、安永是我们的客户,做资产证券化、给银行做风控、房贷、数据治理等。

爱分析:下一步的整体战略是什么?

翟猛:坚定不移的建设房地产数据服务平台不动摇,为银行、房地产中介、快递、政府服务,把这个事做起来,最大的战略是做中国财富的守护者。我认为,这个行业应该是由政府参股,为全社会服务。

多样的收费模式,产品类客户成趋势

爱分析:目前团队有多少人?未来业务稳定,团队是怎样的人员结构?

翟猛:不算测绘,我们目前不到500人,其中研发112人,产品和客服20人,数据200人,各地运营团队150人。

各个渠道来的数据,大部分可自动化处理,但20%的数据在系统和平台不能识别,需要人工清洗梳理。但人的经验又可变成规则,放到产品中,自动化输出,人力依赖越来越少。未来的想法是数据部门300人,研发200人,产品和客服100人,销售和解决方案300人,总数1000人以内。

爱分析:这样看来,人力将一直是主要成本?

翟猛:对,第一成本是人员,占60%,第二是数据,占20%,还有设备、日常办公等费用。比例在逐步变化,数据成本需要一年才能稳定。

爱分析:今年是否考虑做利润?

翟猛:今年计划收支平衡。

爱分析:快递公司项目如何收费?

翟猛:按流量收费,我们初步商定按(次/条)收费。据行业数据,每天快递包裹总量为1亿,是优质稳定的市场。

爱分析:服务快递公司,查询量剧增,增加了多少成本?

翟猛:我们组建了一个呼叫中心,增加了3个IDC机房,在北京、西安、哈尔滨,支持每天几千万条查询。

爱分析:长期来看,毛利空间会在多少?净利空间如何?

翟猛:参考国外对标,毛利率约70%,净利率35-40%。

爱分析:预计业务稳定还需要多久?

翟猛:平台还差一年时间建完,预计2018年以后会有比较好的现金流,项目类的客户会越来越少,产品类的客户将越来越多。