金融

基于多年投研积淀,今日投资从B端开拓智能金融

金融数据处理和机器学习模型能力缺一不可

2018年11月13日
调研 | 卢施宇 张洋 高禹 撰写 | 张洋
  • 金融科技
  • 金融

随着我国居民收入增长与AI技术的发展,过去3年众多创新企业涌入智能投顾市场,其中今日投资作为金融数据领域老兵,基于金融数据处理能力切入智能投顾,通过向券商、银行输出智能投顾体系,以B2B2C模式服务C端客户。在今年8月获得招商致远资本投资之后,估值已达5亿。

今日投资从2014年开始智能投顾系统的研发,并于2015年推出智能投顾系统Alpha J, 目前已在平安证券等20多家券商和数家银行上线,为C端客户提供投资理财服务。

金融数据处理能力和AI应用能力是开展智能投顾业务的基础,今日投资在金融数据处理方面有多年技术经验,在2002年公司成立伊始便构建了分析师数据库(一致预期数据库)进行量化投资研究,从2012年开始将处理后的金融数据输出给资产管理机构用于投资决策,签约客户包括工总行资管、华夏金、嘉实基金、易方达基金、中信证券等。

今日投资首先将分析师数据、交易所数据、上市公司财务数据和新闻资讯这类原始数据,记录下来并通过技术手段过滤掉无价值的数据,形成标准化数据。然后进一步处理为结构化数据,输入机器学习模型得出资产预期收益率,作为智能投顾系统资产端的主要数据。

智能投顾系统需要做到资产与用户的智能有效匹配,所以不仅要求高质量的数据处理能力和策略模型深度,还需要精细的用户分析能力。

今日投资基于用户数据运用多维度的分析算法得到用户画像,然后基于涵盖客户投资风格、风险偏好等要素的用户画像,给出专业化、个性化的投资建议,帮助广大财富客户进行更科学的资产配置安排。

由于券商和银行的客群和服务需求不同,今日投资向券商提供股票配置类智能投顾系统,向银行提供大类资产智能投顾系统,为银行的客户提供债券、基金、现金、黄金等资产的投资组合建议,帮助银行提高基金等金融产品销量。

今日投资以本地部署和云部署两种方式交付智能投顾系统。如果涉及到大量券商或银行内部的用户数据,则一般机构会选择本地部署,保证用户数据安全;反之则可选择云部署。最终部署的智投服务会出现在券商或银行的APP上,面向C端用户。

在智能投顾能力输出上,鉴于C端用户理财需求较为多元的特点,B端机构的系统服务要求多以定制化模式为主,项目建设周期则根据各机构的需求复杂程度2个月到1年不等。不过,自今年开始,今日投资的机构服务模式已有所调整,即服务输出形式向标准化、产品化方向转变,以做到未来可在市场快速复制,提升规模效应。

智投系统的收费方式分为两种,一种是收取年数据服务费和少量开发费,单价从几十万到几百万不等;另外一种是根据用户流量或者用户产生的盈利与金融机构分成。

近期,爱分析对今日投资创始人康晓阳进行了专访,现将精彩内容分享如下。

将原始金融数据处理为标准化数据,进一步结构化后输入机器学习模型

爱分析:智能投顾用到的原始数据有哪些?

康晓阳:交易所的数据、上市公司的财务数据、分析师研报,还会通过机器学习阅读新闻。

爱分析:分析师数据来源有哪些?

康晓阳:我们最早跟各个研究所有合作,收集了很多分析师报告。也在一直更新数据数据库里面的分析师研报。现在通过互联网采集数据,量比以前增加了好多倍。

爱分析:如何将分析师数据处理成标准化数据?

康晓阳:我们把原始资料记录在案,并不断跟踪记录,进行结构化处理。比如卖方分析师在哪个时点推荐了哪支股票、做了盈利预测等。微观来讲是追踪分析师的个人能力,宏观来讲是程序采样。

分析不同的分析师对同一家公司,在不同的时间序列里的观点,对分析师的观点进行评判,过滤掉没有价值的信息。在数据的使用上,一个独立的绝对观点意义不大,要把相关信息联系起来去看,这个联系起来的逻辑就是数据加工的方法。

我们对原始的数据进行加工之后,提供给机器学习。机器在分析一支股票的时候,除了分析师数据,还会使用公司财务数据、市场数据、竞争对手数据、关联事件等。

爱分析:在原始数据处理过程中是否会使用NLP技术?

康晓阳:会。NLP主要是做文字处理,识别新闻、报告中的观点并记录下来,与历史数据、市场数据、竞争对手数据等结合起来进行分析,得出结构化数据。

爱分析:券商和基金公司是否会做类似的原始数据处理?

康晓阳:都会做,机器学习的模型都差不多,用什么数据进行机器学习才是最关键的。加工、处理数据的过程中,经验很重要。

爱分析:使用哪些数据处理方法,以过滤掉没有价值的信息?

康晓阳:数据处理方法的技术含量不是特别高,数据加工逻辑的技术含量高。将数据和数据处理逻辑,提供给机器,让机器进行学习,总结规律。有投资经验的人将逻辑提炼出来,用数据表达出来,这才是核心。

爱分析:数据库部分,是否会把处理过的数据直接输出给机构客户?

康晓阳:我们把数据分为两类,一类是把原始数据加工成分析师情绪、动能这类标准化的中间数据输出给金融机构。金融机构可以用这些数据做进一步分析,或者多样化应用。

另一类,我们把这些标准化数据处理成机器可识别的知识结构,输入机器学习模型。我们不对外提供这部分数据,而是通过机器学习模型得出的结果服务客户。

向券商和银行提供不同系统,以不同形式服务B端和C端客户

爱分析:如何输出智能投顾的能力?

康晓阳:相较于传统金融服务模式,智能金融最大的不同有两点,一个是标准化,这可以极大降低金融机构的服务成本,另一个是个性化,即可以顾及不同受众群体的差异化需求,所以只要金融机构对此有充分认识,我们的价值就体现出来了。具体到智能投顾的应用场景,当前还没有形成一种标准的模式,市场参与者包括金融机构都在探索尝试。针对银行、券商,我们主要输出金融数据应用和策略模型能力,通过把大数据客户画像、个股诊断、市场预测服务等提供给机构,来提升机构服务客户的能力。

爱分析:为券商提供股票类智能投顾,为银行提供大类资产的智能投顾?

康晓阳:是的,银行不涉及到股票,只是在资产配置中会有一些股票型的基金、债券型的基金。对银行来说,智能投顾相当于销售基金的平台。

大类资产智能投顾理论上是给没有股票投资能力的人做资产配置,而且基本上是做被动投资。根据客户的风险偏好、收益要求,模型会基于当时的市场环境,给出各类资产的配置比例,包括股票型类资产、黄金、债券、现金。股票类资产会推荐股票型的基金。

爱分析:今日投资是否会以不同的形式服务不同的机构?

康晓阳:服务专业投资者和服务大众的应用场景是不一样的。基金公司的专业投资者需要对模型进行调整,选择不同股票指数,做不同的投资策略。大众投资者有两个入口,一个是通过智能投顾进行个股诊断,对所购股票进行监测,了解投资组合的风险情况,另一个入口是大类资产配置。

爱分析:今日投资如何向券商客户提供智能投资服务?

康晓阳:在智能投顾方面,我们不直接可客户提供投资建议,主要是通过为机构输出大数据客户画像、账户诊断、智能匹配等服务,为C端客户提供个性化、智能化、专业化的投资决策辅助工具。

爱分析:产品的标准化体现在哪些方面?

康晓阳:比如用户画像,以前会输出很多维度的结果,从应用的角度来讲,很多维度是中间变量,没有输出的意义。现在我们只输出应用需要的几个标准维度,保留中间变量。

爱分析:如果要进一步提升客单价,今日投资未来面向金融机构提供的服务会有哪些差异?

康晓阳:就商业模式而言,B端服务模式有定制项目、可复制产品、月度/年度订阅模式以及分润模式等,若想实现更高的客单价,就一定要获得客户的认同,要想获得客户的认同,就一定要为客户创造真正的价值。今日投资作为一家务实专注的金融科技企业,对于商业目标的路径选择会基于智能金融的发展趋势,通过重构投资组织方式或行业协作方式来实现。

爱分析:现在有多少银行客户?

康晓阳:与券商相比,现在银行客户还不是特别多,因为市场还在培养阶段,另外,大类资产配置的机器学习模型还在升级,很快就会推出。

爱分析:现在今日投资有多少人?

康晓阳:我们公司现在有80多人,融资完成之后在增加人手。现在标准化的产品线已经设计出来了,在逐步实施过程中,在未来1-2年标准化方面会有很大的进步和提升,所以项目占用的人员会更少。

爱分析:今日投资的人员是如何分配的?

康晓阳:市场人员只有10人,其他大部分都是研发人员,还有少量后勤人员。研发人员包括和天马资产联合成立的人工智能团队,有21人。人工智能取决于数据,其他技术人员是做数据清理等准备工作。

我投资的另外两家公司是做自然语言处理,一家是把信息做分析归类,比如把舆情信息通过爬虫技术收集进来,然后机器进行诊断。另一家公司是对话等交互处理。