校管家大数据决策系统亮相2020中国民办教育科技峰会

教育 来源: 2020/5/20 11:50:37 阅读:674

  5月20日,2020中国民办教育科技峰会暨校管家520感恩答谢会以云直播的形式开启大幕。全国各地民办教育专家、学者、万人大校校长、合伙人及管理者在空中相聚,畅谈民办教育趋势与发展,共话民办教育科技创新之路。

  校管家CTO宋伟带着数据科学团队新开发的产品——大数据决策系统在大会上亮相,向十万围观的教育伙伴展示数据决策系统如何赋能教培机构精细化运营。

  01 大数据发展必经的4个阶段

  宋伟是我国著名的大数据及人工智能科研专家,拥有多项专利,2011年曾荣获广东省科学技术一等奖。加入校管家前,曾在华为工作9年,先后担任华为中央软件院、华为美研所的技术领头人,是华为人工智能及大数据技术早期的奠基者。  

  ·

  宋伟表示,大数据发展有4个必经阶段:

  1、 发生了什么

  初级阶段。通过人工、系统记录,积累数据,并加以处理、规整,还原企业的真实现状。

  2、 为什么会发生

  进阶阶段。通过对数据以便捷的方式,不同角度进行探查,分析现状背后的的原因。

  3、 预测什么会发生

  高级阶段。预测是一件很难的事。难在哪里?第一,企业要应用好大数据系统及背后的技术,这需要决策层的强力支持,以及技术团队锲而不舍的坚持和努力。第二、企业经营过程中产生的数据要充分完整的保存,行程数据层面的知识及事实沉淀。第三,需要企业在该行业的组织运作经验、行业经验、知识积累和技术积累,并形成有效的共振。

  4、 做什么决策

  智能阶段。依托对未来的预测,企业要做一些备案、安全措施、经营调整,这个门槛很高。因为做决策是需要依赖组织的。组织对大数据的理解透不透彻?组织有没有勇气去相信大数据系统?组织和系统之间的配合度怎么样?依据决策产生的后续行为是否能得到良好的闭环回馈?这些都有很大的挑战  

  02 行业应用大数据现状

  宋伟感叹道,大数据技术在我国已经历经了十多年发展,但大部分企业,目前还停留在第一阶段,即便有些企业已经应用了类似校管家这样的信息化系统,积累了海量大数据,但这些资源是沉睡的,其效能远远没有发挥出来,宋伟以自身在大数据领域的多年经验,给大家还原行业内大数据的应用现状。

  1、 慢是常态

  大部分企业是用一种很传统的方式给用户看数据,第一是很慢,比如说要查过去一个月的某个指标,数据能出来,但很慢,这种慢已经超过用户的忍耐极,并渐渐的使用户和系统之间形成了一种恶性关系。

  2、用户要看多角度数据时,时间成本高

  系统里的数据都是以单一形式存储的,并且呈现形式单一。这导致用户看数据的角度是相对固定的。用户要查看当前没有的数据维度,必须经过提需求、实现、交付的漫长过程。等数据到达客户手上的时候,时效性大大折扣。这让用户消费数据的效果大打折扣,海量数据“沉睡”在海底。

  “其实大数据的真谛就是让以往在经营过程中沉淀下来、正在沉睡的数据真正产生价值,用于做决策支撑,用于预测将来要发生的事,用于总结可以传承的规律经验,并最终以智慧的方式提升机构的运作效能”宋伟这样说道。

  03 大数据决策系统:向预测阶段过渡

  宋伟介绍说,校管家发布的数据决策系统,处于第二阶段和第三阶段这之间。

  1、数据展现快

  大数据决策系统以秒级的性能展现数据。

  宋伟表示,这是利用了一些高级技术。正常的数据库,它的存储方式是按行存,但是校管家数据科研团队采用按列存的方式,第一,它压缩率比较高(数据量很大的时,不压缩的话,数据会膨胀,影响速度及存储成本),第二,列可以无限宽,可以根据未来的不可知需求进行无损的维度增加。

  2、多维度的数据汇聚及呈现

  数据决策系统里集成了上千维度及指标,用户可以随心所欲的进行组合。

  3、展现形式更友好

  系统集成了50多种图表,筛选出数据后,可以任意切换多种图表形式,饼图、柱状图、线形图、热力图……用户能更直观地、更轻松地读懂数据。  

  4、形成行业通用模板

  校管家成立十年来,合作了1万多家大中型机构,在陪伴客户成长期间,也吸取了他们的经验,把行业内比较关心、常用的指标整理成了标准化的图标及仪表盘。即使用户缺乏数据分析经验,也可通过这些通用模板里满足大部分需求。

  5、用户自定义能力

  在通用报表及仪表盘无法满足要求的情况下,用户可在1分钟能通过拖拽的形式创建自己的图标及仪表盘,并可分享给其他同事。以让机构真正的随心所欲进行数据消费。

  04 多项技术成就数据决策系统

  宋伟表示,用户使用大数据的过程,类似于货物进仓出仓。

  第一步:仓储管理

  我们都知道,仓库会汇聚不同源头的货物。当肉类、蔬菜等各种货物进入仓库后,需要在不同的温度条件下保存。数据进仓也是这样,需要分类。

  第二步:数据清洗

  数据进仓前是需要经过清洗。有的数据可能不是用户想要的,有的数据不完备,需要补充,有的数据展现格式不统一,需要转换并归一。

  第三步:以各种主题呈现给用户

  比如包含了财务的数据有哪些,相关的数据把它们组合在一起,不相关的数据给它们设立边界,所以,这也保证了用户可以自由地筛选各种维度,从不同的角度去看数据。

  第四步:设立多种感知数据的方式

  通过这一步的技术,用户可选择以某种方式来看数据,如图表、仪表盘等。同时,给用户提供了更高阶一种数据探索手段——SQL实验室。SQL是一种探索数据的标准脚本语言,能更深入便捷的地探索数据仓库里已有的数据。  

  05 大数据系统的阶段性目标

  宋伟表示,目前校管家的数据科学团队,正在落地流计算技术。比如网报场景,机构非常关注每时每刻的报名金额,该技术能帮助用户以秒级为单位,实时展现机构网报的收入状况,这和天猫双11实时展现的数据大屏十分类似。同时,会通过数据挖掘及机器学习技术,进一步做预测方面的技术准备,让大数据更好地为行业赋能。



相关文章