从数据仓库到数据视图
如何根据业务需求交付数据产品?一系列步骤可以帮助你理解亿贝的实践:1.选择合适的数据仓库2.建立数据模型3.利用第三方数据4.使用数据库小工具5.数据集市的使用和管理6.制作数据视图。...
Author: Shu, Alison
作为亿贝数据平台的技术支持团队,我们定期会和业务部门交流,了解他们对数据平台的使用和期望。这一次,我们接触了业务拓展团队。他们需要根据亿贝集市的品类销售情况及中国卖家的渗透率,部署各省的人手。他们对数据平台和工具的了解和使用仅限于MS Excel。由于资源有限,他们期望一个快速的解决方案,一次部署不用维护。相应的他们的需求也非常清晰,并且一定期限内保持不变。
作为亿贝数据分析平台推广活动之一,我们数据支持团队根据以上的用户需求制作了演示产品。完整步骤呈现如下:
一、选择合适的数据仓库
二、建立数据模型
三、利用第三方数据
四、使用数据库小工具
五、数据集市的使用和管理
六、制作数据视图
一、选择合适的数据仓库
亿贝有各种数据仓库支持不同的应用场景。结合业务需求,判断是否满足以下一个或几个应用场景,我们决定选择Teradata数据仓库。
数据仓库不同的的业务场景:
- OLAP (Online TransactionProcessing)应用
- 储存限制级数据,比如用户人个身份信息
- 数据容错性高
- 支持商业智能报告或分析应用
- 读写操作密集度不同,比如侧重写,或者侧重读
- 内存或缓存中储存数据
- 支付多维度立方体的切片和切块
市场上企业级的数据平台及基本特性:
- Mongo DB: NoSQL, 支持分布式数据存储
- Couchbase:NoSQL, 缓存中储存数据,支持高性能读写
- Hadoop:NoSQL,开源,支持分布式数据存储、计算的大数据应用平台
- Hbase:NoSQL,分布式面向列的开源数据库。
- Oracle:SQL,世界上最流行的关系型数据库管理系统。
- MySQL:SQL,开源的关系型数据库管理系统
- Teradata Database:SQL,高性能和精密的工作负管理
我们的业务需求:
- 结构化数据(业务交易数据)
- 可靠性高(减少额外维护成本)
- 支持商业智能报告和视图化(业务用户是数据的消费者)
更多内容,请点击“ 阅读原文 ”。
关注 亿贝招聘
微信扫一扫关注公众号