数据中台

数据资产

什么是数据资产

企业信息化发展过程中沉淀下来的自有或经过授权可以合法使用的数据资源,会给企业带来经济利益的数据资源。

标签和资产的区别是什么

中台理念下的数据资产和大数据理念下的数据中心/数仓又有什么区别?

标签的定义

  1. 大数据发展的产物
  2. 对象的度量和描述
  3. 资产的载体和一种展现形式
  4. 中台理念下的一种数据使用形式

标签有三种类型

  1. 原始数据标签(客户原始提供的数据表中字段,经过清洗标准化)
  2. 统计数据标签(客户原始数据通过ETL加工,例如求和、平均等函数运算)
  3. 算法数据标签(客户原始数据经过算法模型计算后的高级标签,例如偏好、指数)

    标签类目体系设计流程

    梳理数据和业务价值之间的逻辑与关系

调研业务痛点
->带着业务需求梳理数据:数据类目体系
->根据业务诉求、源数据设计可用标签:标签类目体系
->确定标签逻辑(数据-标签 mapping)

类目体系

让用户可以根据【可理解的分类方式】快速查找数据、标签

类目呈现方式

  • 根目录
  • 一级类目
  • 二级类目
  • 三级类目
  • 叶子节点

    对象识别:主体-客体-行为/关系

    主体:能发出主动行为的实体,包括自然人或法人,及群里。
    客体:行为中被动作用的实体,如物品物体
    行为关系:某时某刻主客体间发生的行为关系,例如:浏览、推荐、购买等。

    OLP实体建模方法

    OLP是一种高度抽象的方式,将各种数据拆分、重组、连接的方法,具体包括:
    Object-实体对象
    Property-属性
    Link-实体之间关联关系

实体确定=》场景识别=》行为关系识别=》标签内容设计=》融合表设计

数据化的事物表达

确认好对象且汇总该对象所有相关数据后,可以系统性的向下梳理这个对象上的属性,属性上会有各种属性值,属性具有了一定的通用性,而属性值则体现了个体差异。

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!