# 《拼团交易平台系统》第2-5节:人群标签数据采集
作者:小傅哥
博客:https://bugstack.cn (opens new window)
视频:https://t.zsxq.com/sWPg0 (opens new window)
沉淀、分享、成长,让自己和他人都能有所收获!😄
大家好,我是技术UP主小傅哥。
在抖音里经常可能会刷到一些视频,说:“你搜白酒,如果出来的都是茅台、五粮液”,那么证明你是有钱人!
这个东西其实到不一定多准,但这里体现了一个技术上的东西叫做人群标签🏷,所有你的行为所产生的数据,都会被不同的标签类型统计。比如;年龄、性别、购物喜好、品类喜好、下单频次、浏览频次、搜索频次等。这些都会被归类为人群标签。
其实,还有一个。怎么感觉自己微信上聊天,过一会在京东、拼多多搜索,就出来了自己聊天时候的商品呢?这里一种是来自于输入法内容的获取,另外一个是广告联盟,这些商家的广告数据是互通的。你在一个地方搜索过,那么在进去到其他商城里就会展示出你搜索的数据。
所以,在互联网运营的手里中,你早已被圈定好该给你什么,才能刺激到你做什么。
# 一、本章诉求
以轻量化的方式构建人群标签数据,将人群数据写入到 Redis BitMap 用于后续使用。
在公司中,所有部门产生的业务数据都会回流到数仓,它有一个非常庞大的数据集市系统。之后这些数据会被量化分析师使用,通过 R 语言建模,执行模型任务,把符合模型所需的标签数据跑到一个新的指定表文件中,这些文件在通过加工存放到 Redis BitMap 进行使用。一般一个标签可能会有 50万、100万、500万的数据规模。
有了这些标签数据,运营人员就可以精准的对这些用户做定向活动投放,比如;特定的券、特定的通知等。以此达到更加精准的运营效果。
# 二、业务流程
虽然,我们不能像公司那样有那么大规模的数据量,但我们也可以仅使用拼团商品的数据,做人群标签的实现,让大家了解这样一个场景。
- 首先,人群标签是通过创建的采集任务所产生的数据。任务里包含了要采集业务中什么类型的数据规则。本项目中会采集拼团交易数据,不过本节还没有这类数据,所以先来模拟这部分数据。
- 之后,把采集的数据除了放数据库,还需要写入到 Redis 的 BitMap 中,这个数据结构比较适合高并发场景判断用户是否存在。