设为首页
收藏本站
用户名
Email
自动登录
找回密码
密码
登录
立即注册
只需一步,快速开始
快捷导航
登录
注册
论坛首页
BBS
建站模版
微站设计
虚拟主机
企业邮箱
博客日志
Blog
搜索
搜索
搜索
热搜
长春
优惠
活动
做网站
本版
帖子
用户
本版
帖子
用户
请
登录
后使用快捷导航
没有帐号?
立即注册
道具
勋章
任务
留言板
设置
我的收藏
退出
时时商务社区
»
论坛首页
›
建站资源
›
建站技术
›
他说:作为产品经理,不懂技术和代码也一样可以数据抓取 ...
返回列表
查看:
225
|
回复:
0
他说:作为产品经理,不懂技术和代码也一样可以数据抓取
[复制链接]
bewin83
当前离线
积分
7520
2500
主题
2513
帖子
7520
积分
论坛元老
论坛元老, 积分 7520, 距离下一级还需 9992479 积分
论坛元老, 积分 7520, 距离下一级还需 9992479 积分
积分
7520
发消息
电梯直达
楼主
发表于 2018-2-17 16:37:56
|
只看该作者
|
倒序浏览
|
阅读模式
鉴于上一篇《
第一个产品安装量破千万,我总结了这3句话
》有人说没有干货,所以今天带来一篇诚意满满的干货。请自备酒水饮料。
先说一下我要做什么:为了解行业老大做线上手游陪玩业务的基本情况,想通过他们在app提供的月排行榜的数据,做初步营收相关的数据分析。
作为万能的产品经理,不懂技术和代码也一样可以数据抓取。
准备工作:
[ol]
百度
、bing必应
charles或者其他的app抓包工具
excel
sublime(可以做一些基本的批量处理,没有也可以)
[/ol]
1、获取源数据
大部分app中使用https链接,所以正常使用charles抓包之前,先安装描述文件。不然会出现乱码(先百度“charles教程”和“charles https 抓取”这几个关键字)
在抓到的URL中,选择json格式,我们需要的东西就在这里面,保存到sublime中内容如下(不知道这玩意要不要打码)
这里面更多的东西是跟我无关的,我需要的字段有这些:
nickname 用户昵称
property_value 游戏段位
gender 性别(1=男;2=女)
birthday 生日
city_name 城市
price 单价
nickname 昵称
order_count 订单量
跟这些没关系的统统过滤掉(工具:sublime、excel)。
汉字在 json 中显示的是 UNICODE 编码(别问我这是啥,我也不认识他),所以还需要把 UNICODE 编码转换成汉字,所以请百度“UNICODE 编码 转换”。
经过上面的工具,把得到的结果放到excel里面,得到如下内容:
至此,抓取过程结束。然后对数据进行加工。
2、数据加工
我想要的数据是:
总收入
总订单
人均收入
投入时间
订单量
平均每单交易额
用户基本属性(年龄、性别、城市分布)
其中投入时间、年龄、城市分布的信息是抓不到的。
估算投入产出比较重要的一个维度是时间,所以要先估算一个完成一笔交易要多久。
考虑到他们的段位在游戏里面都比较高,就算每局15分钟。也就是说完成一笔订单需要花费15分钟。
月排行第一名那哥们,接了2003单。对他来说,月薪30K,每天工作16.7个小时(当然,他可能是做外包)。
出生日期经过简单的计算,可以得到年龄;
找一份最新的全国城市排名,我用抓包得来的数据做匹配,城市分布搞定。
3、数据分析
抓取的内容都是可以在app中可以看到的,抓取的目的,是不用自己手动计算排行里面500多个人的信息。所以这个算是免责声明吗?
对了,上个月也做了类似的分析,爬取了7w个页面。同样不需要懂代码,感兴趣的话我们下次聊聊吧。
分享到:
QQ好友和群
QQ空间
腾讯微博
腾讯朋友
收藏
0
回复
使用道具
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
电商运营
用户反馈
客户端