非常想知道关河因果在医药领域是怎么做数据分析的?

从高的角度来看,统计学是一种利用数学理论来进行数据分析的技术。象柱状图这种基本的可视化形式,会给你更加全面的信息。但是,通过统计学我们可以以更富有信息驱动力和针对性的方式对数据进行操作。所涉及的数学理论帮助我们形成数据的具体结论,而不仅仅是猜测。

利用统计学,我们可以更深入、更细致地观察数据是如何进行精确组织的,并且基于这种组织结构,如何能够以最佳的形式来应用其它相关的技术以获取更多的信息。今天,我们来看看数据分析师需要掌握的5个基本的统计学概念,以及如何有效地进行应用。

特征统计可能是数据科学中最常用的统计学概念。它是你在研究数据集时经常使用的统计技术,包括偏差、方差、平均值、中位数、百分数等等。理解特征统计并且在代码中实现都是非常容易的。请看下图:

上图中,中间的直线表示数据的中位数。中位数用在平均值上,因为它对异常值更具有鲁棒性。第一个四分位数本质上是第二十五百分位数,即数据中的25%要低于该值。第三个四分位数是第七十五百分位数,即数据中的75%要低于该值。而最大值和最小值表示该数据范围的上下两端。

箱形图很好地说明了基本统计特征的作用:

  • 当箱形图很短时,就意味着很多数据点是相似的,因为很多值是在一个很小的范围内分布;

  • 当箱形图较高时,就意味着大部分的数据点之间的差异很大,因为这些值分布的很广;

  • 如果中位数接近了底部,那么大部分的数据具有较低的值。如果中位数比较接近顶部,那么大多数的数据具有更高的值。基本上,如果中位线不在框的中间,那么就表明了是偏斜数据;

  • 如果框上下两边的线很长表示数据具有很高的标准偏差和方差,意味着这些值被分散了,并且变化非常大。如果在框的一边有长线,另一边的不长,那么数据可能只在一个方向上变化很大;

我们可以将概率定义为一些事件将要发生的可能性大小,以百分数来表示。在数据科学领域中,这通常被量化到0到1的区间范围内,其中0表示事件确定不会发生,而1表示事件确定会发生。那么,概率分布就是表示所有可能值出现的几率的函数。请看下图:

常见的概率分布,均匀分布(上)、正态分布(中间)、泊松分布(下):

  • 均匀分布是其中最基本的概率分布方式。它有一个只出现在一定范围内的值,而在该范围之外的都是0。我们也可以把它考虑为是一个具有两个分类的变量:0或另一个值。分类变量可能具有除0之外的多个值,但我们仍然可以将其可视化为多个均匀分布的分段函数;

  • 正态分布,通常也称为高斯分布,具体是由它的平均值和标准偏差来定义的。平均值是在空间上来回变化位置进行分布的,而标准偏差控制着它的分布扩散范围。与其它的分布方式的主要区别在于,在所有方向上标准偏差是相同的。因此,通过高斯分布,我们知道数据集的平均值以及数据的扩散分布,即它在比较广的范围上扩展,还是主要围绕在少数几个值附近集中分布。

  • 泊松分布与正态分布相似,但存在偏斜率。象正态分布一样,在偏斜度值较低的情况下,泊松分布在各个方向上具有相对均匀的扩散。但是,当偏斜度值非常大的时候,我们的数据在不同方向上的扩散将会是不同的。在一个方向上,数据的扩散程度非常高,而在另一个方向上,扩散的程度则非常低。

如果遇到一个高斯分布,那么我们知道有很多算法,在默认情况下高思分布将会被执行地很好,因此首先应该找到那些算法。如果是泊松分布,我们必须要特别谨慎,选择一个在空间扩展上对变化要有很好鲁棒性的算法。

降维这个术语可以很直观的理解,意思是降低一个数据集的维数。在数据科学中,这是特征变量的数量。请看下图:

上图中的立方体表示我们的数据集,它有3个维度,总共1000个点。以现在的计算能力,计算1000个点很容易,但如果更大的规模,就会遇到麻烦了。然而,仅仅从二维的角度来看我们的数据,比如从立方体一侧的角度,可以看到划分所有的颜色是很容易的。

通过降维,我们将3D数据展现到2D平面上,这有效地把我们需要计算的点的数量减少到100个,大大节省了计算量。

另一种方式是我们可以通过特征剪枝来减少维数。利用这种方法,我们删除任何所看到的特征对分析都不重要。

例如,在研究数据集之后,我们可能会发现,在10个特征中,有7个特征与输出具有很高的相关性,而其它3个则具有非常低的相关性。那么,这3个低相关性的特征可能不值得计算,我们可能只是能在不影响输出的情况下将它们从分析中去掉。

用于降维的最常见的统计技术是PCA,它本质上创建了特征的向量表示,表明了它们对输出的重要性,即相关性。PCA可以用来进行上述两种降维方式的操作。

过采样和欠采样是用于分类问题的技术。例如,我们有1种分类的2000个样本,但第2种分类只有200个样本。这将抛开我们尝试和使用的许多机器学习技术来给数据建模并进行预测。那么,过采样和欠采样可以应对这种情况。请看下图:

在上面图中的左右两侧,蓝色分类比橙色分类有更多的样本。在这种情况下,我们有2个预处理选择,可以帮助机器学习模型进行训练。

欠采样意味着我们将只从样本多的分类中选择一些数据,而尽量多的使用样本少的分类样本。这种选择应该是为了保持分类的概率分布。我们只是通过更少的抽样来让数据集更均衡。

过采样意味着我们将要创建少数分类的副本,以便具有与多数分类相同的样本数量。副本将被制作成保持少数分类的分布。我们只是在没有获得更多数据的情况下让数据集更加均衡。

完全理解为什么在我们使用贝叶斯统计的时候,要求首先理解频率统计失败的地方。大多数人在听到“概率”这个词的时候,频率统计是首先想到的统计类型。它涉及应用一些数学理论来分析事件发生的概率,明确地说,我们唯一计算的数据是先验数据(prior data)。

假设我给了你一个骰子,问你掷出6点的几率是多少,大多数人都会说是六分之一。

但是,如果有人给你个特定的骰子总能掷出6个点呢?因为频率分析仅仅考虑之前的数据,而给你作弊的骰子的因素并没有被考虑进去。

贝叶斯统计确实考虑了这一点,我们可以通过贝叶斯法则来进行说明:

在方程中的概率P(H)基本上是我们的频率分析,给定之前的关于事件发生概率的数据。方程中的P(E|H)称为可能性,根据频率分析得到的信息,实质上是现象正确的概率。

例如,如果你要掷骰子10000次,并且前1000次全部掷出了6个点,那么你会非常自信地认为是骰子作弊了。如果频率分析做的非常好的话,那么我们会非常自信地确定,猜测6个点是正确的。同时,如果骰子作弊是真的,或者不是基于其自身的先验概率和频率分析的,我们也会考虑作弊的因素。

正如你从方程式中看到的,贝叶斯统计把一切因素都考虑在内了。当你觉得之前的数据不能很好地代表未来的数据和结果的时候,就应该使用贝叶斯统计方法。

本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击。

}

上一篇200条金句反响比较强烈,有很多粉丝给老赵留言,让老赵分享一些千川的投放经验。今天老赵就给大家分享120条巨量千川的投放经验,内容大部分来自于孤狼和尹晨的分享,老赵也结合了一些自己的投放经验做了一些补充,希望给刚入门千川投放的小伙伴一些帮助。如果有粉丝想继续提问,可以在老赵营销笔记后台留言给老赵。如果问题很多,老赵之后会再出一篇千川相关的问答内容。大家也可以关注买量江湖的公众号获得更多投放相关的经验。

废话不多说,干货走起!

1、千川广告投放的底层机制是什么?

这个问题,可以这么理解。一名用户在刷抖音内容,刷到一定数量的时候,会刷到一条信息流广告,也就是一次广告展现的机会,而每次遇到这样的广告展现机会,会有N条广告在争抢这个展现机会,但最终谁能胜出系统会根据ECPM值来给争抢展现机会的广告做个排序,而影响ECPM值的因素有三个:eCTR(用户对广告的预期点击概率)、eCVR(用户对广告点击之后产生的预期转化率)和出价。

2、哪些因素会影响eCTR?

用户刷到一个广告为什么会点击?背后的原因直接影响eCTR,呈现给用户的整体内容效果,直接决定点击率的高低。千川广告有两种投放模式一种是直播间直投,另一种是投素材。如果是直播间直投模式,直播场景的打造、主播的即视感、话术、直播间氛围、热卖商品等因素都会影响点击率;如果是投创意素材,商品本身、商品的展示模式、话术卖点的提炼、拍摄场景、拍摄模式及剪辑模式都会影响点击率。

3、哪些因素会影响eCVR?

2)投放后台的设置精准性;

3)直播场景的营销性;

4)主播本身以及对于商品销售的讲款、打单、逼单能力及话术;

4、影响千川计算的数据是否出现延迟的情况呢?

账户整体和分计划数据会存在一定的延迟情况,如想观察实时数据,可关注【工具-今日直播】延迟较小。

5、直播带货,自播各阶段核心目标和指标有哪些?

1)冷启动期:核心目标【直播间互动数据、人群标签】,指标建议关注【停留时长、互动频率】

2)成长期:核心目标【直播间互动数据、人群标签、转化率、UV值】,指标建议关注【停留时长、带货转化率、UV值】

3)成熟期:核心目标【GMV】,指标建议关注【UV价值、停留时长、整场GMV、人均客单价】

6、 商品点击率对直播间的影响大么?

商品点击率会对直播间流量有影响,但是一定要理解直播间的流量不是单一因素影响,可能是直播间点击率、转化率、GPM、评论数、点赞数、直播间停留等各项指标综合影响的结果。

7、短视频脚本创意一般通过什么找 ?

巨量创意、蝉妈妈、抖查查、飞瓜等;

8、(专业版千川投放代餐直播间)为什么我设置了行业兴趣+行为,预估有3-5千万,投放下单,完全没有消耗。怎么办?

1)确认计划审核通过且正常开启。

81、千川直播投短视频,是只投一个产品的视频好还是多个一起好?

千川短视频引流直播间,视频内容里产品数量可根据直播间主题来确定。

1)若为品牌专场、明星专场、达人专场等复杂货品场次,短视频内容可包含多个商品及营销属性相关内容;

2)若为日常直播或单场直播,可以引流款或爆款为主吸引消费者点击;

巨量引擎广告审核规范及法律规定:

特殊case可联系对接业务同学提交广告复审;

93、双库存引流素材需要具备什么特质?完全无利益点类素材或成主流?

千川优质素材建议:vlog形式 - 聚焦”产品种草“而非”产品销售“,分享产品使用体验、弱化价格利益点刺激,给予用户真实、舒缓、亲近的观看体验;

素材多从”用户视角“出发,营造强烈的场景代入感,第一视角亲身试用分享;- 素材通过“优化视觉观感”,传递美好体验:画质清晰明亮、配乐曲风温和欢快,画面色彩明艳丰富;

94、成单类计划可以正常消耗对直播账号有哪些要求(粉丝量,点赞量,互动量,在线量)?

与传统平台类电商广告靠提价提高资源位排名不同,千川信息流广告除了出价因素外,还会综合考虑直播间素材质量、互动&内容指标(点赞、评论、关注、停留等)、电商向指标(GMV、48h发货率、带货口碑分、店铺体验分等)

95、消耗撞预算后,无法恢复正常消耗怎么办?

撞预算后,计划会自动关停;若暂停时间过久,重新启动后会结合前期积累数据重新探索人群投放,需要一段探索时间;若暂停时间不长,通常可快速恢复;若出现暂停很短但跑量影响大这类特殊case,可联系对接销售/运营排查;

96、玉石类间断商闪购商品,选择什么转化目标最优?

千川体系下,优先直播间下单转化目标,整体roi较高;同时可结合直播间营销节奏选择其他转化目标或双转化目标;

97、高客单价的商品如何选择转化目标?

高客单商品优先选择直播间下单转化目标保证ROI;同时可配合浅层转化目标定投老粉来降低成本;

98、初做直播没有粉丝,直播间引流适合投随心推还是直播间广告投放,直投的优势是什么?

直播初期,建议使用小店随心推和极速推广模式来做加粉提升,创编链路及使用成本均较低;直投直播间相对短视频引流直播间的优势在于,直播画面相对原生,门槛也较低;

99、 直播间引流和短视频引流直播间适用什么场景?

1)使用门槛:直投直播间适用于所有类型的商家及达人,门槛较低,效果较好;短视频引流直播间对引流素材质量要求较高,素材质量越高,引流效果越好;反之没有优质素材输出能力,不建议使用短视频引流直播间;

2)营销场景:短视频引流直播间可通过设置素材内容来进行大促或者促销货品信息的前端展示,此类场景短视频引流效果会更优;

3)稳定性:直投直播间因为主播、话术等不同,所以稳定性相对短视频引流略低;同时,直投直播间对于客户教育成本会更高一些;

100、推广目的:抖音号推广和商品推广有什么差异?我应该选什么推广目的?

千川体系下只区分短视频图文带货和直播带货两种营销目标;

101、为什么账户有的计划突然爆量?

1)直播间内容指标优化提升,会导致广告跑量能力提高;

2)直播间营销节奏也会影响跑量能力,如秒杀款、引流款、福袋、评论等;

3)放量投放时会优先完成预算目标,投放过程成本会有浮动;

4)系统波动也会导致爆量,可联系对接销售同学排查;

5)可参考以下方式做调整:建议降低出价水平;

6)设置单计划预算及广告组预算,防止计划跑飞;

7)选择控成本投放(PC)及精准定向人群 ;

102、什么是闪购?闪购适合玉石吗?

主播可以在开播过程中,根据直播间画面快速创建商品,并在看播端快速售卖给买家。适用于商品种类多、库存少类型的商品,尤其适用于服装、玉石等非标商品;多用于因商品种类过多无法提前上传、或直播中临时上传商品的场景。也可以用线下谈好单来直播间成交,直播间闪购完成交易的方式提升直播间转化率。

103、当日订单GMV里,数据显示是算包含下单之后有退款的情况吗?

千川成交订单金额是指:广告带来的成交订单金额(包含在线支付成功和货到付款已确认的订单);退款情况在下单、运输、收货后等场景下均有可能产生,不计入千川成交订单金额;

104、千川后台里,直播间成单转化数和当日订单数据为什么会有不一样的时候?

在【直播间下单】转化目标下,转化数可以理解成一个客户产生了下单行为;广告带来的成交订单数(包含在线支付成功和货到付款已确认的订单);转化的客户实际下单量并非一定为一笔订单,所以会存在数据不一致的情况;

105、目前抖音号推广和商品推广,都只能看到小店的对应数据吗?

1)千川体系下营销目标只涉及短视频/图文带货、直播间带货两种营销目标;

2)账户及计划数据均为投放的对应直播间/商品广告数据;

3)今日直播可看到直播间整体数据(自然+广告);

106、同支视频,可以同时授权给多个广告账户使用吗?

短视频引流直播间可以;短视频带货需为挂车短视频,且购物车中商品需为广告主绑定抖店商品;

107、什么情况下已授权达人视频,但无法在创意里拉取?

1)短视频:创意需为挂车短视频,且购物车中商品需为广告主绑定抖店商品、视频设私密、视频授权过期;

2)直播:视频设私密、视频授权过期;

108、 自然流量和千川流量怎么配比才能帮助直播间起量?

主流直播间整场直播自然流量 VS 广告流量配比通常为 8:2 ,但在开播前期及直播间营销节点需要快速引入流量时,千川流量占比会拉高;

109、为什么随心推的订单老是审核不通过?

1)审核被拒:可在审核原因处查看拒审原因并做对应修改;建议在创建计划前做好投放资质的审核以及素材商品的优化,创意素材越优质,整体通过率越高;

2)素材制作前可参考【巨量千川准入&管控规则指引】:

3)需要提交资质时,可在小店随心推订单界面提交资质;

4)若确认提交修改无误,依旧无法通过审核,可联系对接销售做复审操作及by case排查;

110、账户每天只能跑两万的消耗,跑到2万左右之后账户直接被限流了,后面一点量都没有,戛然而止,跑量速度和计划成本都是正常的状态,导致每天只能有1个小时左右有消耗。这个问题产生的原因是什么,以及怎么解决?

1)优先自查48h发货率、店铺体验分及带货口碑分是否在限流值以下,通常为此类情况限流导致预算只能消耗部分;

2)可参考【巨量千川准入&管控规则指引】:

111、 直播间设置限时秒杀,在商家后台创建完活动后,是否在直播间生效?非直播渠道进入的例如广告渠道会不会同时触发该秒杀活动?

1)商家/主播流程:开启直播 → 在直播中控台添加商品 → 设置秒杀 → 配置秒杀时间 → 配置各SKU的秒杀价格、库存、限购数量 → 开始秒杀;

2)任何渠道进入到直播间,只要满足秒杀要求,都可以参加秒杀活动;

112、很多人说投千川转化目标要投成单,那么观看、评论目标是否就不具备现实意义?

并不是!如果本身直播间人货场足够强大,那么投观看和评论出价低转化也不错,可以降低直播间的投放成本,但是这种直播间在当前少之又少。

113、每条计划一般要设置多少预算?

考虑到每种转化目标的跑量速率,一般情况下,按照投放预算去进行比例分配最佳,比如1万预算跑ROI,那么核心在成单,就应该给成单分配足够的预算,点击计划分配100以内的预算足够,进入计划更多起的人群探索更直播间氛围的效果,三五百的预算也已经足够。具体仍然还是要看直播间的具体情况,以及每种目标的用途。

114、如何在投放中调控出价?

前期为了跑量,可以选择高于同行的平均水平5-10个点出价。通过高出价,快速跑出适合你产品的稳定模型。一般来讲,对于新计划初期出价,我们的期望成本高出一些,等到这个计划跑过测试期以后,再慢慢降低出价到目标成本,当然新计划出价抢量也要注意成本的控制,出价最多也不能超过你设定目标价的百分之四十,不然即便量级成功跑出,也可能面临成本超过目标价太多,很难压制下来的窘境。

115、计划跑起来如何补量?

账户一旦创建好计划后,投手要做的就是不断坚持上新,充分发挥每一个创意的拓展探索能力,从而观察不同创意带来的数据呈现,日常运营保持适当补量,以防创意衰退即可。如果创意本身难以获取平稳的效果,整体账户效果就很难稳定,多建计划更易发掘优质创意,所以广告推广效果不稳定的账户,对创意的需求量更大,所以广告计划的上新要上到提量为止。

116、计划初期成本很高,是否要关掉重新跑?

首先看一下是不是初期回传延迟导致的成本偏高。如果成本没有高的,不建议暂停,先观察一段时间数据,给他一点学习的时间。当系统积累过足够的模型之后,量级就会变得更加精准,成本也可能会慢慢回落。

117、跑得好的计划是否可以复制?

复制的前提是跑量计划的衰退。衰退计划的根本,在于在单条计划下,系统已经难以探索产品所需要的人群,进而整体消耗开始拉低;其次是计划在扩容时,外部流量的探索越来越宽放,导致模型被稀释化,在高成本转化下计划变成无效计划。但众所周知,跑量ok的计划,即便生命周期完成,但是重新进行复制,却同样有着很高的概率能够跑出来,因为计划的复制之间会存在模型继承的关系,可以续命。

118、什么时候选择上新计划?

为了避免青黄不接的现象,在进行计划运营时,最好的状态是推广效果好的时候可以适度减少上新计划,不用上过多的计划。账户效果好的时候,你的成本是可以接受的,甚至是低于你的预期成本。那么这部分多出来的预算可以拿去进行测试,推广效果差的时候需要提前大量上新计划,可以新老素材一块上,老素材是之前跑的效果较好的素材,但是不要完全复制,可以设置的不一样点,哪怕就是素材换个音乐都可以。

119、如何看直播间数据?投放主要关注哪些指标?目标投产比roi如何计算?

1)巨量千川中可根据直播带货广告计划,查看计划维度直播间数据,也可根据【工具-今日直播】来查看直播数据;后续会上线直播广告大屏产品也可查看直播间数据;

2)投放关注的指标一般基于转化目标关注不同的指标。比如【直播间下单】建议关注转化数据,【直播间商品点击】建议关注商品的点击数据等,整体数据建议关注GPM、ROI转化成本等;

120、如何加快学习期的问题

建议先尽量扩大曝光,而扩大曝光的最大化手段就是出价,通过高出价,快速跑出适合你产品的稳定模型。一般来讲,对于新计划初期出价,我们的期望成本高出一些,等到这个计划跑过测试期以后,再慢慢降低出价到目标成本,当然新计划出价抢量也要注意成本的控制,出价最多也不能超过你设定目标价的百分之四十,不然即便量级成功跑出,也可能面临成本超过目标价太多,很难压制下来的窘境。

巨量千川的投放细节太多了,老赵今天这篇只是针对几个社群里小伙伴们长文的问题,做了一个总结性内容,非常有助于新手快速的了解千川投放的一些细节,大家看不完的话可以把这篇文章收藏起来或者分享给你觉得对他有用的人。老赵开发的抖音电商课程中也会包含千川投放的部分,会帮助大家系统性的梳理一下千川的玩法和细节。针对千川投放有问题的小伙伴也可以给老赵留言,老赵会整理完后回复。

}

我要回帖

更多关于 吴云医学的哲学是真是假 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信