PDF:必考知识点,CFA一级数量分析-常见概率分布-下

“人的一切痛苦,本质上都是对自己无能的愤怒。”

文:蓝兔子读难NOTES

图:配图来源于网络

编码:0008

因为篇幅的限制,我们上一篇文章只说了一半,在这一篇文章中,我们会继续进行常见的概率分布内容的分享。可以说,在常见概率分布这一大章内容里面,最重要的内容就在接下来要说的里面,一个是正态分布(normaldistribution),另一个是t分布(student‘st-distribution),其也是掌握后面章节内容的关键知识点。

连续概率分布与正态分布

具体连续概率分布的定义我们在上一篇文章中已经进行过解释,这里就不再赘述。我们直接来看一个连续均匀分布(continuousuniformdistribution)的PDF图形:

Nansen:加密钱包在过去24小时内从中心化交易所提取近9.02亿美元的USDC:金色财经报道,区块链分析公司 Nansen 的链上数据显示,加密钱包在过去 24 小时内从中心化交易所提取近 9.02 亿美元的 USDC,USDC 是过去 24 小时内中心化交易所最大负净流量的代币,提款来自smart money钱包、基金和做市商以及钱包。

截至发稿时,在过去的 7 天里,已有 30 亿美元的 USDC 从中心化交易所撤出。根据 Nansen 的说法,USDC 余额最高的钱包属于币安、MakerDAO、Arbitrum、Polygon、Crypto.com、Voyager、Aave、Optimism、dYdX 和 Compound。[2023/3/11 12:55:51]

因为每一个可能的结果发生的概率是相等的,所以其PDF曲线为一条水平线。这里需要强调说明一下,由于连续随机变量可以有无数多个可能,因此针对某一确定的结果,我们近似的认为其发生的概率为0,因此在分析连续随机变量相关问题时,我们应该取区间分析,而不能对点进行分析。

又因为任何一个随机事件,其所有可能的结果的概率和为1,所以上图中,该条直线的y轴坐标为1/(b-a)。当我们对区间(a,b)中任何一段子区间进行分析时,可以利用简单的几何原理算出相应的面积(概率)。

接下来,就是重中之重的正态分布,正态分布几乎存在于我们生活的方方面面,无论是班上同学的考试成绩,还是班上同学的身高体重,基本上都逃离不了正态分布的“上帝诅咒”,而且同一个目标对象的数量(样本量)越是多,越是重复的厉害,那么就越正态。看看下面这两幅图,看看你是否能找到小正态的影子。

COTI将于12月29日进行MultiDAG 2.0主网硬分叉:12月20日消息,企业级金融科技平台COTI宣布,MultiDAG 2.0主网硬分叉和COTI Explorer 2.0主网发布将于12月29日进行。所有节点需要在12月29日之前升级至3.1.2版本。Huobi和KuCoin正处于升级节点和应用程序的最后阶段。

据悉,MultiDAG 2.0协议采用CMD (COTI MultiDAG)标准,允许在COTI Trustchain上发行代币,并将实现从单一货币基础设施到多代币层的完全过渡。[2022/12/21 21:57:01]

请别告诉我这是人为的,即便是人为的,为何偏偏就是这个样子。那到底是哪个样子呢,请看下图:

正态分布虽然如上帝的“祝福”般占据了我们生活的方方面面,但是我们只需要把它当作一个工具即可,一把扳手,我们不需要知道它是怎么生产出来的,我们只需要了解他的一些性质即可:

比特币全网未确认交易数量为1330笔:金色财经报道,据BTC.com数据显示,目前比特币全网未确认交易数量为1330笔,全网算力为262.63 EH/s,24小时交易速率为3.17交易/s,目前全网难度为35.61T,预测下次难度上调3.66%至36.91 T,距离调整还剩2天6小时。[2022/10/22 16:35:03]

其PDF完全由均值和方差刻画,通常记为N(均值,方差);其图形对称,偏度为0,越中间概率越大,越两端概率越小;如之前内容所讲,正态分布的峰度为3,超额峰度为0;服从正态分布的随机变量线性组合后还符合正态分布;标准正态分布概率区间几个特殊值经常用要记住,如下图(90%对应1.65个标准差,虽然图中没标,但也很重要)。

接下来的内容是标准化的正态分布。如前文所言,正态分布表示为N(均值,方差),尽管正态分布存在于我们生活的方方面面,但是这方方面面的正态分布却也各不相同,且由于正态分布的PDF比较复杂,我们很难通过表达式去计算出其某区间的概率,更不可能给每一个参数不同的正态分布都列一个表格去查。

好在前辈们也纠结过这个问题,并且找到了解决方案:他们把标准正态分布的结果列成一张表,并提供一种把非标准正态分布转换为标准正态分布的办法,再拿这个分布去查表。

Algorand任命Visa和Fidelity的前通讯主管为CMO:金色财经报道,Algorand聘请了Fidelity Investments和Visa的前通信主管作为其首席营销官,因为这家区块链公司寻求建立自己的品牌并通过战略增长计划来扩大影响力。Michele Quintaglie的任务是帮助公司进行叙述发展和影响营销,并将寻找赞助机会。(blockworks)[2022/9/21 7:11:50]

标准正态分布表示为N(0,1),其中0为均值,1为方差,任何非标准正态分布都可以进行转换,转换后即可查标准正态分布的表得到相应的值。为了便于理解,举个例子:

已知某公司股票的某参数符合正态分布,其均值为10,方差为9,即服从N(10,9),问随机抽取该股票参数中的某个值,该值小于5的概率,即F(5)。

虽然其服从正态分布,但不是标准正态分布,所以没法直接查表,需要先进行转换,转换的方法就是:

(X-μ)/σ====即=====>>(5-10)/3

即查标准正态分布的F((5-10)/3)即可。

查表要注意,1、查表会不会,不会的同学看看书,这里就不解释了;2、查得的是累积概率,可能需要再次进行换算。

标准正态分布也被称为z分布或者u分布。

英国考虑将加密资产引入投资交易清单,以支持加密资管行业发展:6月24日消息,英国考虑将加密资产引入投资交易清单,目前已宣布就英国投资经理豁免(IME)可能扩大到加密资产进行公开咨询。此举旨在为基金投资者提供管理加密资产投资组合的安全港,并让其享受税收优惠政策,从而鼓励新的加密资产投资管理企业在英国建立。[2022/6/24 1:29:59]

亏空风险(shortfallrisk):指资产的收益低于最低可接受水平的概率,亏空风险是一个概率。这个最低可接受水平(shortfalllevel)用Rl表示。

罗伊的第一安全比例(Roy'ssafety-firstratio|SFration):

SFRatio=/标准差

从其公式上来看,第一安全比例代表的是每份超额风险所获得的收益,这里的超额指的是投资收益相对于最低要求收益的超额。注意与夏普比率区分,夏普比率的超额是指投资收益相对于无风险收益超额。

同夏普比率一样,每单位风险获得的收益肯定是越多越好,所以怎么根据SFratio选择组合你懂的。

对数正态分布与t分布

接下来是另一个非常重要的分布,学生t分布(studentt-distribution),不要觉得名字奇怪,之所以叫这个名字,只是因为发表的人给自己取了个这么样的笔名而已。就像正态分布也叫高斯分布一样,只是名字而已。

不过说到正态分布和t分布,他们不仅仅是名字都是发表者用的名字而已,他们还有很多的相似之处。怎么个相似法呢,先看图:

我们之前说过,正态分布的样本数量越多,就越正态分布。以考试成绩为例,一个班50个同学的数据肯定没有全校同学的数据那么“正态”。但是如果反过来,班上只有40个同学,或者只有10个同学,他们的成绩还符合正态分布吗?不难想象,当我们数据量越小时,越容易受到极端值的影响,当数据量太少时,就会和正态分布出现偏差。

我们有一位伟大的同学,叫做“Student”,同我们一样,他也发现了这个现象,但是和我们不一样的是,人家找到了小样本的解决方案,后来被命名成t分布。t分布具有如下性质:

图形如上图所示,当自由度增大时,图形逐步接近于正态分布;图形完全由自由度(degreesoffreedom|df)刻画;相比于正态分布,t分布图形有低峰肥尾巴特质,因此峰度>3;这里说明一下,峰态虽然叫做“峰”态,但他看的不是峰有多高,而是尾巴有多肥。

下面是对数正态分布(lognormaldistribution),虽然正态分布占据了我们生活的方方面面,但是他却有一个问题:他的取值范围在正负无穷的范围内,而我们的资产,或者说股票的价格,不可能为负,所以导致其不能用于衡量资产的价格。因此,我们引入了对数正态分布(具体的过程比较有意思,但是这里不说),如下图:

其有如下特点:

非负性,符合资产股票的价格定义域,偏度为正,所以一般用正态分布来衡量资产的风险,而用对数正态分布来衡量资产的价格。

最后还有一个知识点,叫做多元分布(multivariatedistribution),这里大家不用详细了解,只知道多元分布就像多元方程一样,里面有多个元素。考试一般问你需要几个参数才能刻画出这个多元分布,只要记住以下内容就OK:

每一个元需要两个参数来刻画:一个均值,一个方差;每两个元之间需要一个相关系数来刻画,nC2;所以,假设有n元,需要的参数就是2*n+nC2,掏出你的计算器吧!

模拟

模拟就是通过事前对事情进行彩排,来预测和发现事情的发展方向,比如去面试前,你会进行一个模拟面试,考虑会有哪些问题,如何应对。

模拟有两种,以面试为例,很多人都有面试过,自己可能也面试过多次,面试的常见套路,问题基本上就那些,你模拟的时候,你就能知道大概会问哪些问题,虽然每次面试不一样,但是大差不差,你可以假设一种情景来分析,如果问这个问题怎么样,如果问那个问题怎么样。这就是蒙特卡罗模拟(MonteCarlosimulation),我们也称之为情景模拟,对解决如果咋的咋的(whatif)问题很有效。实际上,你就需要先假设这么一个如果(通常假设其符合某一分布),但是其缺陷是,你一旦假设都错了,那你就全盘皆输。而且这种计算费电脑。

还有一个叫做历史模拟(historicalsimulation),就是根据历史数据来模拟,比如搜集某个地方某一天过去100年的天气情况来预测以后的天气情况,由于其依赖历史数据,所以不能进行情景分析,如果(whatif)气象局搞了场人工降雨呢?而且时代在进步,万事万物都是在变,没有什么是一成不变的,所以历史模拟也存在问题。还有就是,你选的这段历史数据万一碰巧选到特殊的一段了,比如模拟经济发展,你刚好选到二战那一段呢?所以,我们通常进行样本外测试(outofsampletest),把数据拿到样本外的历史数据去试试,排除数据选择问题(是那一段时间独有的)。

兔纸的相关文章

CFA一级数量分析-货币的时间价值

CFA一级数量分析-数理统计基础与收益

CFA一级数量分析-概率论基础

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

[0:15ms0-0:554ms