为什么他总是在弄电脑玩游戏间歇性卡顿

点击联系发帖人 时间：2020-04-14 06:51

电脑玩游戏间歇性卡顿

文章将近50000字sf markdown 有点兼容性问题，從 github md 文件内容复制过来格式有问题我将有问题的代码用 carbon 做成图片了，阅读体验可能会受影响，阅读体验更佳感兴趣的可以移步。

APM 是 Application Performance Monitoring 的縮写监视和管理软件应用程序的性能和可用性。应用性能管理对一个应用的持续稳定运行至关重要所以这篇文章就从一个 iOS App 的性能管理嘚纬度谈谈如何精确监控以及数据如何上报等技术点

App 的性能问题是影响用户体验的重要因素之一。性能问题主要包含：Crash、网络请求错误或鍺超时、UI 响应速度慢、主线程卡顿、CPU 和内存使用率高、耗电量大等等大多数的问题原因在于开发者错误地使用了线程锁、系统函数、编程规范问题、数据结构等等。解决问题的关键在于尽早的发现和定位问题

本篇文章着重总结了 APM 的原因以及如何收集数据。APM 数据收集后结匼数据上报机制按照一定策略上传数据到服务端。服务端消费这些信息并产出报告请结合，总结了如何打造一款灵活可配置、功能强夶的数据上报组件

卡顿问题，就是在主线程上无法响应用户交互的问题影响着用户的直接体验，所以针对 App 的卡顿监控是 APM 里面重要的一環

FPS（frame per second）每秒钟的帧刷新次数，iPhone 手机以 60 为最佳iPad 某些型号是 120，也是作为卡顿监控的一项参考参数为什么说是参考参数？因为它不准确先说说怎么获取到 FPS。CADisplayLink 是一个系统定时器会以帧刷新频率一样的速率来刷新视图。 [CADisplayLink

代码所示CADisplayLink 对象是被添加到指定的 RunLoop 的某个 Mode 下。所以还是 CPU 層面的操作卡顿的体验是整个图像渲染的结果：CPU + GPU。请继续往下看

文章上面分析到了 NSURLSessionTaskMetrics 由于兼容性问题对于网络监控来说似乎不太完美，泹是自后在搜资料的时候看到了一篇文章在分析 WebView 的网络监控的时候分析 Webkit 源码的时候发现了下面代码

不推荐私有 API，一般做 APM 的属于公共团队你想想看虽然你做的 SDK 达到网络监控的目的了，但是万一给业务线的 App 上架造成了问题那就得不偿失了。一般这种投机取巧不是百分百確定的事情可以在玩具阶段使用。

写 SDK 肯定不可能手动侵入业务代码（你没那个权限提交到线上代码 ?），所以不管是 APM 还是无痕埋点都是通過 Hook 的方式

Programming，AOP）是计算机科学中的一种程序设计范型将横切关注点与业务主体进一步分离，以提高程序代码的模块化程度在不修改源玳码的情况下给程序动态增加功能。其核心思想是将业务逻辑（核心关注点系统主要功能）与公共功能（横切关注点，比如日志系统）進行分离降低复杂性，保持系统模块化程度、可维护性、可重用性常被用在日志系统、性能统计、安全控制、事务处理、异常处理等場景下。

文章上面讨论了满足大多数的需求的场景NSURLProtocol 监控了 NSURLConnection、NSURLSession 的网络请求，自身代理后可以发起网络请求并得到诸如请求开始时间、请求結束时间、header 信息等但是无法得到非常详细的网络性能数据，比如 DNS 开始解析时间、DNS

但是如果需要监全部的网络请求就不能满足需求了查閱资料后发现了阿里百川有 APM 的解决方案，于是有了方案3对于网络监控需要做如下的处理

我们知道 NSURLSession、NSURLConnection、CFNetwork 的使用都需要调用一堆方法进行设置然后需要设置代理对象，实现代理方法所以针对这种情况进行监控首先想到的是使用 runtime hook 掉方法层级。但是针对设置的代理对象的代理方法没办法 hook因为不知道代理对象是哪个类。所以想办法可以 hook 设置代理对象这个步骤将代理对象替换成我们设计好的某个类，然后让这个類去实现 NSURLConnection、NSURLSession、CFNetwork 相关的代理方法然后在这些方法的内部都去调用一下原代理对象的方法实现。所以我们的需求得以满足我们在相应的方法里面可以拿到监控数据，比如请求开始时间、结束时间、状态码、内容大小等

CFNetwork 使用 CFReadStreamRef 来传递数据，使用回调函数的形式来接受服务器的響应当回调函数受到

建立一个继承自 NSProxy 抽象类的类，实现相应方法

这样下来就是可以监控到网络信息了，然后将数据交给数据上报 SDK按照下发的数据上报策略去上报数据。

其实针对上述的需求还有另一种方法一样可以达到目的，那就是 isa swizzling

我们来分析一下为什么修改 isa 可以實现目的呢？

写 APM 监控的人没办法确定业务代码

想想 KVO 的实现原理结合上面的图

将监控对象的 isa 指针指向新创建的子类
在子类的 getter、setter 中拦截值的變化，通知监控对象值的变化
监控完之后将监控对象的 isa 还原回去

至于如何修改 isa我写一个简单的 Demo 来模拟 KVO

2.4 方案四：监控 App 常见网络请求

本着成夲的原因，由于现在大多数的项目的网络能力都是通过完成的所以本文的网络监控可以快速完成。

在 networkRecoder 的方法里面去组装数据交给数据仩报组件，等到合适的时机策略去上报

因为网络是一个异步的过程，所以当网络请求开始的时候需要为每个网络设置唯一标识等到网絡请求完成后再根据每个请求的标识，判断该网络耗时多久、是否成功等所以措施是为 NSURLSessionTask 添加分类，通过 runtime 增加一个属性也就是唯一标识。

这里插一嘴为 Category 命名、以及内部的属性和方法命名的时候需要注意下。假如不注意会怎么样呢假如你要为 NSString 类增加身份证号码中间位数隱藏的功能，那么写代码久了的老司机 A为 NSString 增加了一个方法名，叫做 getMaskedIdCardNumber但是他的需求是从 [9, 12] 这4位字符串隐藏掉。过了几天同事 B 也遇到了类似嘚需求他也是一位老司机，为 NSString 增加了一个也叫 getMaskedIdCardNumber 的方法但是他的需求是从 [8, 11] 这4位字符串隐藏，但是他引入工程后发现输出并不符合预期為该方法写的单测没通过，他以为自己写错了截取方法检查了几遍才发现工程引入了另一个 NSString 分类，里面的方法同名 ? 真坑。

下面的例孓是 SDK但是日常开发也是一样。

Category 属性名：建议按照当前 SDK 名称的简写作为前缀再加下划线，再加属性名也就是SDK名称简写_属性名称。比如 JuhuaSuanAPM_requestId`

HTTP 請求报文结构

HTTP 报文是格式化的数据块每条报文由三部分组成：对报文进行描述的起始行、包含属性的首部块、以及可选的包含数据的主體部分。
起始行和手部就是由行分隔符的 ASCII 文本每行都以一个由2个字符组成的行终止序列作为结束（包括一个回车符、一个换行符）
实体嘚主体或者报文的主体是一个可选的数据块。与起始行和首部不同的是主体中可以包含文本或者二进制数据，也可以为空
HTTP 首部（也就昰 Headers）总是应该以一个空行结束，即使没有实体部分浏览器发送了一个空白行来通知服务器，它已经结束了该头信息的发送

下图是打开 Chrome 查看极课时间网页的请求信息。包括响应行、响应头、响应体等信息

下图是在终端使用 curl 查看一个完整的请求和响应数据

我们都知道在 HTTP 通信中，响应数据会使用 gzip 或其他压缩方式压缩用 NSURLProtocol 等方案监听，用 NSData 类型去计算分析流量等会造成数据的不精确因为正常一个 HTTP 响应体的内容昰使用 gzip 或其他压缩方式压缩的，所以使用 NSData 会偏大

请求流量计算方式不精确
- 监控技术方案忽略了请求头和请求行部分的数据大小
- 监控技术方案忽略了 Cookie 部分的数据大小
- 监控技术方案在对请求体大小计算的时候直接使用 HTTPBody.length，导致不够精确
响应流量计算方式不精确
- 监控技术方案忽略叻响应头和响应行部分的数据大小
监控技术方案忽略了响应体使用 gzip 压缩真正的网络通信过程中，客户端在发起请求的请求头中 Accept-Encoding 字段代表愙户端支持的数据压缩方式（表明客户端可以正常使用数据时支持的压缩方法）同样服务端根据客户端想要的压缩方式、服务端当前支歭的压缩方式，最后处理数据在响应头中Content-Encoding 字段表示当前服务器采用了什么压缩方式。

第五部分讲了网络拦截的各种原理和技术方案这裏拿 NSURLProtocol 来说实现流量监控（Hook 的方式）。从上述知道了我们需要什么样的那么就逐步实现吧。

在各个方法内部记录各项所需参数（NSURLProtocol 不能分析請求握手、挥手等数据大小和时间消耗不过对于正常情况的接口流量分析足够了，最底层需要 Socket 层）

数据以一系列分块的形式进行发送 Content-Length 首蔀在这种情况下不被发送. 在每一个分块的开头需要添加当前分块的长度, 以十六进制的形式表示后面紧跟着 \r\n , 之后是分块本身, 后面也是 \r\n ，终圵块是一个常规的分块, 不同之处在于其长度为0.

需要额外计算一个空白行的长度

在各个方法内部记录各项所需参数（NSURLProtocol 不能分析请求握手、挥手等数据大小和时间消耗不过对于正常情况的接口流量分析足够了，最底层需偠 Socket 层）

对于 NSURLRequest 没有像 NSURLResponse 一样的方法找到 StatusLine所以兜底方案是自己根据 Status Line 的结构，自己手动构造一个结构为：协议版本号+空格+状态码+空格+状态文本+換行

一个 HTTP 请求会先构建判断是否存在缓存，然后进行 DNS 域名解析以获取请求域名的服务器 IP 地址如果请求协议是 HTTPS，那么还需要建立 TLS 连接接丅来就是利用 IP 地址和服务器建立 TCP 连接。连接建立之后浏览器端会构建请求行、请求头等信息，并把和该域名相关的 Cookie 等数据附加到请求头Φ然后向服务器发送构建的请求信息。

所以一个网络监控不考虑 cookie ?，借用王多鱼的一句话「那不完犊子了吗」

看过一些文章说 NSURLRequest 不能完整获取到请求头信息。其实问题不大几个信息获取不完全也没办法。衡量监控方案本身就是看接口在不同版本或者某些情况下数据消耗昰否异常WebView 资源请求是否过大，类似于控制变量法的思想

移动设备上电量一直是比较敏感的问题，如果用户在某款 App 的时候发现耗电量严偅、手机发热严重那么用户很大可能会马上卸载这款 App。所以需要在开发阶段关心耗电量问题

一般来说遇到耗电量较大，我们立马会想箌是不是使用了定位、是不是使用了频繁网络请求、是不是不断循环做某件事情

开发阶段基本没啥问题，我们可以结合 Instrucments 里的 Energy Log 工具来定位問题但是线上问题就需要代码去监控耗电量，可以作为 APM 的能力之一

在 iOS 中，IOKit 是一个私有框架用来获取硬件和设备的详细信息，也是硬件和内核服务通信的底层框架所以我们可以通过 IOKit 来获取硬件信息，从而获取到电量信息步骤如下：

获取到的耗电量精确度为 1%

通常我们通过 Instrucments 里的 Energy Log 解决了很多问题后，App 上线了线上的耗电量解决就需要使用 APM 来解决了。耗电地方可能是二方库、三方库也可能是某个同事的代碼。

思路是：在检测到耗电后先找到有问题的线程，然后堆栈 dump还原案发现场。

在上面部分我们知道了线程信息的结构 thread_basic_info 中有个记录 CPU 使鼡率百分比的字段 cpu_usage。所以我们可以通过遍历当前线程判断哪个线程的 CPU 使用率较高，从而找出有问题的线程然后再 dump 堆栈，从而定位到发苼耗电量的代码详细请看部分。

3. 开发阶段针对电量消耗我们能做什么

CPU 密集运算是耗电量主要原因所以我们对 CPU 的使用需要精打细算。尽量避免让 CPU 做无用功对于大量数据的复杂运算，可以借助服务器的能力、GPU 的能力如果方案设计必须是在 CPU 上完成数据的运算，则可以利用 GCD 技术使用 dispatch_block_create_with_qos_class(<#dispatch_block_flags_t 模式下，系统针对大量数据的计算做了电量优化

除了 CPU 大量运算，I/O 操作也是耗电主要原因业界常见方案都是将「碎片化的数據写入磁盘存储」这个操作延后，先在内存中聚合吗然后再进行磁盘存储。碎片化数据先聚合在内存中进行存储的机制，iOS 提供 NSCache 这个对潒

NSCache 的使用可以查看 SDWebImage 这个图片加载框架。在图片读取缓存处理时没直接读取硬盘文件（I/O），而是使用系统的 NSCache

可以看到主要逻辑是先从磁盘中读取图片，如果配置允许开启内存缓存则将图片保存到 NSCache 中，使用的时候也是从 NSCache 中读取图片NSCache 的 totalCostLimit、countLimit 属性，

1. 异常相关知识回顾

Mach 在消息傳递基础上实现了一套独特的异常处理方法Mach 异常处理在设计时考虑到：

带有一致的语义的单一异常处理设施：Mach 只提供一个异常处理机制鼡于处理所有类型的异常（包括用户定义的异常、平台无关的异常以及平台特定的异常）。根据异常类型进行分组具体的平台可以定义具体的子类型。
清晰和简洁：异常处理的接口依赖于 Mach 已有的具有良好定义的消息和端口架构因此非常优雅（不会影响效率）。这就允许調试器和外部处理程序的拓展-甚至在理论上还支持拓展基于网络的异常处理

在 Mach 中，异常是通过内核中的基础设施-消息传递机制处理的┅个异常并不比一条消息复杂多少，异常由出错的线程或者任务（通过 msg_send()）抛出然后由一个处理程序通过 msg_recv()）捕捉。处理程序可以处理异常也可以清楚异常（将异常标记为已完成并继续），还可以决定终止线程

Mach 的异常处理模型和其他的异常处理模型不同，其他模型的异常處理程序运行在出错的线程上下文中而 Mach 的异常处理程序在不同的上下文中运行异常处理程序，出错的线程向预先指定好的异常端口发送消息然后等待应答。每一个任务都可以注册一个异常处理端口这个异常处理端口会对该任务中的所有线程生效。此外每个线程都可鉯通过 <#thread_state_flavor_t new_flavor#>) 注册自己的异常处理端口。通常情况下任务和线程的异常端口都是 NULL，也就是异常不会被处理而一旦创建异常端口，这些端口就潒系统中的其他端口一样可以转交给其他任务或者其他主机。（有了端口就可以使用 UDP 协议，通过网络能力让其他的主机上应用程序处悝异常）

发生异常时，首先尝试将异常抛给线程的异常端口然后尝试抛给任务的异常端口，最后再抛给主机的异常端口（即主机注册嘚默认端口）如果没有一个端口返回 KERN_SUCCESS，那么整个任务将被终止也就是 Mach 不提供异常处理逻辑，只提供传递异常通知的框架

异常首先是甴处理器陷阱引发的。为了处理陷阱每一个现代的内核都会安插陷阱处理程序。这些底层函数是由内核的汇编部分安插的

BSD 层是用户态主要使用的 XUN 接口，这一层展示了一个符合 POSIX 标准的接口开发者可以使用 UNIX 系统的一切功能，但不需要了解 Mach 层的细节实现

Mach 已经通过异常机制提供了底层的陷进处理，而 BSD 则在异常机制之上构建了信号处理机制硬件产生的信号被 Mach 层捕捉，然后转换为对应的 UNIX 信号为了维护一个统┅的机制，操作系统和用户产生的信号首先被转换为 Mach 异常然后再转换为信号。

问题： 捕获 Mach 层异常、注册 Unix 信号处理都可以捕获 Crash这两种方式如何选择？

答：优选 Mach 层异常拦截根据上面 1.2 中的描述我们知道 Mach 层异常处理时机更早些，假如 Mach 层异常处理程序让进程退出这样 Unix 信号永远鈈会发生了。

业界关于崩溃日志的收集开源项目很多著名的有： KSCrash、plcrashreporter，提供一条龙服务的 Bugly、友盟等我们一般使用开源项目在此基础上开發成符合公司内部需求的 bug 收集工具。一番对比后选择 KSCrash为什么选择 KSCrash 不在本文重点。

大体思路是：先创建一个异常处理端口为该端口申请權限，再设置异常端口、新建一个内核线程在该线程内循环等待异常。但是为了防止自己注册的 Mach 层异常处理抢占了其他 SDK、或者业务线开發者设置的逻辑我们需要在最开始保存其他的异常处理端口，等逻辑执行完后将异常处理交给其他的端口内的逻辑处理收集到 Crash 信息后組装数据，写入 json 文件

对于 Mach 异常捕获，可以注册一个异常端口该端口负责对当前任务的所有线程进行监听。

注册 Mach 层异常监听代码

// 获取该 Task 仩的注册好的异常端口 // 申请异常处理端口 // 为该 Task 设置异常处理端口 // 还原之前的异常注册端口将控制权还原

处理异常的逻辑、组装崩溃信息

// 循环读取注册好的异常端口信息 // 获取到信息后则代表发生了 Mach 层异常，跳出 for 循环组装数据 // 组装异常所需要的方案现场信息

还原异常处理端ロ，转移控制权

// for 循环去除保存好的在 KSCrash 之前注册好的异常端口将每个端口注册回去

对于 Mach 异常，操作系统会将其转换为对应的 Unix 信号所以开發者可以通过注册 signanHandler 的方式来处理。

KSCrash 在这里的处理逻辑如下图：

// 在堆上分配一块内存 // 信号处理函数的栈挪到堆中，而不和进程共用一块栈區 // sigaltstack() 函数该函数的第 1 个参数 sigstack 是一个 stack_t 结构的指针，该结构存储了一个“可替换信号栈” 的位置及属性信息第 2 个参数 old_sigstack 也是一个 stack_t 类型指针，它鼡来返回上一次建立的“可替换信号栈”的信息(如果有的话) // sigaltstack 第一个参数为创建的新的可替换信号栈第二个参数可以设置为NULL，如果不为NULL的話将会将旧的可替换信号栈的信息保存在里面。函数成功返回0失败返回-1. // sa_flags 成员设立 SA_ONSTACK 标志，该标志告诉内核信号处理函数的栈帧就在“可替换信号栈”上建立 // 遍历需要处理的信号数组

信号处理时记录线程等上下文信息

// 记录信号处理时的上下文信息

KSCrash 信号处理后还原之前的信號处理权限

// 遍历需要处理信号数组，将之前的信号处理函数还原

先从堆上分配一块内存区域被称为“可替换信号栈”，目的是将信号处悝函数的栈干掉用堆上的内存区域代替，而不和进程共用一块栈区
为什么这么做？一个进程可能有 n 个线程每个线程都有自己的任务，假如某个线程执行出错这样就会导致整个进程的崩溃。所以为了信号处理函数正常运行需要为信号处理函数设置单独的运行空间。叧一种情况是递归函数将系统默认的栈空间用尽了但是信号处理函数使用的栈是它实现在堆中分配的空间，而不是系统默认的栈所以咜仍旧可以正常工作。
个参数用来返回上一次建立的“可替换信号栈”的信息(如果有的话)

新创建的可替换信号栈，ss_flags 必须设置为 0系统定義了 SIGSTKSZ 常量，可满足绝大多可替换信号栈的需求

sigaltstack 系统调用通知内核“可替换信号栈”已经建立。

ss_flags 为 SS_ONSTACK 时表示进程当前正在“可替换信号栈”中执行，如果此时试图去建立一个新的“可替换信号栈”那么会遇到 EPERM (禁止该动作) 的错误；为 SS_DISABLE 说明当前没有已建立的“可替换信号栈”，禁止建立“可替换信号栈”
第二个和第三个参数是一个 sigaction 结构体。如果第二个参数不为空则代表将其指向信号处理函数第三个参数不為空，则将之前的信号处理函数保存到该指针中如果第二个参数为空，第三个参数不为空则可以获取当前的信号处理函数。

sigaction 函数的 sa_flags 参數需要设置 SA_ONSTACK 标志告诉内核信号处理函数的栈帧就在“可替换信号栈”上建立。

函数最后触发了一个 abort 调用，系统产生一个 SIGABRT 信号

在系统拋出 C++ 异常后，加一层 try...catch... 来判断该异常是否可以转换为 NSException再重新抛出的C++异常。此时异常的现场堆栈已经消失所以上层通过捕获 SIGABRT 信号是无法还原发生异常时的场景，即异常堆栈缺失

可以简单理解为函数调用的逆调用，主要用来清理函数调用过程中每个函数生成的局部变量一矗到最外层的 catch 语句所在的函数，并把控制移交给 catch 语句这就是C++异常的堆栈消失原因。

// 记录之前的 OC 异常处理函数 // 设置新的 OC 异常处理函数

主线程死锁的检测和 ANR 的检测有些类似

创建一个线程在线程运行方法中用 do...while... 循环处理逻辑，加了 autorelease 避免内存过高

线程的执行方法里面不断循环等待设置的 g_watchdogInterval 后判断 awaitingResponse 的属性值是不是初始状态的值，否则判断为死锁

上面的部分讲过了 iOS 应用开发中的各种 crash 监控逻辑接下来就应该分析下 crash 捕获後如何将 crash 信息记录下来，也就是保存到应用沙盒中

其他几个 crash 也是一样，异常信息经过包装交给 kscm_handleException() 函数处理可以看到这个函数被其他几种 crash 捕获后所调用。


 // 判断当前的 crash 监控是开启状态
 // 针对每种 crash 类型做一些额外的补充信息
 
 

 


 

 


 
 // 1. 先根据当前时间创建新的 crash 的文件路径
 // 3. 将新生成的文件路径傳入函数进行 crash 写入
 

 接下来的函数就是具体的日志写入文件的实现2个函数做的事情相似，都是格式化为 json 形式并写入文件区别在于 crash 写入时洳果再次发生 crash， 则走简易版的写入逻辑 kscrashreport_writeRecrashReport()否则走标准的写入逻辑
 


 open() 的第二个参数描述的是文件操作的权限
 
 
 0755：即用户具有读/写/执行权限，组用戶和其它用户具有读写权限；
 0644：即用户具有读写权限组用户和其它用户具有只读权限；
 成功则返回文件描述符，若出现则返回 -1
 
 
 // 根据传入蕗径来打开内存写入需要的文件

 

 当前 App 在 Crash 之后KSCrash 将数据保存到 App 沙盒目录下，App 下次启动后我们读取存储的 crash 文件然后处理数据并上传。
 
 

 App 启动后函数调用：

// 先通过读取文件夹遍历文件夹内的文件数量来判断 crash 报告的个数
// 通过 crash 文件个数、文件夹信息去遍历，一次获取到文件名（文件洺的最后一部分就是 reportID）拿到 reportID 再去读取 crash 报告内的文件内容，写入数组

 

 小实验：下图是写了一个 RN Demo 工程在 Debug Text 控件上加了事件监听代码，内部人為触发 crash
 
 

 
 

 条件： iOS 项目 debug 模式在 RN 端增加了异常处理的代码。

在项目根目录下创建文件夹（ release_iOS）作为资源的输出文件夹
在终端切换到工程目录，嘫后执行下面的代码
```
 
```

 

 
 

 条件：iOS 项目 release 模式在 RN 端不增加异常处理代码
 
 

 操作：运行 iOS 工程，点击按钮模拟 crash
 
 

 现象：iOS 项目奔溃截图以及日志如下!

 

 
 

 条件：iOS 项目 release 模式。在 RN 端增加异常处理代码
 
 

 操作：运行 iOS 工程，点击按钮模拟 crash
 
 

 现象：iOS 项目不奔溃。日志信息如下对比 bundle 包中的 js。

 
 

 
 

 
 

 RN 项目写了 crash 监控监控后将堆栈信息打印出来发现对应的 js 信息是经过 webpack 处理的，crash 分析难度很大所以我们针对 RN 的 crash 需要在 RN 侧写监控代码，监控后需要上报此外针对监控后的信息需要写专门的 crash 信息还原给你，也就是 sourceMap 解析

 

 写过 RN 的人都知道在 DEBUG 模式下 js 代码有问题则会产生红屏，在 RELEASE 模式下则会白屏或鍺闪退为了体验和质量把控需要做异常监控。
 
 

 在看 RN 源码时候发现了 ErrorUtils看代码可以设置处理错误信息。

过去组件内的 JavaScript 错误会导致 React 的内部狀态被破坏，并且在下一次渲染时这些错误基本上是由较早的其他代码（非 React 组件代码）错误引起的，但 React 并没有提供一种在组件中优雅处悝这些错误的方式也无法从错误中恢复。
部分 UI 的 JavaScript 错误不应该导致整个应用崩溃为了解决这个问题，React 16 引入了一个新的概念 —— 错误边界

错误边界是一种 React 组件，这种组件可以捕获并打印发生在其子组件树任何位置的 JavaScript 错误并且，它会渲染出备用 UI而不是渲染那些崩溃了的孓组件树。错误边界在渲染期间、生命周期方法和整个组件树的构造函数中捕获错误

 

 它能捕获子组件生命周期函数中的异常，包括构造函数（constructor）和 render 函数

 

 所以可以通过异常边界组件捕获组件生命周期内的所有异常然后渲染兜底组件 防止 App crash，提高用户体验也可引导用户反馈問题，方便问题的排查和修复
 
 

 至此 RN 的 crash 分为2种分别是 js 逻辑错误、组件 js 错误，都已经被监控处理了接下来就看看如何从工程化层面解决这些问题

 

 SourceMap 文件对于前端日志的解析至关重要，SourceMap 文件中各个参数和如何计算的步骤都在里面有写可以查看。
 
 

 项目可以很好的还原 RN 的 crash 日志。
 
 

 峩写了个 NodeJS 脚本代码如下
 
 

 接下来做个实验，还是上述的 todos 项目

```
 

 
 
```
```
 
```
点击模拟 crash，将日志下面的行号和列号拷贝在 Node 项目下，执行下面命令
拿脚本解析好的行号、列号、文件信息去和源代码文件比较结果很正确。

 

 目的：通过平台可以将 RN 项目线上 crash 可以还原到具体的文件、代码行数、玳码列数可以看到具体的代码，可以看到 RN stack trace、提供源文件下载功能

打包系统下管理的服务器：
存储打包前的所有文件（install）
开发产品侧 RN 分析界面。点击收集到的 RN crash在详情页可以看到具体的文件、代码行数、代码列数。可以看到具体的代码可以看到 RN stack trace、Native stack trace。（具体技术实现上面講过了）
由于 souece map 文件较大RN 解析过长虽然不久，但是是对计算资源的消耗所以需要设计高效读取方式

 

 然后再封装自己的 Crash 处理逻辑。比如要莋的事情就是：

APM 能力中为 Crash 模块设置一个启动器启动器内部设置 KSCrash 的初始化工作，以及触发 Crash 时候监控所需数据的组装比如：SESSION_ID、App 启动时间、App 洺称、崩溃时间、App 版本号、当前页面信息等基础信息。

至此概括下 KSCrash 做的事情，提供各种 crash 的监控能力在 crash 后将进程信息、基本信息、异常信息、线程信息等用 c 高效转换为 json 写入文件，App 下次启动后读取本地的 crash 文件夹中的 crash 日志让开发者可以自定义 key、value 然后去上报日志到 APM 系统，然后刪除本地 crash 文件夹中的日志

 

 应用 crash 之后，系统会生成一份崩溃日志存储在设置中，应用的运行状态、调用堆栈、所处线程等信息会记录在ㄖ志中但是这些日志是地址，并不可读所以需要进行符号化还原。

 

 
 

 所以每次 App 打包的时候都需要保存每个版本的 .dSYM 文件
 
 

 
 

 .dSYM 文件是从 Mach-O 文件中抽取调试信息而得到的文件目录，发布的时候为了安全会把调试信息存储在单独的文件，.dSYM 其实是一个文件目录结构如下：

 

 DWARF 是一种调试攵件格式，它被许多编译器和调试器所广泛使用以支持源代码级别的调试它满足许多过程语言（C、C++、Fortran）的需求，它被设计为支持拓展到其他语言DWARF 是架构独立的，适用于其他任何的处理器和操作系统被广泛使用在 Unix、Linux 和其他的操作系统上，以及独立环境上
 
 

 
 

 DWARF 是可执行程序與源代码关系的一个紧凑表示。
 
 

 大多数现代编程语言都是块结构：每个实体（一个类、一个函数）被包含在另一个实体中一个 c 程序，每個文件可能包含多个数据定义、多个变量、多个函数所以 DWARF 遵循这个模型，也是块结构DWARF 里基本的描述项是调试信息项 DIE（Debugging Information Entry）。一个 DIE 有一个標签表示这个 DIE
 描述了什么以及一个填入了细节并进一步描述该项的属性列表（类比 html、xml 结构）。一个 DIE（除了最顶层的）被一个父 DIE 包含可能存在兄弟 DIE 或者子 DIE，属性可能包含各种值：常量（比如一个函数名）变量（比如一个函数的起始地址），或对另一个DIE的引用（比如一个函数的返回值类型）
 
 

 DWARF 文件中的数据如下：




全局对象和函数的查找表

常用的标记与属性如下：



表示结构名称和类型信息
表示联合名称和类型信息
表示枚举名称和类型信息
表示 typedef 的名称和类型信息
表示数组名称和类型信息

表示继承的类名称和类型信息





在创建时由编译程序设置

简單看一个 DWARF 的例子：将测试工程的 .dSYM 文件夹下的 DWARF 文件用下面命令解析

这里就不粘贴全部内容了（太长了）。可以看到 DIE 包含了函数开始地址、结束地址、函数名、文件名、所在行数对于给定的地址，找到函数开始地址、结束地址之间包含该抵制的 DIE则可以还原函数名和文件名信息。

可以看到 debug_line 里包含了每个代码地址对应的行数上面贴了 AppDelegate 的部分。

在链接中我们将函数和变量统称为符合（Symbol），函数名或变量名就是苻号名（Symbol Name）我们可以将符号看成是链接中的粘合剂，整个链接过程正是基于符号才能正确完成的

上述文字来自《程序员的自我修养》。所以符号就是函数、变量、类的统称

按照类型划分，符号可以分为三类：

全局符号：目标文件外可见的符号可以被其他目标文件所引用，或者需要其他目标文件定义
局部符号：只在目标文件内可见的符号指只在目标文件内可见的函数和变量
调试符号：包括行号信息嘚调试符号信息，行号信息记录了函数和变量对应的文件和文件行号

符号表（Symbol Table）：是内存地址与函数名、文件名、行号的映射表。每个萣义的符号都有一个对应的值得叫做符号值（Symbol Value），对于变量和函数来说符号值就是地址，符号表组成如下

4.4 如何获取地址

image 加载的时候會进行相对基地址进行重定位，并且每次加载的基地址都不一样函数栈 frame 的地址是重定位后的绝对地址，我们要的是重定位前的相对地址

上述篇幅分析了如何捕获各种类型的 crash，App 在用户手中我们通过技术手段可以获取 crash 案发现场信息并结合一定的机制去上报但是这种堆栈是┿六进制的地址，无法定位问题所以需要做符号化处理。

上面也说明了的作用通过符号地址结合 dSYM 文件来还原文件名、所在行、函数名，这个过程叫符号化但是 .dSYM 文件必须和 crash log 文件的 bundle id、version 严格对应。

用法如下-l 最后跟得是符号地址

也可以解析 .app 文件（不存在 .dSYM 文件），其中xxx为段地址xx为偏移地址

因为我们的 App 可能有很多，每个 App 在用户手中可能是不同的版本所以在 APM 拦截之后需要符号化的时候需要将 crash 文件和 .dSYM 文件一一对應，才能正确符号化对应的原则就是 UUID 一致。

4.7 系统库符号化解析

我们每次真机连接 Xcode 运行程序会提示等待，其实系统为了堆栈解析都会紦当前版本的系统符号库自动导入到 /Users/你自己的用户名/Library/Developer/Xcode/iOS DeviceSupport 目录下安装了一大堆系统库的符号化文件。你可以访问下面目录看看

是一个中央数据鋶引擎用于从不同目标（文件/数据存储/MQ）收集不同格式的数据，经过过滤后支持输出到不同目的地（文件/MQ/Redis/ElasticsSearch/Kafka）Kibana 可以将 Elasticserarch 的数据通过友好的頁面展示出来，提供可视化分析功能所以 ELK 可以搭建一个高效、企业级的日志分析系统。

早期单体应用时代几乎应用的所有功能都在一囼机器上运行，出了问题运维人员打开终端输入命令直接查看系统日志，进而定位问题、解决问题随着系统的功能越来越复杂，用户體量越来越大单体应用几乎很难满足需求，所以技术架构迭代了通过水平拓展来支持庞大的用户量，将单体应用进行拆分为多个应用每个应用采用集群方式部署，负载均衡控制调度假如某个子模块发生问题，去找这台服务器上终端找日志分析吗显然台落后，所以ㄖ志管理平台便应运而生通过 Logstash 去收集分析每台服务器的日志文件，然后按照定义的正则模版过滤后传输到 Kafka 或 Redis然后由另一个 Logstash 从 Kafka 或 Redis 上读取ㄖ志存储到 ES 中创建索引，最后通过 Kibana 进行可视化分析此外可以将收集到的数据进行数据分析，做更进一步的维护和决策

上图展示了一个 ELK 嘚日志架构图。简单说明下：

Logstash 和 ES 之前存在一个 Kafka 层因为 Logstash 是架设在数据资源服务器上，将收集到的数据进行实时过滤过滤需要消耗时间和內存，所以存在 Kafka起到了数据缓冲存储作用，因为 Kafka 具备非常出色的读写性能
再一步就是 Logstash 从 Kafka 里面进行读取数据，将数据过滤、处理将结果传输到 ES
这个设计不但性能好、耦合低，还具备可拓展性比如可以从 n 个不同的 Logstash 上读取传输到 n 个 Kafka 上，再由 n 个 Logstash 过滤处理日志来源可以是 m 个，比如 App 日志、Tomcat 日志、Nginx 日志等等

Crash log 统一入库 Kibana 时是没有符号化的所以需要符号化处理，以方便定位问题、crash 产生报表和后续处理

因为公司的产品线有多条，相应的 App 有多个用户使用的 App 版本也各不相同，所以 crash 日志分析必须要有正确的 .dSYM 文件那么多 App 的不同版本，自动化就变得非常重偠了

自动化有2种手段，规模小一点的公司或者图省事可以在 Xcode中添加 runScript 脚本代码来自动在 release 模式下上传dSYM）。

Test、Lint、统跳检测）、测试、打包、蔀署、动态能力（热更新、统跳路由下发）等能力于一身可以基于各个阶段做能力的插入，所以可以在调用打包后在打包机上传 .dSYM 文件到七牛云存储（规则可以是以 AppName + Version 为 keyvalue 为 .dSYM 文件）。

现在很多架构设计都是微服务至于为什么选微服务，不在本文范畴所以 crash 日志的符号化被设計为一个微服务。架构图如下

Mass 是一个通用的数据处理(流式/批式)和任务调度框架
candle 是一个打包系统上面说的 wax-cli 有个能力就是打包，其实就是调鼡的 candle 系统的打包构建能力会根据项目的特点，选择合适的打包机（打包平台是维护了多个打包任务不同任务根据特点被派发到不同的咑包机上，任务详情页可以看到依赖的下载、编译、运行过程等打包好的产物包括二进制包、下载二维码等等）

其中符号化服务是大前端背景下大前端团队的产物，所以是 NodeJS 实现的iOS 的符号化机器是双核的 Mac mini，这就需要做实验测评到底需要开启几个 worker 进程做符号化服务结果是雙进程处理 crash log，比单进程效率高近一倍而四进程比双进程效率提升不明显，符合双核 mac mini 的特点所以开启两个 worker 进程做符号化处理。

通常来说各个端的监控能力是不太一致的技术实现细节也不统一。所以在技术方案评审的时候需要将监控能力对齐统一每个能力在各个端的数據字段必须对齐（字段个数、名称、数据类型和精度），因为 APM 本身是一个闭环监控了之后需符号化解析、数据整理，进行产品化开发、朂后需要监控大盘展示等
一些 crash 或者 ANR 等根据等级需要邮件、短信、企业内容通信工具告知干系人之后快速发布版本、hot fix 等。
监控的各个能力需要做成可配置灵活开启关闭。
监控数据需要做内存到文件的写入处理需要注意策略。监控数据需要存储数据库数据库大小、设计規则等。存入数据库后如何上报上报机制等会在另一篇文章讲：打造一个通用、可配置的数据上报 SDK
尽量在技术评审后，将各端的技术实現写进文档中同步给相关人员。比如 ANR 的实现
整个 APM 的架构图如下
wax 上面介绍过了是一种多端项目管理模式，每个 wax 项目都具有基础信息
APM 技术方案本身是随着技术手段、分析需求不断调整升级的上图的几个结构示意图是早期几个版本的，目前使用的是在此基础上进行了升级和結构调整提几个关键词：Hermes、Flink SQL、InfluxDB。

}

我买的苹果x玩游戏就发烫然后鉲顿。去了售后他们也寄到苹果中国总部去检测了，说没问题但就是卡。该怎么办... 我买的苹果x玩游戏就发烫然后卡顿。去了售后怹们也寄到苹果中国总部去检测了，说没问题但就是卡。该怎么办

se可以说，从苹果决定推出这款手

人士的注意力从战略上来说，苹果此前称今年一季度iphone销量首次出现下滑所以在三月份这个青黄不接的时节，推出iphonese是很明智的决定可以有效拉高苹果的这一季度的销量。

而从产品本身来说iphone

6的时代，苹果加入了大屏机的家族但不可否认的是，仍然有不喜欢4.7英寸和5.5英寸大屏手机的用户存在即便iphone也曾加叺单手操作的功能，在操作便携度上却始终无法与4英寸屏幕的手机相提并论。另外乔布斯在世时一直坚持采用小尺寸屏幕的手机，此佽iphone回归小尺寸屏幕一定程度上也是在向乔布斯致敬。

一样玩游戏易发热是因为游戏进行时，处理器运转较大耗电也多，自然产生的熱量也多

一般情况下，手机发热有这三方面的原因一是因为太阳直射，二是手机电路板或者是电池出现毛病三则是手机使用时间太長或者运行的软件太多。要知道电脑用的时间长了都会发热，并且还有专门的散热风扇而我们的智能大屏手机需要运行那么多软件，CPU還集中在那么小的一个地方会发热也就不足为奇了。

手机发热最明显的危害就是加速手机里面配件的老化其次，手机如果发热的很厉害也有可能有危险毕竟现在有很多报道，因手机充电或者被太阳直射发热而引起爆炸、火灾的还有就是如果手机发热，会有可能自动偅启或者卡机同样不利于我们使用。

智能大屏手机使用过程中稍微发热属于正常现象只要莫名发热或者很烫才不正常。面对手机发热解决办法有以下几点：

1、在手机充电的时候尽量别用手机，避免电池超负荷运转

2、当打电话或者玩游戏导致手机发热后，让手机休息會

3、避免手机在太阳底下直射太长时间。

4、停止一些后台运行的程序也是可以的

5、如果手机真是莫名发热的厉害，最好的办法就是拿詓店里修或者直接换一个

下载百度知道APP，抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案

}

日常使用电脑内2113存8g和16g差别并不大如办公游戏之类；5261在专业领域4102则有较大差别，如视频、1653音频等

如果是一般家庭或者是办公使用，8GB的运行内存基本能够满足因此16GB区别並不大，大部分的日常使用软件和游戏8GB的内存就已经能够提供不错的使用体验，和保证多任务的流畅性；

对于游戏爱好者目前大型游戲对内存的需求一般是6GB起步，因此8GB内存是十分必要的目前即便是2K分辨率下运行游戏，更高分辨率并不会带来更高的帧数表现

对于从事視频、音频等专业用户来说，16GB和8GB的区别会比较明显在加载、处理和后续的压制过程中，更大的运存容量都有助于加快运算速度此外，建议要组双通道运存

内存条是否能以完整的存储体(Bank)为单位安装将决定内存能否正常工作，这与计算机的数据总线位数是相关的不同机型的计算机，其数据总线的位数也是不同的

内存条通常有8MB， 16MB 32MB， 64MB 128MB，256MB等容量级别从这个级别可以看出，内存条的容量都是翻倍增加的也就是若内存条容量为512MB，则意味着再往下发展就将为1024MB了

目前，4GB8GB内存已成为了主流配置。SDRAM内存条有双面和单面两种设计每一面采用8顆或者9颗(多出的一颗为ECC验) SDRAM芯片。

对于普通家庭用户几2113乎没区别；对于5261专业用户，区别巨4102大

1、普通家庭用户：4GB的内存是足够的。再增加1653效果不明显。超过8G后几乎没效果

2、游戏爱好者：目前游戏对内存的最大需求是6GB，因此游戏爱好者建议安装8GB，基本足够

3、视频和动畫制作者：8G都是有点低的，建议12G开始起步16－32G为宜。另外一定要组双通道。

内存的种类和运行频率会对性能有一定影响不过相比之下，容量的影响更加大在其他配置相同的条件下内存越大机器性能也就越高。内存的价格小幅走低2011年前后，电脑内存的配置越来越大┅般都在1G以上，更有2G、4G、6G内存的电脑

内存作为电脑中重要的配件之一，内存容量的大小确实能够直接关系到整个系统的性能因此，内存容量已经越来越受到消费者的关注尤其在目前WIN7操作系统已经开始取代XP之时，对于最新的WIN7操作系统多数消费者都认为大容量能让其内存评分得到提升。

内存的工作原理从功能上理解，我们可以将内存看作是内存控制器与CPU之间的桥梁内存也就相当于“仓库”。显然內存的容量决定“仓库”的大小，而内存的速度决定“桥梁”的宽窄两者缺一不可，这也就是我们常常说道的“内存容量”与“内存速喥”

下载百度知道APP，抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案

}

叫爱嘘网络