Github主页 CSDN主页

9 高速缓冲存储器（Cache）

大部分是集成在CPU内部的，存放的还是主存内的信息，是主存内部分信息的副本

如果不在cache中，那么会将包含这个字的固定大小的块读入cache，然后再从cache中把这个字传给CPU

cache中除了要存内容，还得存这个内容的位置，因为CPU是通过位置来访问主存中的内容的，而不关心其中的内容。

cache不是存放了完整的位置，而是通过tags标记来对应内容在内存中的位置

如果大部分时间都是未命中，那么使用cache后反而时间会更慢，而事实上cache很好的处理了内存墙问题，因此大部分情况应当是命中的

这是由于程序访问的局部性原理，即CPU总是会频繁的访问相同位置或者是相邻位置的内容：

注意这个块是事先就在内存中划分好了（哪一部分属于哪个块都是确定的），要哪个字时，只要把这个字的所在块搬过去，而不是临时从这个字开始再划分块

所以只要想要访问的字所属的块在cache中，那么这个字就在cache中，因此只要对每个块做一个标记（块号）就可以知道有没有命中

cache中每一行是一个块，记录了块的标记和块中的K个字

T_A的两个式子，是两种不同的理解，第一行是分为命中和未命中来理解，第二行是分成check检查阶段和到主存取数据阶段来理解的，一般第二行使用更多

Tc很快，Tm相对慢，因此Tc/Tm是比较小的值，所以p是相对很小时就能满足条件。但事实上这个条件虽然小也很难满足，因为cache容量远小于主存容量，p实际上按概率来算应该是cache的容量/主存容量，是非常小的，但之所以能满足，就是因为前面提到的局部性原理

Cache的设计要素

cache容量不是越大越好，也不是越小越好。

因为内存是以地址来寻找的，所以直接解码地址就能找到要的信息，而cache则是通过遍历来找的（遍历块的标号），所以如果cache很大的话，会导致遍历检查的时间增加，增大了T_c。
如果cache很小的话，则可能出现从内存中复制的新的块把原来cache中的块覆盖后，又需要原来的块中的内容，因此又需要从内存中复制到cache，浪费时间

cache中记录的是块号，块号要能反映地址

块内地址：如果一个块内有K个字节，那么地址的后log₂K位表示块内地址

而cache中分辨不同块的标记可以直接使用块号来作为标记，但这样会造成一些浪费（块号不是我们想要的信息），因此就要去想怎么尽可能缩短标记的长度

比如0~7块只能放到第一行，8~15块只能放到第二行，因此如果加载了第2个块，想再加载第3个块，那么第3个块会把第二个覆盖

如上图 $i = j m o d C$ 是间隔的把块规定放到同一行，而不是上面的连续的几个块都只能在一个行中，显然下面这种更合理，因为局部性原理，访问相邻块的概率更大，因此间隔的放，可以把连续的块都加载到cache中，而不会出现上面的覆盖情况

映射到同一行的块号（二进制表示）的后 $log_2C$ 位都是一样的

因此只要比较块号的前面 $log_2M-log_2C$ 位即可（M是块的数量，C是cache中行的数量）相当于把C个块当作一个组，只要记录这个组的地址即可

再看主存中一个具体的字节，它在主存的地址可以被分成三个部分：

优点：因为块映射到cache中的行的位置是固定的，因此检查时，只要去找这一行中有没有要的数据即可，而不必全部搜索一遍，所以T_c是固定的，不会因cache容量增大而使得T_c变大
缺点：抖动现象：如果要重复访问的两个块刚好映射到同一行，就会降低命中率，当两个块比较相邻（才可能被重复访问）时并被映射到同一行，说明cache比较小，即行数比较少时会出现这种情况。
因此直接映射适合大容量cache使用