首页
留言板
推荐
Allen知识库
Search
1
VMware vSphere系列教程-部署DC/DHCP/DNS(五)
21 阅读
2
最强链路监控系统推荐Pinpoint
21 阅读
3
PC新时代开启! DDR5内存标准正式发布
19 阅读
4
Ansible系列教程-常用模块(二)
13 阅读
5
将物理机迁移到VMware虚拟机(P2V)
13 阅读
VMware
vCloud
Horizon
vSphere
NSX
运维相关
Docker
Network
Zabbix
Ansible
Python
Microsoft
Mysql
Linux
Windows Server
登录
/
注册
Search
标签搜索
ansible
docker
zabbix
chatgpt
windows模板
linux模板
模板
k3
lede
openwrt
docker网络配置
清理微信好友
python清理微信好友
grafana
监控交换机
实施教程
ansible安装
ubuntu
acrh17路由固件
访问宽带猫
Allen
累计撰写
134
篇文章
累计收到
0
条评论
首页
栏目
VMware
vCloud
Horizon
vSphere
NSX
运维相关
Docker
Network
Zabbix
Ansible
Python
Microsoft
Mysql
Linux
Windows Server
页面
留言板
推荐
Allen知识库
搜索到
1
篇与
的结果
2020-05-18
黄氏刀法 眼花缭乱 NVIDIA官方确认7nm安培首发割了一刀
与此同时,新的核心则被叫做“A100 Tensor Core GPU”,突出张量核心的关键作用,而核心代号按惯例延续为GA100。GA100设计了8组GPC(GPU处理集群),每一组GPC里又分为8组TPC(纹理处理集群),而每组又分为两组SM(流式多处理器),然后每组SM包含64个FP32 CUDA核心(流处理器)。 这样一来,一颗完整的GA100芯片就一共有128组SM、8196个流处理器,而这种分组结构和以往的NVIDIA GPU架构是一致的。同时,每一组SM里还有4个第三代Tensor核心,整颗芯片内共计512个,外部则搭配六颗HBM2显存,每颗8GB,12个512-bit控制器,总位宽6144-bit。另外,二级缓存从6MB猛增至40MB,每组SM单元的共享内存从最多96KB增至164KB、寄存器容量还是256KB,但整颗芯片寄存器达到27MB。GA100芯片采用台积电第一代7nm(N7)工艺制造,核心面积达826平方毫米,相比上代12nm GV100仅增大了11平方毫米(0.13%),但晶体管数量从211亿个猛增至542亿个,多了接近1.6倍,同时功耗控制在400W(增加33%),可见新架构和新工艺的威力。如此庞大的核心在量产初期显然会受制于良品率问题,所以实际使用的A100核心未达成完整规格,但和以往简单屏蔽整组计算单元不同,这次砍得略有些复杂。GPC单元屏蔽了整整一组,但剩余的也并未全部开启,其中两组GPC也各自屏蔽了一个TPC(两组SM),导致总的SM单元为108个、流处理器为6912个、Tensor核心为432个。核心加速频率1410MHz,比前两代其实都低了,但整体性能在飞跃。显存也没有逃过刀法,只开启了五组HBM2,所以总容量为40GB,总位宽为5120-bit,频率1215MHz,带宽1555GB/s,比上代增加73%。 具体到每个SM单元,其中的Tensor核心数量虽然从8个减少到4个,但每一个每时钟周期都支持多达256个FP16FP FMA操作,合计就是1024个,相比伏特、图灵架构翻了一番。新的Tensor核心还支持对所有数据类型加速,包括FP16、BF16、TF32、FP64、INT8、INT4、Binary。更精细的专业细节这里就不展开了,你们也没啥兴趣。三代架构首发核心规模对比
2020年05月18日
0 阅读
0 评论
0 点赞