额……老铁们,我图吧老捡垃圾的了。

前作:【省流总结】龙芯3A6000深度评测:国产CPU的希望之星? 咱已经大致分析了3A6000这个视频中的内容和问题,本期是后日谈,主要谈谈一些关于上期的不同看法。

首先作为图吧垃圾佬看见极客湾的视频也在扯什么IPC=设计水平,龙芯IPC高主频上不去是因为工艺未来可期的龙芯网宣话术其实是相当不爽的。

用IPC衡量架构设计水平就好像世界上只有大核心一种设计一个路径,即使是图吧刚入门的小白都知道IPC只能代表同频性能水平和核心规模,代表不了什么架构设计水平。

隔壁UP1:以现有软件,不搞大核心死路一条,不是什么算法都能并行化的有些算法你改成多核并行的就和原版不太一样了,你怎么保证不影响使用

如果做小核心众核,那就不只是重新编译一下就能解决问题了,底层架构,开发流程全要改

垃圾佬:咱也不知道鲲鹏920单socket 64核是怎么用的隔壁UP1:服务器和桌面端能一样吗服务器上的软件更多考虑了服务器的多核心条件,而且企业大客户有钱,有条件整好的优化

垃圾佬:桌面端8核的D2000 kp920 kx6000反正也没耽误用,继续迭代的话搞出haswell水平的小核心类似N305也不是不能用吧

隔壁UP1:桌面端哪能分到这么多预算做优化,时间也不允许,产品经理动不动提各种离谱要求,完成kpi都开不及,都是直接套现有框架

垃圾佬:主要是工艺落后不做小核心怎么保证成本,3A6000卖1400是不是亏本隔壁UP1:楽,不至于

垃圾佬:那现在怎么还涨价了

隔壁UP1:d2000和kp920就不是一个段位的东西

垃圾佬:差不多吧,飞腾不是也有单socket64核

隔壁UP1:你要兆芯kx6000那个low逼ipc,得堆12核才能追上kp920-8[我想开了]

垃圾佬:不用16核就行,说明920也没达到haswell水平

隔壁UP1:?kx6000大概是三分之二的skylake(在不包含avx的cpu-z测试里是这样)

垃圾佬:这个水平记得比Geminilake只高点有限,反正八核打四核i5 7400水平只能说搁图吧够用,谈不上性能多好,真要论单核还比不过之前图吧标配AM3开核平台羿龙六核,重点是支持Win7 XP而且不会缺指令集。而且就算是单核游戏也不会卡单核

隔壁UP2:会

垃圾佬:尤里的复仇 罪恶都市没事,仙剑奇侠传四会单核吃满但是不会卡

隔壁UP2:半条命2吃单核6780a单核瓶颈核显吃不满

垃圾佬:半条命2不知道,CS1.6反正简单调下进程相关性就能吃6640ma四核了,C960核显100多帧,如果能上独显GTA4这种都没问题

隔壁UP2:等kx7000吧

垃圾佬:用不上,帝国时代 原神 CS2之类的都没问题,没需求了。

隔壁UP2:6780a在能吃满八核的游戏地平线5和古墓10-11里只有g5900的水平

隔壁UP1:反正八核打四核i5 7400水平只能说搁图吧够用@图吧垃圾佬 那主要是频率也低

ipc其实有三分之二

仙剑奇侠传四会单核吃满但是不会卡@图吧垃圾佬 来,mc有请

mc的主线程和其他线程负载是极度不均衡的,而且真会掉tps。单核无用论,不行

苹果和arm证明了大核心不一定带来高功耗,amd证明了大核心也能堆核垃圾佬:AMD的RYZEN核心堆核现在回头看只能说堆核有用,核心不是那么大。

隔壁UP1:但是你小核心能堆,我大核心也能堆。大核心泛用性还更好

垃圾佬:和英特尔1V1还是不行,只不过英特尔大核心能效拉了,随便一个U整出200W

隔壁UP1:zen4ipc也有alder lake大核九成,也比a76/skylake这些高不少了,虽说比起arm x系列和苹果大核那种怪物。

同样功耗小核心的性能肯定高于大核心……反正谁用谁知道,电费是真实的IPC是虚拟的。小核心玩MC也不是玩不了,咱自己玩感觉并不是卡单核性能卡到没法玩的程度,而且还省电。PC可能还不明显,能效问题到笔记本或者Windows平板就看出来了。

隔壁UP1:ipc无用论代表xeon phi,你看那玩意混成啥样子了,72核phi通用处理性能还不如18核xeon,浮点吞吐量又卷不过gpu

垃圾佬:你说得对,但是kp920至今都没大规模退,能效行才是真的行

隔壁UP1:kp920放当时算正经大核,ipc是没有落下的

垃圾佬:这玩意几发射就算大核

隔壁UP1:看情况,放19年tsv120和国内其他竞品比就是大(查了下文档发现应该是4发射乱序核心,支持大部分ARM V8.4特性,不过实际上是ARM V8.2的ISA)

垃圾佬:和苹果比呢

隔壁UP1:那肯定差的有点远,但是当时intel和amd差的也挺远的,那会intel还在倒腾祖传skylake呢,不过实际上kp920在一些项目上,被skylake吊锤,这需要归因于缓存和总线性能的不足

垃圾佬:换言之现在kp930s能堆单die32核单socket64核吗,不能不还是说明大核心单位面积和单位功耗性能不行吗?

隔壁UP1:kp920多核效率不算很好,特别是48/64核版本,因为这俩是两个die胶水起来的

垃圾佬:四核为簇环形总线串的吧,ring bus超过10节点好像就不行了

隔壁UP1:目前仍不知道kp920片内总线是什么架构,消息很少

垃圾佬:应该是RING,华为没有IF总线

隔壁UP1:ring是一类总线结构,if是amd的点对点总线,不是一个层级的概念,簇内还是ring, intel e5/e7其实就是类似结构了,amd的架构实质上还是多ring, 多ring通过点对点总线互相访问。

垃圾佬:结构不一样,AMD的IF总线也支持簇内的其他连接形式,比如四核为簇,簇内点对点:

打开网易新闻 查看更多图片

兆芯KX5000-6000包括KH40000应该都是这种结构,这种结构支持的节点应该更多一些,但是KP920应该没用这种

打开网易新闻 查看更多图片

英特尔的话后期MESH总线不知道结构,图吧X79寨板标配的E5V2是至少双环形总线正反双向或者三环形总线串连,超过10C节点就没法用两条环形总线保证效率了,多路更是白给。

打开网易新闻 查看更多图片

多核靠QPI总线连接反正效率就是肯定没有单路×2这么高就是了,但是SOCKET甚至单DIE内的效率其实三环形总线的12C也是不如双环形总线的10C的,实际使用的时候差距很明显。

隔壁UP3:@隔壁UP2 numa总线

(这里咱雀食没找到官方资料,看文档是以环状总线为基础的总线拓扑每个Super Cluster都是一条环状总线,多路是使用Hydra总线互连)

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

隔壁UP3:也在扯什么IPC=设计水平的龙芯网宣话术 @图吧垃圾佬 这个说法是有问题的,但是结论大致正确,龙芯差不多就是cortex x1水平

垃圾佬:没看出来哪正确,现代芯片能效不行PPA不行基本就废了哦AMD的簇内不是点对点?ZEN1不是也用的四核簇设计来着

隔壁UP1:只是从intel e5/e7的单die变成了分成几个die做

隔壁UP3:人家跑分没用spec 06,所以龙芯的优化就吃不到。这个跑分是我们平时理解的那种不加优化的跑分

龙芯ppa确实不算高

隔壁UP1:ppa不得看制程,现在哪怕是7nm集成度都是14/12nm好几倍,怎么比ppa,哪怕频率不变,因为制程差,集成度就差了不少。还有频率也是隔壁UP3:不是,频率取决于你的架构的模块设计以及有没有做优化,如果你模块设计的不行,那频率也上不去。

垃圾佬:17不是也能优化?反正这个分雀食比龙芯发布会低了,然后原视频频率又甩锅制程, 别的不说,反正兆芯用16nm靠优化物理设计给小核心都整3.3G了

隔壁UP3:至少他用的参数没开优化

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

英特尔和AMD在32nm工艺下都能超4G,龙芯的32nm就只有0.8-1G,即使是国产X86,也能做到在16nm节点下给小核心优化物理设计达到3.3G的频率,龙芯用12nm没理由超冒烟都达不到3.1G以上。极客湾这期视频出现龙芯话术以它的专业性来说不太可能是自己不懂,多半是充值了

隔壁UP3:想多了,充值肯定跑spec06,你也不用太揣测,他们这些视频我有所了解

隔壁UP1:制程应该是架构以外ppa的最主要影响因素,一个制程节点密度提升就是大几十个点甚至翻倍,但是一代频率能提升多少

隔壁UP3:是,所以要同工艺对比

@图吧垃圾佬 极客湾不需要龙芯充值,做这些视频也应该主要还是公益,能让龙芯跟泰山55开就已经很公正了。

隔壁UP1:spec17算是新标准了

垃圾佬:可以,然而《微型计算机》跑的是06,复读了大量龙芯网宣话术,开局甚至直接念胡伟武语录,肯定是充值了。不过只有视频,没有期刊,想也知道这种玩意根本进不了期刊

隔壁UP3:做视频是要考虑受众的,又不是纯粹的用爱发电的账号

垃圾佬:就浮点跑分低于9000S 预测一波极客湾这波肯定要被龙芯圈开团的,包括超冒烟也打不过12100+解锁BIOS也只能3.1G,这些让龙芯圈看见了恐怕都是要发病的

隔壁UP1:都能接受

垃圾佬:你能接受不代表龙芯圈能,这帮饭圈不是天天骂华为买办国产ARM X86没有未来吗

打开网易新闻 查看更多图片

看完极客湾这个跑分怕不是也要扯什么极客湾跑分造假,不符合发布会跑分,弄不好恼羞成怒开一波团也是有可能的

隔壁UP1:楽

垃圾佬:咱现在也没明白发布会是怎么做到相比龙芯吧小吧主彭东锋的跑分浮点原地提高30%的

打开网易新闻 查看更多图片

极客湾给5.87凹到6.0勉强还能理解

发布会跑出来7.79咱是没法理解了,这玩意除了看完极客湾的麒麟9000S视频发布会当场改分以外还有别的方法吗,定点都没怎么变的

隔壁UP2:龙芯官方的10100成绩是主频也就是没睿频的

垃圾佬:《微型计算机》直接把14900关到四核卡2.5G跑的分

打开网易新闻 查看更多图片

官方只关睿频相比网宣还算多少要点脸

隔壁UP2:我只希望kx7000不要宣传九代i7

垃圾佬:对标AMD吧,英特尔现在没活了, 哪怕对1600X也行,好歹算是比较高效的架构, ZEN1 EPYC现在好像也没大规模退

隔壁UP2:比不上,1600都比不上,8500T 9700E,要么就四代高频i7。

垃圾佬:是不是跑分软件不对,象棋CPUz怎么说?尤其是国际象棋,这玩意要是过不了40倍可真就没啥可说的了,不会按传统新架构又拉了一代或者发半成品出来吧

隔壁UP2:cpuz算最高了跑的sse,r23还avx2还低点,单核6780a翻倍以上是有保证的,全核频率太低。sse是超过的

垃圾佬:那不就是E5V2以上的水平了,记得2670V2好像象棋也就40倍左右,那还是10核跑出来的,8400象棋都过不了40倍我记得。8500T多少有点太低估了,咱只希望兆芯频率上不去别甩锅工艺R23那种东西怎么说呢,反正图吧基本不跑。R15测了吗?

隔壁UP2:没

垃圾佬:龙芯的R15好像打不过I3 2100

打开网易新闻 查看更多图片

隔壁UP2:套翻译了 效率低

垃圾佬:那也不应该这么拉,3A6000象棋套翻译也29倍多,已经超过KX6000了应该

打开网易新闻 查看更多图片

所以最近龙芯圈的节奏是兆芯KX6000游戏不如I3 2100,只能说这种统一话术还是图样,因为咱真有I3 2100,2C4T碰瓷8C8T还是比较困难

隔壁UP2:产品实测是最好的办法

垃圾佬:是的,但是实测是实测饭圈是饭圈,解决龙芯圈四处出击攻击其他国产芯片的根本方法永远不是靠自证而是结合事实揭露龙芯饭圈本质。

仅仅基于测评现实是没法说服别人的,必须指出逻辑中的矛盾。关于如何指出龙芯宣传中的矛盾,这个咱下期再说。

PS:前作的评论区反馈内容有误咱收到之后第一时间看了一眼手册,雀食,3A6000的IMC支持ECC。

打开网易新闻 查看更多图片

只能说是咱记错了或者龙芯用户之前提供的信息有误(3A6000砍了多路支持和RECC等特性的信息来源为龙芯用户),应该是咱表述有误把RECC打成ECC了,不过砍了多路支持这事应该是真的,3A6000不再和3A5000核心一样用于MCM胶水核心如3C5000L了,龙芯的多核平台会是重新设计的原生多核。