14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

满血DeepSeek一体机,价格竟然被打到10万元级别了!

而且还不是量化版本,正是那个671B参数、最高质量的FP8原版。

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

或许有小伙伴要问了,那跑DeepSeek-R1/V3的速度,能跟官方一较高下吗?

可以的,甚至是更快的那种。例如我们提个问题,来感受一下这个feel:

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?只需回答这个字即可。

不仅答案精准,一体机的速度也是肉眼可见地比DeepSeek官网快上一些,粗略估计是已经接近了22 tokens/s。

那么这个一体机到底是什么来头?

不卖关子,它就是由北京行云集成电路最新推出的产品——褐蚁HY90,具体价格定到了14.9万元。

而且除了产品,这家公司本身也是有不少的标签在身上的,其中最为吸睛或许当属CEO了:

季宇,清华90后博士、前华为天才少年、计算机学会CCF优博奖获得者。

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

那么褐蚁HY90具体执行起更多任务时,又会是什么样的效果?

来,更多维度的一波实测走起。

我们先在褐蚁HY90部署DeepSeek-R1,来测试一下它的推理能力。

有请AIME 2025的数学题:

Find the sum of all integer bases b>9 for which 17bis a divisor of 97b.

从内容生成的速度上来看,褐蚁HY90面对数学推理问题,依旧是可以保持接近20+ tokens/s。

并且最终给到的答案也是精准无误:70。

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

再来一道新版类似9.9和9.11哪个大、Strawberry里面有几个‘r’,极度迷惑一众AI的难题:

让7米长的甘蔗通过2米高1米宽的门。

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品
△左:一体机;右:DeepSeek官网

速度依旧在线,并且这个问题已经是难不倒DeepSeek,给出的答案也是正解。

而除了DeepSeek之外,我们还在褐蚁HY90上体验了一把类似Deep Research的功能:

由此可见,无论是什么类型的题目,褐蚁HY90都能以相对较快的速度丝滑处理。

不过有一说一,以往的一体机,即便是搭载Q4量化版本,成本动辄就要达到200万元。

而褐蚁HY90在搭载满血、未量化的DeepSeek情况下,不仅能够保证速度,更是把价格打掉了一个数量级。

因此,接下来的一个问题便是:

如何炼成的?

在我们聊如何实现之前,且需了解一下什么在阻碍。

首先,大家提到一体机,第一反应大概率就是GPU,而它本身就或许构成了短板。

因为传统GPU方案因显存容量限制,例如671GB需求需多张A100显卡,成本已经超过了百万的级别。

而CPU方案则受限于内存带宽,因为大模型推理需要频繁加载参数(如671B参数的FP8精度模型占用约671GB内存)。

如果内存带宽不足,就会导致计算单元(CPU 核心)长时间等待数据,形成内存墙(Memory Wall),严重影响推理速度。

针对上述的短板,行云的褐蚁一体机采用双路AMD EPYC 9005系列CPU,通过1TB/s的高内存带宽满足基础推理需求,同时搭配一张中高端消费级GPU作为算力补充。

这种异构计算架构通过软件协同优化,既解决了纯CPU方案在部分推理阶段的算力不足问题,又显著降低了成本,将硬件投入压缩至10万元以内。

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

除此之外,行云自主研发的推理引擎框架通过算法优化和任务调度,同样对token生成速率起到了显著的提升作用。

在FP8精度下,Decode阶段速度稳定在20TPS以上,且受上下文长度影响较小(128K上下文仍保持15TPS);Prefill阶段在16K上下文内首字延迟控制在80秒以内。

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

这种高效推理能力尤其适合需要连续生成大量token的场景(如AI Agent),大幅缩短任务响应时间。

不仅如此,团队还针对大模型运行需求,精准平衡了计算能力与内存带宽,支持满血FP8精度的R1/V3模型,并预留扩展能力,未来可支持1.5T参数量的模型。

通过参数压缩技术(如INT4量化),进一步将Decode速度提升至28TPS(1K上下文),满足不同场景对速度与精度的灵活需求。

据了解,团队后续还将对MoE类的模型提供较好的支持。

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品

褐蚁一体机的出现,可以说是改写了行业的格局——

此前运行满血671B模型需百万级设备,而同类低配方案(如32B/70B模型)仍需20-40万元。

行云通过技术整合,将最高质量的模型体验直接带入10万元价位,为中小团队提供了低门槛、高扩展性的AI部署方案。

这一技术突破不仅实现了高性能+低成本的平衡,更推动了大模型在智能客服、数据分析等场景的普惠应用。

最后,正如我们刚才提到的,行云除了产品本身之外,创始团队同样也有不少的亮点。

首先就是创始人兼CEO季宇,他本科就读于清华大学物理系,后转向计算机体系结构方向,获得清华大学计算机体系结构博士学位。

在学术研究方面,他曾作为共同第一作者在顶级期刊《自然》(Nature)上发表计算机体系结构相关论文,并荣获中国计算机学会(CCF)优秀博士学位论文奖(CCF优博奖)。

14.9万元!满血流畅运行DeepSeek一体机抱回家!清华90后出品
△行云集成电路创始人兼CEO,季宇

在2023年8月成立行云集成电路之前,季宇曾在华为海思昇腾芯片团队,担任昇腾AI芯片编译器专家,负责多个昇腾编译器项目,也曾入选华为天才少年。

在华为期间,正因长期专注于AI编译器优化和处理器微架构等挑战性问题,也让他积累了丰富的AI芯片研发经验。

除了季宇本人之外,CTO余洪敏拥有深厚的学术背景和丰富的行业经验。

他本科毕业于华中科技大学,后在中国科学院半导体研究所获得博士学位。

在职业履历方面,余洪敏曾担任百度昆仑芯、华为海思车载昇腾芯片等多款芯片的负责人,并曾在地平线担任芯片研发总监。

他长期领导和管理超过100人的研发团队,精通芯片研发设计全流程,具备丰富的实战经验——成功主导10余款芯片的流片与量产,并多次推动先进工艺数据中心芯片的架构设计、工程实现及大规模商用部署。

值得一提的是,在去年11月份,行云集成电路还得到了一众明星资本的投资,包括智谱AI、峰瑞资本、嘉御资本、春华资本、中科创星、同创伟业奇绩创坛、水木清华校友基金等。

由此,从行云集成电路成立至今的发展来看,是有产品,有团队,更有市场的那种了。

但更重要的一点是,这家刚成立两年的公司,一举实现了一体机圈子里类似的DeepSeek的高性能+低成本——

嗯,中国初创的含金量还在持续上升。

主题测试文章,只做测试使用。发布者:大众参考网,转转请注明出处:https://www.jjrbwx.com/9864.html

(0)
大众参考网的头像大众参考网
上一篇 2025年4月29日 下午2:07
下一篇 2025年4月29日 下午2:07

相关推荐

  • 花粉太热情 鸿蒙折叠电脑预约超6万:支持华为打破西方垄断

    5月20日消息,即便售价不便宜,但是用户对于鸿蒙折叠电脑的热情依然很高。 昨日,鸿蒙电脑正式发布,鸿蒙系统终于完成了生态闭环。备受关注的要数鸿蒙折叠电脑,虽然售价高达23999元-26999元,但华为用户们的热情不减。 截至笔者发稿时,华为商城中华为MateBook Fold非凡大师的预约人数超过6万人。 鸿蒙电脑要打破Windows和MacOS的垄断,应用…

    2025年5月20日
    9000
  • 抖音爆红神曲、排名超越周杰伦 《大展鸿图》原唱回应赚了1.2亿

    7月11日消息,继歌曲《八方来财》后,歌手揽佬的《大展鸿图》又在抖音等短视频平台爆火,掀起一股改编二创热潮,别墅里面唱K,水池里面银龙鱼等歌词也火出圈。 截稿前,话题大展宏图在抖音的播放量高达28.5亿次,大战宏图舞蹈挑战也有1.5亿次播放,其他相关话题也有几十万到几百万。 日前,全球最大流媒体音乐播放平台之一的Spotify更新华语歌手榜单,揽佬的月听众数…

    2025年7月11日
    2500
  • 曝雪佛兰退出中国已倒计时 上汽通用人士回应:假新闻 已发律师函

    5月29日消息,今日,未来汽车Daily发布报道称,作为曾经的合资车企巨头,上汽通用的市场份额正以肉眼可见的速度萎缩,对此,其正对旗下三个品牌(雪佛兰、别克和凯迪拉克)进行战略调整,以求止损。 报道称,知情人士向其透露,目前雪佛兰尚未SORP的项目已全部被无限期延迟,一些车型将正式退出生产线,不再进行大规模生产。 对此,有博主向上汽通用相关负责人进行了求证,…

    2025年5月29日
    7400
  • 夜间高速逆光自动躲避事故车 车主:吉利银河星舰7救我一命

    5月7日消息,当前不少新能源车型都配备了主动安全功能,虽然大部分时间都用不上,但触发一次就够本,甚至还能救下一车人的性命。 日前,有吉利银河星舰7车主发布视频称,自己的夜间高速行驶时,车辆的主动安全救了他一命。 车主提供的行车记录仪视频显示,5月5日凌晨,他驾车在高速最左侧的超车道正常行驶。 前方途径一个积水坑路段时,对面大货车开启了车顶远光灯,他被晃得什么…

    2025年5月7日
    4300
  • 差旅出行必备:得力一次性双人三件套6.9元(干净又卫生)

    天猫得力官方旗舰店,一次性床单被罩枕套双人三件套日常售价为11.9元,领取5元优惠券,到手价为6.9元。 床单+被罩+枕套,方便便携,不占空间,差旅出行必备。 购买链接:天猫(券后6.9元) 购买提醒:天猫得力官方旗舰店商品,正品保障,支持七天无理由退换,赠退货宝,请查看最新评价后再入手。 【广告】本文用于优惠促销信息分享,结果仅供参考。

    2025年7月31日
    500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信