动态列表

  • 谷歌手机十年最狠升级,全家桶AI宣战苹果!一句话P图,100倍变焦
  • GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述
  • 打工半年后,Atlas觉醒!「大行为模型」零代码上新技能,AI工业革命来了?
  • DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍
  • 刚刚,好莱坞特效师展示AI生成的中文科幻大片,成本只有330元
  • 摆脱遥控器,波士顿动力人形机器人,开始「长脑子」干活了
  • 微软AI CEO警告:我们需要警惕「看似有意识的AI」
  • ICCV 2025 | ECD:高质量合成图表数据集,提升开源MLLM图表理解能力
  • 汽车业务还没盈利,小米却已找到「第三曲线」
  • 通义APP上线官方知识库,首批覆盖教育、法律、金融等五大领域
  • AI Scientist生成的论文被指「剽窃」,回应称「未引用相关研究」,AI自动化科研还靠谱吗?
  • 击败Meta登榜首:推理增强的文档排序模型ReasonRank来了
  • 千寻位置护航无人机表演,开启品牌多城联动新篇章
  • 刚刚,字节开源Seed-OSS-36B模型,512k上下文
  • 上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型
  • OpenAI 单月营收已经破 10 亿美元;马斯克的 Grok,超 37 万条用户聊天记录「裸奔」;谷歌发布 AI 手机
  • 成为「流量黑马」的老品牌,如何借拼多多秒懂 00 后?
  • AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词
  • 网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
  • 二十余名英国青年科学家在沪参与好望角科学沙龙活动
  • 为长视频生成减负!浙大与华为提出Compact Attention,挖掘结构化稀疏加速2.5倍
  • TPAMI 2025 | 骨架动作理解大一统:东南大学等提出USDRL,一个面向密集表征学习的基础模型
  • 报名开启|中关村国际青年论坛:诚邀全球青年学者共探AI前沿
  • Sora没做到的,LongVie框架给解决了,超长视频生成SOTA
  • 「价格战」打了半年,吉利如何做到核心利润暴增102%?
  • 小鹏Q2财报「炸裂」:营收暴涨125%,毛利率反超特斯拉
  • Nature子刊 | 上智院统一框架RXNGraphormer,实现化学反应多任务精准预测,自发掌握分类规律
  • 首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
  • 智谱推出AutoGLM 2.0:手机 Agent 的「Manus 时刻」?
  • 论坛报名已启动,速来锁定席位!解码具身智能的落地挑战与产业爆点
  • DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
  • dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型
  • DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
  • Meta超级智能实验室重组为四个部门,某些高管将离开
  • ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测
  • 黑神话系列第二作,《黑神话:钟馗》先导宣传片公布;小米卢伟冰:2027 年进军欧洲汽车市场;宇树预告新机器人
  • GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史
  • 微软最新揭秘:「话痨实习生」AI助手,到底能帮人类做什么?
  • 陶哲轩「断粮」后,25年首次绝望怒吼:美国科学命脉被砍断!
  • 16岁天才少年炒掉马斯克,空降华尔街巨头!9岁上大学,14岁进SpaceX
  • 中科慧远发布CASIVIBOT,以九年积累开启AOI与机器人协同的品质检测新时代
  • 英伟达ViPE:任意视频一键转为3D几何数据,开源引擎与亿级帧数据集重磅发布!
  • CVPR 2025 | DeCLIP:解耦CLIP注意力,哈工大(深圳)、港大提出通用开放词汇密集感知新框架
  • 强化学习之父Richard Sutton最新演讲揭示OaK架构:通向超级智能的八步愿景
  • ICCV 2025 | RobustSplat: 解耦致密化与动态的抗瞬态3DGS三维重建
  • 医疗AI安全革命:全球首个医疗动态红队测试框架DAS,破解临床落地信任危机
  • 谷歌在上海办了场 AI 嘉年华,开发者们却说像逛「AI 基地」
  • 7年了,OpenAI官方给出五代GPT对比,网友却怀念起「狂野」初代
  • X-SAM:从「分割一切」到「任意分割」:统一图像分割多模态大模型,在20+个图像分割数据集上均达SoTA
  • 开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
  • 图生视频新玩法刷爆外网:图上画两笔就能动起来,终于告别文本提示
  • 妙笔生维:线稿驱动的三维场景视频自由编辑
  • 一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器
  • Z世代生存、学习与未来宣言!伯克利学霸预言课堂,用AI设计人生
  • AI来了!记者、UP主、写手,谁能逃过这场「灭绝浪潮」?
  • Hinton预言成真!AI接管美国一半白领,牛津哈佛扎堆转行做技工
  • 为什么「游戏」是 AI 陪伴落地的好场景?
  • 新加坡 AI 办公系统 Agnes:200 个 Agent 并行研究,让 AI 主动「找茬」打磨设计
  • 机器人也会「摸鱼」了?宇树G1赛后葛优瘫刷美女视频,网友:比人还懂享受生活
  • 从GPT-2到gpt-oss,深度详解OpenAI开放模型的进化之路
  • NextStep-1:一次在图像生成上自回归范式的探索
  • KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务
  • ICCV 2025 | MobileViCLIP:快55倍!南大等提出首个高效“视频-文本模型,让多模态AI在手机可运行!
  • 突破长视频生成瓶颈:南大 × TeleAI 联合推出全新 AI 生成范式 MMPL,让创意“一镜到底”
  • 开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍
  • 一张图,开启四维时空:4DNeX让动态世界 「活」起来
  • AI发现新物理定律:纠正等离子体理论多年错误假设
  • 多模态大模型在化学与材料学的「体检表」——哪些能力靠谱,哪些还差很远?
  • Altman:希望 AGI 能提高生育率;与辉同行否认董宇辉年收入二三十亿元;今年国内智能眼镜市场同比增长121.1%
  • 刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代
  • 硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
  • 黄仁勋子女逆袭上位!4万亿「皇储」成长史首曝:一个学烘培,一个开酒吧
  • GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?
  • 400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?
  • CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
  • SEAgent:开启从实战经验中自我进化的GUI智能体新纪元
  • 给DiT装上“迷你”控制舵:NanoControl实现高效精准控制,参数量仅增0.024%
  • OpenAI估值达5000亿美元;「原道」联手小岛秀夫,推《死亡搁浅》耳机;苹果手表将「大幅重新设计」
  • 奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买
  • 谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
  • 最惨就业季!CS学霸GPA 3.98,投2500份简历仅10次面试,AI吞噬入门级岗位
  • Yann LeCun最新纪录片首曝!传奇AI教父的双面人生,深度学习幕后40年
  • 机器人全产业链接会 FAIR plus 2026新闻发布会在京召开
  • 大模型如何推理?斯坦福CS25重要一课,DeepMind首席科学家主讲
  • 当AI比我们更聪明:李飞飞和Hinton给出截然相反的生存指南
  • 简单即强大:全新生成模型「离散分布网络DDN」是如何做到原理简单,性质独特?
  • ICCV 2025 | 告别“尬舞”,InterSyn交错式学习生成逼真多人交互动作
  • Sam Altman:AI存在泡沫;宇树机器人夺金,王兴兴:用遥控追求极致速度;蔡浩宇AI游戏上架,27.19元|极客早知道
  • 吞下17亿图片,Meta最强巨兽DINOv3开源!重新定义CV天花板
  • 打开高德的理由又多一条!全球首个「需求链智能调度」AI地图上线
  • 核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!
  • 一句话搞定多任务出行,高德用空间智能重新定义地图
  • GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了
  • 谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型
  • 追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%
  • DINOv3震撼发布:Meta AI的视觉巨兽,重新定义自监督学习
  • ICCV 2025 (Oral) | DPoser-X:基于扩散模型的鲁棒3D全身人体姿态先验,树立领域新标杆
  • Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
  • 多突触神经元模型问世,国内团队打造类脑计算新引擎,登上《自然·通讯》
  • Science封面:高效精准模拟构象变化,微软研究院用生成式AI重塑蛋白质功能研究
  • 扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
  • AI 模特时代到来:字节x清华推出商用级视频换装模型DreamVVT,保真度显著领先SOTA
  • LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer
  • xAI元老离职干风投,传奇人物Babuschkin长文追忆与马斯克创业战友情
  • 链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防
  • 李想:i8 反响不错,产品力没对手;库克暗示:苹果将推桌面机器人;中国日均消耗 30 万亿 Token,暴涨 300 倍

全球第一!西湖大学成功登顶Science,卷赢同行背后黑科技揭秘



  新智元报道  

编辑:Aeneas
【新智元导读】西湖大学的一篇论文成功登顶Science,力压另外4篇同主题论文,背后秘密武器,竟是来自这家中国公司的科研外挂?这次比拼速度和算力和全球科技奥运中,他们用150GB/s的神速存储,直接把数据卷成全球第一!

5篇同样主题投稿到Science,其中一篇来自西湖大学的论文脱颖而出,相应团队也顺势成为全球首个成功的团队!

这惊人的成绩背后,除了科研人员的硬实力,离不开强大的算力支撑。

所以,究竟是谁在背后支撑着这支团队,让他们卷赢了实力不容小觑的全球顶尖同行?


西湖大学
Science文章跑成第一

这就要从西湖大学的多年布局说起了。

在西湖大学,建立之初的学科布局,基本就是生物医学、物理、化学和工学这几个方向。

这些学科对科学计算的要求都极高。因此,从2019年,学校就开始大力投入引进计算资源。

要知道,科研是个讲究「又快又准」的地方,比如冷冻电镜这种研究,全球都在比拼同一个蛋白质结构,无论是哪个国家的哪个实验室,最终解出来的结构都是差不多的。

而这就演变为一场奥林匹克竞赛,追求的是谁能更快、更准。

为此,曙光存储对用户数据做了系统测试,最终发现,在少数几个存储技术上调整,就可以把整个计算过程加快大概30%。

要想建立一个集群,存储就处于重要地位。

这是因为,CPU和GPU的节点可以不断的去更新,用新的GPU节点代替老的CPU节点,用更新的更快的显卡代替旧的显卡,就能得到显存的扩容。

而底层的存储系统,就要跟上计算能力升级的节奏。

要知道,在一所高校中,光是生物医学方向就可能有十几个甚至二十几个课题组,能积累几十PB的数据。这种情况下,存储系统就很难轻易更新。

另外,很多应用其实跑在单个的CPU或GPU节点上都还好,但是一旦应用成了规模,整体性能就会下降了。

很大一部分原因就在于,存储的带宽对于小碎文件的操作能力不足,所以在高校的集群建设中,存储的地位相当重要。

为此,曙光存储为西湖大学的AI集群做了一次大升级,给出了十分硬核的存储方案:单节点带宽150GB/s,是美国某先进友商的4倍性能,单个设备仅仅占用了2U的机架空间

在那一期的Science上,全球有5篇同主题的投稿,而西湖大学的这一篇,不仅是第一个投出,数据质量还是全场最高的!


三大平台,超强实践

现在,曙光存储已经为西湖大学打造出人工智能、科学计算等科研存储平台,以及冷数据归档的共享存储平台。

在不同科研领域,曙光存储都表现了超强的实践能力。

比如像冷冻电镜这种科研场景,对IOPS(每秒输入输出操作次数)的要求非常高。

另外还有一些跨业务场景数据的流转,比如先通过sum的协议写到存储集群里,然后再通过服务器对写进来的数据做一些解析和处理。因此对于存储系统是不小的挑战。

而曙光存储的性能水平在AI计算节点上的处理,可以实现单流极高的带宽水平。

在客户现场实测时,甚至能达到150GB/s。

而现在,这种带宽速度直接让科研数据跑得飞快,给科研速度开了挂。这种神速,也直接让客户当场震惊了。

具体合作

具体来说,曙光存储在西湖大学的其中一类存储就是全闪存储。

作为人工智能集群的一线存储,它要承接最大的负载,压力极大,尤其是多节点训练的时候,这就要求存储有很高的IOPS。

同时,曙光也会有混闪存储来为用户提供一些空间的扩展,然后让他们来储存一些数据集,和值得保存的中间结果。

而且通用计算集群上,西湖大学也采用了曙光的存储来做软件目录。

虽然这个软件目录没有像人工智能集群那样有那么大的吞吐,但对于一个集群的稳定运行,也是不可或缺的。

此外,曙光存储还会做许多温数据之类的存储,比如科研归档数据,保存时间可以至少达到5年。

而西湖大学在选择一线存储的时候,过程十分慎重,因为需要满足一些特别的指标。

毕竟,用户还是最看重集群的性能。


商业落地

不仅如此,曙光存储现在已大规模落地科研领域,除了西湖大学,还包括北京大学、中国农业大学、华南理工大学、良渚实验室、紫金山天文台等的AI4S场景。

如今的AI浪潮中,科研行业同样站在了风口。

而真正能撑起这阵AI东风的,绝不仅仅是算力,还有一个常被忽视却至关重要的一环——存储力!

面向AI的科研存储方案,难点在哪?


总的来说,面向AI的科研存储方案之所以困难,主要有四个原因:

1. 数据极其复杂

2. AI模型训推对性能要求极高

3. 数据应用流通的挑战

4. 数据存储的成本过高

对此,曙光存储都有解决之道。

数据复杂性挑战

首先,AI应用设计的数据类型,大多十分复杂,包括非结构化数据(文本、图像、音视频等)、结构化数据(比如成绩、档案对应的表格、数据库记录等数据)。

而非结构化数据到增长迅猛,占比不断攀升,数据格式各异、处理方式不同,这就给存储带来了巨大挑战。

对此,曙光打造了分布式全闪存储ParaStor,充分发挥先进存力的融合属性,支持块、文件、对象、HDFS等多种存储访问协议,异构数据无需格式转换即可一路畅通,避免数据跨存储系统复制。

这样,就可以轻松处理PB级对象数据、百TB级文件数据。

AI训推性能挑战

第二点,AI模型训练和推理过程需要处理海量数据,这就对存储系统的性能提出了极高要求。

比如在模型训练阶段,数据读取和写入速度会直接影响训练周期。多数传统存储系统难以满足每秒 TB 级的数据读写需求,无法匹配GPU的高速运算能力,就会导致计算资源闲置,形成性能瓶颈。

同样,推理阶段,对存储的低延迟要求也极为严苛。

曙光的高性能全闪存储ParaStor,可以通过过190GB/s 带宽,500万 IOPS支撑具身智能模型训练,把模型训练周期从「月模」加速至「周模」。

数据应用流通挑战

因为数据共享机制不完善,区域、高校、院系间数据交易标准不明、确权困难,因此就急需打破数据壁垒,建立统一高效的平台。

为此,曙光打造了数据资产的统一视图,实现了跨域、跨站点、 跨厂家等复杂数据的全局可视、实时更新;还实现了数据目录的智能化;能够面对海量的文件,都能实现千亿级文件秒级检索的能力,以及数据的高效查找。

数据存储成本问题

AI大模型应用存储系统的构建成本是很高的,而曙光存储通过更高的单位存储密度、更少的空间占用、更优异的性能显著降低了成本,是百PB-EB级超大规模AI基础设施的极佳选择。

现在,根据赛迪顾问新发布的《中国分布式存储市场研究报告(2025)》,曙光存储在教育存储市场份额已经是妥妥的TOP 1。

而且自该报告开始发布以来,曙光存储已连续3年市场份额排名第一。

曙光存储用实打实的数据证实:懂科研的存储,才能真正服务科研。

而在未来,曙光团队必将用更强大的数字底座,让中国科研插上翅膀,更早一天抵达世界前沿。


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652621827&amp;idx=3&amp;sn=491349e1b121b1c6b9e8a57da99f82e2&amp;chksm=f01de2996f5a9fe0c7534f78df1d480c3cf4003844dc83958978c7e50272646ddc38768c86e6&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/WeQlfnlCWd&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们