动态列表

  • 乔纳森下一个iPhone神话,要黄了?OpenAI秘密AI硬件深陷三重困境
  • 一举击败Claude Code!微软提出代码生成黑科技:一键直出36K行代码
  • 刚刚,2025年诺贝尔生理学或医学奖揭晓!三位得主点燃器官移植希望
  • OpenAI入股AMD,股价暴涨35%!奥特曼左手黄仁勋,右手苏姿丰,通吃全球算力
  • 自进化Agent的第三种可能:隐式记忆,不动模型参数,胜过GRPO
  • 真实数据、全链路、可复核:GenoMAS打造更可信的基因分析智能体
  • NeurIPS 2025 | 高通提出GCL:无需额外数据,通用多模态检索迎来“一统江湖”新范式
  • NeurIPS 2025 | 慕尼黑工业大学提出SIM(3)等变网络:让3D形状补全告别“姿态偏见”,实现跨域泛化
  • 今日迎本世纪「最晚中秋月圆」;雷军:小米17 五天销量破百万;ChatGPT 或添私信聊天功能
  • 腾讯王者归来:混元图像3.0登顶LMArena!一手实测全球最强图像AI
  • AI「学不会」竟成相变探针!UCSD华人联手谷歌等,曝光量子纠缠秘密
  • 最新,2025诺奖预测出炉!中国科学家有望拿下化学奖?
  • 奥特曼:感受不到GPT-5变强,是因为你还不够「专业」
  • GPT-6或将比GPT-5强10倍!奥特曼揭秘ChatGPT如何诞生
  • 宾大提出F³:事件相机迎来“预测性”表征新范式,光流、分割、深度全SOTA!
  • “移步换景”一试,大模型全乱了:OST-Bench揭示MLLM时空推理短板
  • NeurIPS 2025 | AI也能做数学建模?本科生携手MM-Agent勇夺美赛全球前2%
  • LSTM之父再出手!xLSTM挑战Transformer:一场关于Scaling Laws的正面交锋
  • 微软下架「炉石」等多款游戏;华为云:华为算力效能超英伟达芯片 3 倍;马斯克回应特斯拉机器人打拳:并非遥控
  • 陶哲轩联手GPT-5,1小时攻克数学难题!全程无需编码,OpenAI副总惊呼
  • 1亿签约金抢AI大神?谷歌AI元老劝退全网:别再读博了!
  • 三天逆袭,Sora登顶美榜!15秒大片玩疯奥特曼,全网直呼真假难辨
  • 10个Agent一键组队:并行智能体协作,端到端交付从24h缩减到4h!
  • 首位AI女演员出道!好莱坞「天敌」来了,下一代偶像全是代码制造?
  • 南理工提出FMC-DETR:巧用“频率解耦”,航拍小目标检测精度飙升8.2% AP50
  • 网红挑战特斯拉FSD穿越美国出车祸;小米回应「小米汽车突然自己开走」;Sora 登顶美区苹果商城免费榜
  • 刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局
  • Gemini 3.0 Pro内测流出,编程实力惊人!下周上线
  • 刚刚,奥特曼首曝:AI取代CEO后,我想去当农民!
  • 华人主导谷歌SLED,论文登顶会!一键让模型学会自救
  • LeCun考虑辞职!Meta AI百亿豪赌引爆「内战」,逼走首席科学家
  • NeurIPS 2025 | RAD:基于大规模3DGS孪生数字世界的端到端强化学习训练策略
  • 小米 17 系列销量超百万;苹果新产品泄密源头疑为越南工厂;低价版 model Y 现身官网代码|极客早知道
  • 刚刚,这家0产品0模型就估值854亿的公司,终于发布了首款产品!
  • 刚刚,奥特曼亲赴,韩国「举国」投靠!
  • 奥特曼「一张脸」引爆全球狂欢!Sora 2冲上APP榜第三,邀请码炒到1250元
  • 60岁老人AI养生三个月吃进医院!「AI精神病」全球扩散,OpenAI急招医生
  • 一杯咖啡,3亿美金!斯坦福天才少女退学创业,Meta AI大牛排队加入
  • 武大新作MASt3R-Fusion:融合IMU与GNSS,为新一代视觉SLAM注入“多感官”智慧
  • 中科大、清华、快手等发布OpenGPT-4o-Image:为多模态AI打造的“超级燃料”,图像编辑性能提升18%
  • 历史首位,马斯克身家突破 5000 亿美元;王腾注销、清空多个社媒账号;美国演员工会抵制 AI 演员
  • 刚刚,OpenAI Sora 2重磅登场!首个APP上线,或将成为AI时代新TikTok
  • Sora 2全网疯狂实测:以假乱真、脑洞大开、虚实难分|附首个APP教程和邀请码
  • OpenAI和DeepMind大佬离职联手,誓用AI科学家实现室温超导!已融3亿美元
  • 南洋理工联合商汤提出Visual Jigsaw:像玩拼图一样,显著提升多模态大模型的视觉理解力
  • 天津大学联合腾讯提出Wan-Alpha:一键生成高质量透明视频,发丝级抠图不再是梦
  • OpenAI 深夜重磅推出新视频模型和独立 App;英伟达市值突破4.5万亿美元;特斯拉预计推出第三代人形机器人 | 极客早知道
  • 刚刚!软银系创始人4个月打造机器人超级黑马,获2轮近亿元融资
  • 博士生,当代最穷科研民工?Nature最新调查:不涨工资,我们就跑路了
  • Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
  • AI改造出行体验:滴滴的试验能否开启行业范式转变?
  • GPT-5「降智」真相曝光:不是变笨,而是五个超级开关没激活
  • OpenAI 刚刚发布了属于 AI 的抖音,还有 Sora 2
  • YOLO26首份学界评论:端到端无NMS,目标成为边缘设备实时目标检测新标杆
  • NeurIPS 2025 | 清华大学与华为等提出全新正则化方法,破解稀疏视图3DGS“协同适应”难题
  • DeFacto:用强化学习治愈AI幻觉,让多模态模型“有据可查”
  • 榜一换人!OCRBench v2九月新榜:揭示多模态大模型文档智能真实水平
  • 把“俄罗斯方块”搬进设计室:物竞天择让振动微型机器人进化得越跑越快
  • LoRA到底能否媲美全参?Thinking Machines用实验曲线划出「无悔区」
  • DeepSeek V3.2 发布,API 成本减半;特斯拉员工被机器人打伤,索赔 5100 万美元;Claude 新模型登场

3年手搓ChatGPT!剑桥天才少年在Minecraft游戏中爆火回归



  新智元报道  

编辑:艾伦
【新智元导读】在MC中手搓CPU的硬核大神,时隔3年,于上周发布了最新力作,在MC中手搓ChatGPT!最终实现的语言模型名为CraftGPT,参数量很小,但已经能与用户做出很多有意义的交互了。MC还能玩出什么花?


一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发

MC(Minecraft,我的世界)是一款自由度极高的全球最高人气沙盒游戏,其中的红石电路玩法极其丰富,吸引了众多技术宅大神投入海量时间造出令人惊叹的奇观。

有人在MC中复刻了整座城市:

BV1bPVizYEFs

而那位在MC中手搓CPU后爆火,后续又在MC中造出了套娃MC的大神sammyuri,终于在上周发布了时隔3年的最新力作:在MC中复刻ChatGPT!

MC红石电路简介

红石电路其实就是MC里用来「做机关」的一种玩法。

你可以把它想象成游戏里的「电」,通过一些导线(叫红石粉)和开关(按钮、拉杆等),把信号传给其他东西,比如一扇门、一个活塞或者一盏灯。

比如你拉一下拉杆,红石线就像电线一样把信号传过去,门就打开了。

刚开始你可能只会做个自动门或控制灯的开关,但慢慢地你可以用它做出自动农场、物品分类器,甚至复杂到能模拟计算机的系统。

它的有趣之处就是,你能用很简单的方块,搭出很聪明的装置,全靠你怎么组合和安排。

对于没接触过的人来说,其实它就是Minecraft世界里的「积木版电路」,动手试一试,很快就能理解。

使用Python训练

首先作者使用Python语言为该模型定制了训练的算法。下图为作者展示的矩阵乘法代码:

之后使用一个小数据集TinyChat训练模型,下图为部分参数:

该模型的参数量(5,087,280)比最初的ChatGPT-1都要小约23倍,和效果比较好的GPT-3小约17万。

下面是作者展示出的损失函数训练图,效果不错:

MC中的神经网络模型架构

除了最开始展现的「键盘」输入和一个大的红色显示屏外,后面的部分都是用MC红石实现AI的部分。

我们之前已经在参数量上提到其实作者做出的不是真正的ChatGPT级别的AI语言模型,参数量因为客观限制小了很多,但作者和GPT1一样,用的都是Transformer的架构。

当然和OpenAI的GPT-1都是用了Transformer的解码器(Decoder)部分,属于纯解码器架构(Decoder-Only),即下图的右半部分。

纯解码器架构适合自回归任务,即大家理解的文本生成任务。左半部分是编码器(Encoder)架构,是用来做文本理解的,用于BERT系列模型,我们可以舍弃左半部分。

当右半半部分的下面直接是用户文本输入(Input)时,就是我们的纯解码器模型了。

整个视频所展示的红石架构基本上也是按照Transformer的解码器部分来完成的。

下图是分词器(Tokenizer)。

它会把输入的文本按预定的分词算法先把输入的句子初步处理后切成token,再按照对应的词汇表映射为数字,送入下一部分。

因为之后的Attention架构对语序的理解能力差:例如「我爱你」和「你爱我」中,「我」和「你」的顺序对语义影响很大,我们要给每个token顺序加入位置信息。

这里和GPT-1都是采用的位置编码(Position-Embedding)。

这里就是用数学方法算出位置值,加入token信息里面。

下面将token映射为向量(18bit精度的嵌入参数是通过ROM红石导入的)。

之后就是按照官方的架构复现了归一化层(LayerNorm)、矩阵乘法、多头注意力机制、KV缓存等。

最终作者复制了多份架构,形成了多层的Transformer网络。

最后经过反嵌入、预测下一个token和输出架构,就可以将AI回复的句子呈现在屏幕上面了!


效果呈现

基础的问题:

「你今天怎么样?」

CraftGPT答:

「我感觉很开心,感谢提问。」

当然,模型的交互效果是有限的,最终只能实现64 tokens的上下文窗口。而且就算在加速的MCHPRS服务器上,一次回复耗时都需要约2小时

作者简介

sammyuri尚未在互联网通过任何渠道公开自己的真实身份。

这位天才少年只在YouTube频道发布了6个视频,全部都是极其硬核的MC红石电路视频。

本次发布的CraftGPT是他近3年来的课余时间做出的公开的唯一重大成果。

我们发现了可能是sammyuri本人的CodeForce账号,显示他的CF分已达超过2600分,意味着他的编程实力已可以通过IOI等世界级编程竞赛赢得奖牌,直通世界名校。

该账号信息显示,他已入读剑桥大学。

该视频的存档也已公布,所有人都可以在MC中加载该存档,通过这种电路可视化的方式,更好地直观理解ChatGPT这类大语言模型的详细工作原理,寓教于乐。

存档地址:

https://drive.google.com/file/d/1GToQikx1VpJSOg5unnnFhJl8onq0DRhY/view

参考资料:
https://www.youtube.com/watch?v=VaeI9YgE1o8
https://github.com/sammyuri/craftgpt
https://github.com/MCHPR/MCHPRS

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652632470&amp;idx=1&amp;sn=18f6ee27f3e045acc04bd01ee6c6853e&amp;chksm=f0b8ef1a3a1cf9c5ab5b2b39ad39f9b15881ea8d458f74423970f0a99681b3686ed16ef26750&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/NdexcyPPFh&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们