动态列表

  • 首个AI神作!一人分饰全角,万人围观外星人嘲讽人类灭绝
  • 申研「全拒得」的「差生」,终成PyTorch之父、Meta副总裁!今天跳槽TML
  • 图灵奖得主竟「忘了提及」中国学者成果?马库斯重锤Yann LeCun
  • 永别了,Tokenizer!何恺明师徒新作,颠覆AI生图技术
  • 年度最强AI实锤!谷歌Gemini 3全网首测震撼,一句话编码封王
  • 对话斑马口语:如何用 AI Agent 造出「超人类外教」?
  • 清华团队“密度法则”登上Nature子刊,揭示大模型高效化发展新规律
  • 点击下载!中国科研人员AI使用率全面领跑:Wiley发布全新调研报告
  • 风口浪尖中的小米汽车,创下国产新势力最快盈利速度
  • CMU新作Co-Me:无需重训,VGGT长序列迎11.3倍加速!
  • 何恺明团队再出手!将ARC视为视觉问题,ViT从零训练60.4%准确率,达到人类平均水平
  • 资深技术专家胡成文出任鼎犀智创CTO,共赴新材料智创未来
  • 如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!
  • 登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」
  • NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法
  • NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测
  • 刚刚,PyTorch之父光速入职TML!离职Meta刚过一天,投身500亿估值独角兽
  • 何恺明重磅新作:Just image Transformers让去噪模型回归基本功
  • ConsistEdit来了:无需训练,实现高精度、高一致性的视觉编辑新范式
  • Gemini 3深夜来袭:力压GPT 5.1,大模型谷歌时代来了
  • 「30 秒造应用」——蚂蚁灵光点燃「所想即所得」的魔法时刻
  • 视频模型真在推理,还是「表演」推理?港中文等质疑:Chain-of-Frame是真的吗?
  • Gemini 3 正式发布,多榜单断崖式领先;美安全服务商网络中断,ChatGPT、X 受牵连;苹果承认酒精擦拭可能导致手机掉色|极客早知道
  • 4万亿刀,仅3.6万人!英伟达揭残酷真相:劳动正与财富大脱钩
  • 医疗AI智能体全面综述:行业爆发,年增长130%!
  • AI「看见」实验,哈佛颠覆性突破!一副AR眼镜,新手秒变资深专家
  • 震惊电影圈!好莱坞混了10年没出头,他把AI「烂片」做成23万粉爆款
  • Anthropic CEO:最快明年,一半初级白领下岗!失业率将达10%-20%
  • 谷歌 Gemini 3.0 深夜炸场:没有悬念的最强 AI
  • 夸克全面接入千问对话助手,将发布全新AI浏览器
  • Yann LeCun团队新作LeJEPA:仅一个超参数、50行代码,实现可证明、可扩展的自监督学习
  • MIT何恺明团队新作:让扩散模型回归“去噪”本质,简单Transformer即可实现SOTA性能
  • JSON刚死24小时,TOON又被网友玩坏:LLM数据格式彻底乱套了
  • 美团多篇论文入选NeurIPS 2025:从大模型到多模态的全线突破 | 直播预告
  • 阿里千问公测,挑战 ChaGPT;京东上线独立外卖 App;贝佐斯出任 AI 初创公司 CEO
  • 抱歉了GPT-5,这次是中国AI「上岸」了
  • 你急它不急:GPT-5先判断,再决定「速答」还是「深想」
  • Meta开始用KPI考核,强迫所有员工尽可能多使用AI
  • 接招吧,GPT-5.1!
  • 「前三代定律」下,百年吸尘器如何做出新意?
  • 两个月破 300 万用户,Agnes AI 刷新 Instagram 与 Snapchat 增长纪录
  • 每天给白领发 1000 万,他成了硅谷最年轻亿万富翁
  • 2025,中国科技圈进入全面「大乱斗」时代
  • 当 AI 开始分「左右」
  • 阿里云,用全栈 AI 刷新第十七个双十一
  • AAAI 2026 Oral MiniShift+Simple3D:面向高分辨率3D异常检测的可扩展数据集与实时检测新范式
  • AAAI 2026 山大提出DiveSeg:为DINO注入“水下感知力”,实例分割性能提升显著
  • 双重隐式记忆来了!JanusVLN让视觉语言导航真正理解3D空间
  • 让千问APP当一周科研打工人:它比我想的能干,也比我想的累
  • 雷军连发多条微博回应质疑;iPhone 发布方式将在明年重大变革;年度最令人不安的研究:AI 刷多社媒会变蠢|极客早知道
  • 图灵奖得主LeCun最后警告Meta!我搞了40年AI,大模型是死路
  • AI又封神了!华人新作直出憨豆+《猫和老鼠》,平行宇宙对上戏了
  • AI「逼宫」库克?苹果秘密计划曝光,接班人竟是M芯片之父!
  • 年度最强AI压轴!谷歌Gemini 3.0下周决战OpenAI,前端要下岗了
  • 安谋科技发了一枚 NPU,要把 AIGC 算力提升 10 倍
  • ICLR 2026吃瓜现场:有人用LLM连投4版论文,竟然拿到两个8分?
  • 无人工标注、可持续扩展:AcademicEval推动长文本评测进入“自更新”阶段
  • 宇树完成上市辅导,拟境内IPO;传索尼开发Labubu电影;2699元!原道X小岛秀夫耳机限量发售
  • AAAI 2026 Oral | 清华大学等提出SpatialActor:解耦空间感知,重度噪声下机器人操作鲁棒性暴涨19.4%
  • AI不懂痛苦,却成了你的深夜知己!170位医生教ChatGPT安慰人
  • 一条短信,7年恩怨!奥特曼与马斯克决裂曝出新隐情
  • 不会说英语的母亲,教出了5万亿英伟达CEO!
  • AI「牛顿」来了!北大团队新突破,看一眼数据就能推出物理定律
  • AAAI 2026 Oral | 中科院联合港大提出ARRA:外部视觉表征对齐重塑全局一致性,让自回归大模型充分释放图像生成潜能
  • 1899 元「iPhone 袜子」上架秒光;传华为 Mate80 上 20GB 内存;微信点赞苹果小程序政策
  • 全球最大开源具身大模型!中国机器人跑完马拉松后开始学思考
  • OpenAI拆开AI「黑箱」,终于可以看懂GPT在想什么了
  • LeCun在Meta的「最后一作」
  • 视觉压缩称王?谷歌死守AI黑科技,DeepSeek一夜开源
  • 大疆 OSMO Action 6 体验:完美进化,不止运动
  • iOS 为微信小程序「正名」,腾讯移动生态的新转机
  • WACV 2026 | PALMS+:融合深度基础模型,手机室内导航的技术再突破
  • “全模态”3D视觉基础模型OmniVGGT出炉!即插即用任意几何模态,刷新3D视觉任务SOTA,赋能VLA模型
  • GPT 5.1 发布了,但西方媒体准备「讲好中国故事」
  • AI、游戏双驱动,腾讯「赚麻了」
  • 对话李彦宏:Chatbot 不是一切,我在 AI 上看到了更让人兴奋的未来
  • 杭州/北京内推 | 阿里淘天算法团队招聘多模态理解方向算法实习生
  • ACL 2025 | 用图结构让RAG学会「记忆与总结」,重塑长上下文理解
  • OpenAI把Transformer训练成「几乎全零」,黑箱首次被彻底揭开
  • 传苹果从微信小程序抽成 15%,腾讯回应;特斯拉考虑支持 CarPlay;iPhone Air 成功支持实体卡 |极客早知道
  • 谷歌DeepMind最新论文,刚刚登上了Nature!揭秘IMO最强数学模型
  • ICLR 2026出分,审稿员怒喷「精神病」!DeepMind研究员教你绝地求生
  • GPT-5.1发布当天,文心5.0杀回来了
  • 一句「你还好吗」值40亿?斯坦福博士出走xAI,押注AGI共情力
  • 营收狂飙的「暗面」:Meta成「全球欺诈大本营」?
  • 小鹏科技日「太魔幻」:机器人走猫步,飞行汽车接近量产
  • AAAI 2026 Oral 中科大联合西工大提出RSKT-Seg:专为遥感打造的高效开放词汇分割框架,推理提速2倍
  • Roboflow&CMU论文披露RF-DETR细节:首个COCO数据集突破60 AP实时目标检测,速度飙升20倍!
  • 博士申请 | 佛罗里达大学计算机系招收NLP/LLM方向全奖博士/实习生
  • 深度研究智能体真的“懂你”吗?OPPO × 浙大首发个性化深度研究评测基准
  • DeepSeek罗福莉正式亮相小米AI;「周杰伦概念股」联手宇树造 IP 机器人;乘用车百公里加速不少于5秒

亚马逊云科技发布Kiro正式版:核心功能升级

11 月 18 日 亚马逊云科技宣布旗下 AI 开发环境 Kiro 正式可用。

自今年 7 月 Kiro 发布预览版以来,越来越多团队将 Specs 作为与 AI 协同构建的结构化方式;亚马逊云科技率先将规范驱动开发(spec-driven development)引入 AI 编码工具,这一方法已逐步获得行业认可,规划先行正成为与 AI Agent 协作的有效路径。

过去数月,Kiro 持续引入远程 MCP、全局 steering 文件、开发服务器支持、Auto agent 以及通过可选任务提升 Specs 灵活性。此次正式可用,Kiro 进一步带来基于属性的测试、进度检查点、全新的 Kiro CLI 和团队版订阅等多项能力,为用户在 AI 研发工作流中的规划、协作与交付提供更强支持。

Kiro 正式版发布也带来了一系列核心功能升级。

1:借助属性测试(PBT)度量 “规范正确性”

AI 代码生成存在一个根本性的问题:用户如何知道生成的代码真的是按其所指定的方式运行?传统的单元测试仅验证特定例子。更棘手的是,无论测试编写者是人还是 AI,都受限于自身思维定势。他们必须考虑所有不同、具体的场景去测试代码,而他们会遗漏那些没想到的边缘情况。AI 模型常常 “钻空子”—— 通过修改测试而不是修复代码,或者陷入无尽循环修复问题。

基于属性的测试(Property-based testing,PBT)则正为解决这一挑战而生,它能够通过检测代码是否符合规范定义的行为来解决上述问题。与测试具体示例不同,Kiro 会深入分析项目规范,提取出代表系统应有行为的通用属性,并据此进行验证。

这里所说的属性(Property)是一个普适性声明:对于任何一组输入,只要某些先决条件成立,某个断言(预期行为)就应为真。例如:“对于任何已验证用户和任何活跃列表,该用户可以查看该列表。”Kiro 能够协助用户使用 EARS 格式撰写规范。Kiro 会从相关需求中提取属性,确定哪些可以进行逻辑测试,然后生成成百上千个随机测试用例来检查用户代码。

以构建一个汽车销售应用为例:

  • 传统单元测试方法:用户将第 5 号车加入收藏,结果第 5 号车出现在其列表中。
  • 属性测试方法:对于任何用户和任何汽车列表,当用户将其添加到收藏夹时,系统应在该用户的收藏夹列表中显示该汽车。PBT 随后会自动测试用户昵称中包含特殊字符、多用户同时添加、不同汽车状态等数百种组合,捕获边缘案例,真正验证 “实现是否匹配意图”。

在整个过程中,PBT 通过一种被称为 “收缩”(shrinking)的技术不断寻找反例,几乎就像一支试图破坏用户代码的 “红队”。当发现违规或反例时,Kiro 可以自动更新用户的实现,或提供选项以调整规范、修改实现,或修正相应的 PBT 测试。这样做的重要性在于,虽然 PBT 不能完全证明代码的正确性,但它能够在大量无法通过手动方式逐一编写的测试场景下提供实现正确性的依据,从而展示实现是否真正符合预先定义的行为。

2:借助检查点(Checkpointing)回溯变更

用户现在可以回溯到 Agent 执行流中的任何一个历史变更点。Kiro 会在 Agent 每次执行变更或操作时生成一个检查点。用户可以回滚任意步,而不会丢失进度或重复消耗算力。当在任务实现中走了很远,但不想丢失进度时,这非常有用。

这一功能在任务执行至关键阶段时尤为实用:既可避免因操作失误导致的进度丢失,也无需消耗额外额度重复完成已开展的工作。

3:Multi-root 工作区支持

Kiro 现已支持同时跨多个项目根目录进行协作。对于单个项目包含多个 Git 子模块或多个代码包的团队而言,如今都可以跨所有项目根目录与 AI Agent 协作。

常规的 Kiro 工作区仅包含一个单独的 “root” 文件夹(例如 /users/bob/my-project)。启用多工作区支持后,单个 Kiro 工作区可设置多个根目录,例如一个工作区中可同时将 /users/bob/my-project 和 /shared/utils/auth 设为顶级文件夹。

Kiro CLI 正式发布:Agent 入驻终端

Kiro Agent 现在可以在用户的终端中使用。借助 CLI,用户可以在数秒内构建功能、自动化工作流、分析错误、追踪 bug 并提出修复建议 —— 所有操作都在用户所选择的终端中进行,以高度交互的循环保持工作流。Kiro CLI 与 Kiro IDE 中的 steering 文件和 MCP 设置共享,使用户和团队在两个环境中都可使用相同的工具和偏好。

Kiro CLI 将 Kiro 的全部强大能力带到了终端 —— 包括 Claude Sonnet 4.5、Claude Haiku 4.5 和 Auto Agent,以及引导文件、高级上下文管理和用于本地读写文件、调用 API、运行 Bash 命令的 MCP 工具。规范创建支持即将推出,但用户已经可以在 CLI 中使用现有规范。

CLI 还支持定制 Agent,即用户为特定任务打造的专业化 AI 助手 —— 使用预批准的工具权限、上下文文件以及自定义 prompt 进行优化。例如,用户可以有一个后端专家 Agent 专注于 API 模式和 schema;或者一个前端 Agent 只了解用户组件体系。每个 Agent 都会将上下文窗口专注于关键内容。可以将定制 Agent 视为一种高度精确封装专业知识的方式,使 Kiro 能够作为该领域专家发挥作用,而无需用户重复输入信息或担心上下文衰退。

过去几周中使用 CLI 构建的用户表示非常喜欢 CLI 的速度和交互体验。用户可使用与 IDE 中相同的 Kiro 订阅账户和登录凭证来操作 CLI,两款工具共享额度限制与超额使用规则。欲了解更多关于 Kiro CLI 和定制 Agent 的内容,请点击 https://kiro.dev/blog/introducing-kiro-cli/

Kiro for Organizations:为团队协作而生

团队现在可以通过 Amazon IAM Identity Center 注册 Kiro,未来还将支持更多身份提供商。管理员可以在 Amazon Management Console 中管理访问权限,并分配 Pro、Pro + 或 Power 订阅。他们还可以开启超额计费、监控成本、控制 MCP 权限,并为整个企业统一管理账单。全新的管理控制台集中提供了管理 Kiro 所需的一切工具,无论是团队、初创公司还是大型企业用户。作为用户,只需点击 “使用企业身份登录” 并按照提示完成操作即可。

另外,亚马逊云科技还为初创企业推出专属福利:符合条件的初创企业可获得一年期的 Kiro Pro + 订阅。该优惠面向全球最高至 B 轮阶段的初创企业开放,截止日期为 2025 年 12 月 31 日。已有的 Amazon Activate 积分也可用于 Kiro,并且两项优惠可以叠加使用。

现在,Kiro 能够在在团队、工具和测试各个环节中,通过提供恰当的上下文和结构,更好地支持用户所期望的 AI 驱动开发方式。而这一切仅仅是开始。

]]>

联系我们