动态列表

GPT-5王者归来？奥特曼称AI已跨科学门槛，三大学科正迎来实质性突破
老黄押宝「美版DeepSeek」！谷歌天才叛将创业，一夜吸金20亿美元
任意Agent皆可强化学习！微软推出Agent Lightning框架，无需修改任何代码
13万被引！ImageNet作者苏昊或将加盟复旦
250份文档投毒，一举攻陷万亿LLM！Anthropic新作紧急预警
和两位 CEO 聊 Sora：应用层爆发的里程碑事件，创业者的机会来了
新一代短剧人，涌向郑州「淘金」
社交媒体的黄金时代，结束了
东京大学、牛津大学等联合发布VLA万字综述：机器人迈向通用智能的全栈指南
U-Bench：U-Net十年“大乱斗”终结者，100个变体、28个数据集的终极对决
DeepSeek苦练1T，清华只用5B？InfLLM-V2把稀疏注意力玩明白了
EMNLP 2025 | 拨云见日：知识电路分析揭示大语言模型“知识遮蔽”幻觉之源
Sora 下载量破 100 万次；国庆中秋假期国内游总花费超过 8000 亿元；智驾多位核心高管离职，蔚来回应｜极客早知道
谷歌杀入诺奖神殿，两年三冠五得主！世界TOP3重现贝尔实验室神话
OpenAI×英伟达，可能创造了人类史上最大万亿级泡沫
H-1B正在筛掉「下一个英伟达」？
全球AI视频大战升级！「中国版Sora」Vidu Q2参考生月底发布，能力对标Sora 2
第二代InfLLM开源，同尺寸快三倍！零参数，可训练稀疏注意力
稳住训练、跑出泛化：STAGE重写「自回归图像生成」的强化学习范式
腾讯推出TRM：让大模型像人类一样批判性思考，从文本依赖到事实正确
马毅团队重磅发布新书：从MCR²到白盒Transformer，重构深度学习的第一性原理
Diffusion²来袭：威斯康星大学&华盛顿大学等提出双扩散模型，“回溯历史-预测未来”，破解自动驾驶“鬼探头”难题
北大等提出TrackVLA++：赋予机器人推理与记忆，跟踪成功率飙升12%
把我的第一次日本旅行，完全交给 AI 是什么体验？
英伟达将投资马斯克的 xAI；低价版Model 3/Y 「阉割」智驾功能；微信推出批量撤回信息功能
刚刚，清华物理传奇Yao Shunyu，跳槽谷歌DeepMind！
赚100亿，烧1万亿！OpenAI算力神话：英伟达撒钱、AMD送股、全硅谷陪跑
英伟达垄断AI算力局面或将被颠覆！AMD赌上身家发起决斗，奥特曼窃喜
刚刚，2025年诺贝尔化学奖揭晓！偷溜进图书馆的少年，改变了世界
小心，AI依赖会让你变笨！吴恩达等专家教你如何正确使用AI
无RLHF，7M小模型反超DeepSeek-R1：三星团队用递归思考取代规模堆叠
告别深度传感器！慕尼黑工业大学提出DropD-SLAM：仅用单目RGB即可实现RGB-D级的SLAM精度
IROS 2025 | Waymo与谷歌DeepMind联手提出Drive&Gen：用生成视频评估自动驾驶，虚拟测试更逼真
陶哲轩联手ChatGPT！10分钟击碎30年「无理」难题，数学圈炸裂
刚刚，奥特曼官宣ChatGPT「终极OS入口」！8分钟速搭智能体，8亿人狂欢
顿悟不是玄学！港科大清华等联手：撕开推理黑箱，RL让AI像人思考
4万亿帝国接班人浮出水面！苹果不需要另一个库克
刚刚，2025年诺贝尔物理学奖揭晓！量子计算成最大赢家
NeurIPS 2025 | 北邮用“图+文”把人物检索拉满：自动合成数据 × 细粒度特征对齐
告别梯度！Evolution Strategies全参微调挑战PPO/GRPO：更稳、更省、更好复现
TPAMI 2025 | 电子科大等提出EEMFlow：从事件相机学习高效Meshflow与光流，速度提升30倍
MICCAI 2025 | 莱斯大学提出MetaSeg：参数减少90%，元学习隐式网络重塑医学图像分割
OpenAI 与 AMD 签百亿美元协议，后者股价暴涨；特斯拉廉价 Model Y 将于 7 日发布；知名旅行、听歌应用入住 ChatGPT
乔纳森下一个iPhone神话，要黄了？OpenAI秘密AI硬件深陷三重困境
3年手搓ChatGPT！剑桥天才少年在Minecraft游戏中爆火回归
一举击败Claude Code！微软提出代码生成黑科技：一键直出36K行代码
刚刚，2025年诺贝尔生理学或医学奖揭晓！三位得主点燃器官移植希望
OpenAI入股AMD，股价暴涨35%！奥特曼左手黄仁勋，右手苏姿丰，通吃全球算力
真实数据、全链路、可复核：GenoMAS打造更可信的基因分析智能体
自进化Agent的第三种可能：隐式记忆，不动模型参数，胜过GRPO
NeurIPS 2025 | 高通提出GCL：无需额外数据，通用多模态检索迎来“一统江湖”新范式
NeurIPS 2025 | 慕尼黑工业大学提出SIM(3)等变网络：让3D形状补全告别“姿态偏见”，实现跨域泛化
今日迎本世纪「最晚中秋月圆」；雷军：小米17 五天销量破百万；ChatGPT 或添私信聊天功能
腾讯王者归来：混元图像3.0登顶LMArena！一手实测全球最强图像AI
AI「学不会」竟成相变探针！UCSD华人联手谷歌等，曝光量子纠缠秘密
最新，2025诺奖预测出炉！中国科学家有望拿下化学奖？
奥特曼：感受不到GPT-5变强，是因为你还不够「专业」
GPT-6或将比GPT-5强10倍！奥特曼揭秘ChatGPT如何诞生
宾大提出F³：事件相机迎来“预测性”表征新范式，光流、分割、深度全SOTA！
“移步换景”一试，大模型全乱了：OST-Bench揭示MLLM时空推理短板
NeurIPS 2025 | AI也能做数学建模？本科生携手MM-Agent勇夺美赛全球前2%
LSTM之父再出手！xLSTM挑战Transformer：一场关于Scaling Laws的正面交锋
微软下架「炉石」等多款游戏；华为云：华为算力效能超英伟达芯片 3 倍；马斯克回应特斯拉机器人打拳：并非遥控
陶哲轩联手GPT-5，1小时攻克数学难题！全程无需编码，OpenAI副总惊呼
1亿签约金抢AI大神？谷歌AI元老劝退全网：别再读博了！
三天逆袭，Sora登顶美榜！15秒大片玩疯奥特曼，全网直呼真假难辨
10个Agent一键组队：并行智能体协作，端到端交付从24h缩减到4h！
首位AI女演员出道！好莱坞「天敌」来了，下一代偶像全是代码制造？
南理工提出FMC-DETR：巧用“频率解耦”，航拍小目标检测精度飙升8.2% AP50
网红挑战特斯拉FSD穿越美国出车祸；小米回应「小米汽车突然自己开走」；Sora 登顶美区苹果商城免费榜

北京/上海内推 | 阶跃星辰招聘RL for AIGC方向算法研究员/实习生

2025-10-10未知作者来源

帮你找工作的 2025-10-10 13:17 北京

合适的工作难找？最新的招聘信息也不知道？

AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！

阶跃星辰

阶跃星辰是行业领先的通用大模型创业公司，坚定探索实现通用人工智能的道路。公司于 2023 年 4 月成立，聚集人工智能领域的顶尖人才，已对外发布 Step 系列通用大模型矩阵，覆盖了从语言、多模态到推理的全面能力，并面向开发者连续开源多个业内领先的多模态大模型。

产业应用方面，阶跃星辰聚焦智能终端 Agent，已在汽车、手机、具身智能、IoT 等关键应用场景与行业头部公司达成深度合作。此外，阶跃星辰已在金融财经，内容创作等领域携手合作伙伴，共同打造垂直场景下的创新 C 端应用体验。

算法研究员/实习生

坐标：北京（优先）/上海

方向：RL for AIGC

性质：社招/实习

岗位职责

1. 研发适用于视觉生成任务的文生图基座大模型和图像编辑大模型后训练算法RLHF，显著超越Stable Diffusion、Flux以及QWen-image等开源基座模型；

2. RLHF奖赏模型设计，以数据驱动，设计并研发从美学评分、指令遵循、文字渲染以及肢体优化等多个维度的reward model，提升并激发生成模型后训练上限；

3. RLHF强化学习算法研发，基于Diffusion/AR generation model生成过程构建更高效和稳定的强化学习系统，探索RLHF在视觉生成领域的scaling law。

岗位要求

1. 全职研究员要求两年左右视觉生成领域工作经验，实习生要求生成或者RL方向有相关的论文发表。了解自然语言/多模态大模型的基本原理，对于视觉生成领域的流行算法（包括但不限于GAN系列，VQ-VAE，Diffusion Model和AutoRegressive model系列等）有一手的实践经验，对深度强化学习的核心算法（如MDP, Policy Gradient, Q-Learning，TRPO，PPO和GRPO等）有深刻理解。有相关方向的顶会论文、知名开源项目或重要产品落地者优先；

2. 优秀的编程能力，熟练使用pytorch，熟悉megatron分布式训练框架，对OpenRLHF， ROLL以及VERL等开源RL框架熟悉更优；

3. 熟悉AIGC应用数据准备的全流程，包括数据采集、清洗、标注等，对于如何人工合成高质量训练数据有深入的理解；

4. 有强烈的责任心，良好的团队合作能力和跨团队沟通能力。

投递方式

📪 zhangxuanyang@stepfun.com

邮件标题注明：姓名-岗位名称-AI求职