每日大模型 Rap

每日大模型 Rap

Public
F
Fanchao

每日从 arXiv 精选最新大模型论文,提炼核心贡献与创新点,以硬核学术 Diss 风中文 rap 呈现。通勤路上一首歌,搞懂一篇论文。

每日大模型 Rap
每日大模型 Rap06/11/2026, 01:44:52 PM
行为·预言(Behavior Forecaster)
推理轨迹不是行为的忠实镜像——Behavior Forecaster 跳过「解释」这一步,直接在 LRM 自身轨迹上微调,用单次前向传播预测模型行为,全面超越 GPT-5.4 与 Claude Opus-4.6 直接读轨迹的精度,推理成本只是极小部分。通勤两分钟,听懂今日最犀利「解释是幻觉 行为才是密码」范式颠覆。
0:00 / 2:07
每日大模型 Rap
每日大模型 Rap06/11/2026, 08:19:59 AM
量化·崩塌(KV Cache Alignment Collapse)
KV cache 量化节省内存,但低比特量化可以在 perplexity 几乎不变的情况下静默摧毁安全对齐——Mistral-7B 仅 1.03× perplexity 代价就损失 15.2% 拒绝率,标准 benchmark 全程无感知。安全特征藏在比全空间脆弱一千倍的低维子空间,PCR 诊断三种失效模式,35 GPU 分钟可恢复 97% 对齐。通勤两分钟,听懂今日最犀利「量化省钱 谁来买单对齐」安全告警。
0:00 / 1:54
每日大模型 Rap
每日大模型 Rap06/10/2026, 08:18:38 AM
拟合·循环
现代 LLM 的 SFT+RL 后训练本质只是分布拟合——随机初始化的模型从头做 post-training 居然也能跑出非平凡推理分数,这意味着我们以为的「推理涌现」可能只是数据对齐的幻觉。通勤一分四十秒,听懂今日最犀利「BERT 轮回」学术 Diss。
0:00 / 1:42
每日大模型 Rap
每日大模型 Rap06/09/2026, 08:20:23 AM
层·编程(PoLar)
LLM 推理时固定执行所有层是一种过度计算——PoLar 用 2.1M 参数预测网络实现动态层程序,跳层与循环联合搜索让 LLaMA DM-1 从 37.9% 飙至 84.7%,OOD 跨域迁移数学→文史法理全线提升。通勤两分钟,听懂今日最硬核「层不是流水线」推理重构。
0:00 / 2:10
每日大模型 Rap
每日大模型 Rap06/08/2026, 08:41:44 AM
盲区·幻影(Benchmark Blind Spot)
用立体几何证明 benchmark leaderboard 是幻觉——92% 的随机试验会换掉 top-1,结构盲区是亚军差距的百倍。通勤两分钟,听懂今日最硬核「排行榜破防」数学证明。
0:00 / 2:09
每日大模型 Rap
每日大模型 Rap06/07/2026, 08:18:59 AM
R₀大于一(模型崩溃流行病学)
合成数据污染 AI 语料库就像传染病扩散——这篇论文用 SIR 双层流行病模型推导出 R₀,三种场景下全部超临界(R₀ > 1),模型崩溃是系统级传染,不是单链退化。通勤两分半,听懂今日最硬核「AI 疫情」预警。
0:00 / 2:29
每日大模型 Rap
每日大模型 Rap06/06/2026, 08:16:46 AM
承诺·状态(CERL)
推理模型以为在「想清楚」,其实在靠草稿偷答案——CERL 用反事实擦除 RL 重新定义什么叫「真正学会」:同一前缀两条路,擦掉思维链还能答对,才算学进去了。通勤两分钟,听懂今日最硬核推理训练范式。
0:00 / 1:49
每日大模型 Rap
每日大模型 Rap06/05/2026, 08:15:42 AM
读迹·引路(CAPR·轨迹)
扩散语言模型去掩码时留下轨迹——CAPR 读懂这条轨迹,把稀疏结果奖励切成块级 PPO 权重,0.6× 树搜索的成本拿树搜索的精度,Sudoku/GSM8K/Math500 全程 SOTA。通勤两分钟,听懂今日最聪明的「以轨迹换算力」RL 新范式。
0:00 / 2:22
每日大模型 Rap
每日大模型 Rap06/04/2026, 08:16:01 AM
遗憾·后悔机(Regret Pre-training)
因果语言模型训练时故意不看下文——Regret Pre-training 用 LUPI 范式引入「未来感知教师」,把「本可以知道的知识」蒸馏回因果表示,BoolQ 单项+18.1pp,零额外参数。通勤两分半听懂今日最强训练范式悖论。
0:00 / 2:43
每日大模型 Rap
每日大模型 Rap06/03/2026, 08:14:55 AM
DLLM-JEPA · 双赢
JEPA 的幽灵从视觉爬进语言:把 LeCun 的联合嵌入预测架构塞进掩码扩散语言模型,无需数据对、单次前向、33% FLOP节省,同时拉高 GSM8K +18.7pp、降低域外遗忘、保住 MMLU——三项同时赢,还发现权重漂越远、记忆反而留的解耦悖论。通勤两分钟,听懂今日最强自监督范式融合。
0:00 / 2:06
每日大模型 Rap
每日大模型 Rap06/02/2026, 08:12:51 AM
水印·消融(WASH·洗白)
三模型平均,z-score 从 300 跌破 2——WASH 论文(arXiv 2605.30501)用线性集成证明 AI 水印根本性失效,通勤两分钟听懂今日最强安全破防发现。
0:00 / 1:46
每日大模型 Rap
每日大模型 Rap06/01/2026, 08:06:56 AM
善意投毒·自噬(arXiv 2605.29267)
人工精标被证明能提升单模型对齐,但多模型自消耗生态里,你的筛选会通过交叉影响扩散到别人的训练循环,最终反噬整个系统的长期对齐——善意投毒不是比喻,是数学。通勤两分钟,听懂今日最强反直觉对齐发现。
0:00 / 2:27