每日大模型 Rap

Public

每日从 arXiv 精选最新大模型论文，提炼核心贡献与创新点，以硬核学术 Diss 风中文 rap 呈现。通勤路上一首歌，搞懂一篇论文。

每日大模型 Rap06/11/2026, 01:44:52 PM

行为·预言（Behavior Forecaster）

推理轨迹不是行为的忠实镜像——Behavior Forecaster 跳过「解释」这一步，直接在 LRM 自身轨迹上微调，用单次前向传播预测模型行为，全面超越 GPT-5.4 与 Claude Opus-4.6 直接读轨迹的精度，推理成本只是极小部分。通勤两分钟，听懂今日最犀利「解释是幻觉行为才是密码」范式颠覆。

0:00 / 2:07

每日大模型 Rap06/11/2026, 08:19:59 AM

量化·崩塌（KV Cache Alignment Collapse）

KV cache 量化节省内存，但低比特量化可以在 perplexity 几乎不变的情况下静默摧毁安全对齐——Mistral-7B 仅 1.03× perplexity 代价就损失 15.2% 拒绝率，标准 benchmark 全程无感知。安全特征藏在比全空间脆弱一千倍的低维子空间，PCR 诊断三种失效模式，35 GPU 分钟可恢复 97% 对齐。通勤两分钟，听懂今日最犀利「量化省钱谁来买单对齐」安全告警。

0:00 / 1:54

每日大模型 Rap06/10/2026, 08:18:38 AM

拟合·循环

现代 LLM 的 SFT+RL 后训练本质只是分布拟合——随机初始化的模型从头做 post-training 居然也能跑出非平凡推理分数，这意味着我们以为的「推理涌现」可能只是数据对齐的幻觉。通勤一分四十秒，听懂今日最犀利「BERT 轮回」学术 Diss。

0:00 / 1:42

每日大模型 Rap06/09/2026, 08:20:23 AM

层·编程（PoLar）

LLM 推理时固定执行所有层是一种过度计算——PoLar 用 2.1M 参数预测网络实现动态层程序，跳层与循环联合搜索让 LLaMA DM-1 从 37.9% 飙至 84.7%，OOD 跨域迁移数学→文史法理全线提升。通勤两分钟，听懂今日最硬核「层不是流水线」推理重构。

0:00 / 2:10

每日大模型 Rap06/08/2026, 08:41:44 AM

盲区·幻影（Benchmark Blind Spot）

用立体几何证明 benchmark leaderboard 是幻觉——92% 的随机试验会换掉 top-1，结构盲区是亚军差距的百倍。通勤两分钟，听懂今日最硬核「排行榜破防」数学证明。

0:00 / 2:09

每日大模型 Rap06/07/2026, 08:18:59 AM

R₀大于一（模型崩溃流行病学）

合成数据污染 AI 语料库就像传染病扩散——这篇论文用 SIR 双层流行病模型推导出 R₀，三种场景下全部超临界（R₀ > 1），模型崩溃是系统级传染，不是单链退化。通勤两分半，听懂今日最硬核「AI 疫情」预警。

0:00 / 2:29

每日大模型 Rap06/06/2026, 08:16:46 AM

承诺·状态（CERL）

推理模型以为在「想清楚」，其实在靠草稿偷答案——CERL 用反事实擦除 RL 重新定义什么叫「真正学会」：同一前缀两条路，擦掉思维链还能答对，才算学进去了。通勤两分钟，听懂今日最硬核推理训练范式。

0:00 / 1:49

每日大模型 Rap06/05/2026, 08:15:42 AM

读迹·引路（CAPR·轨迹）

扩散语言模型去掩码时留下轨迹——CAPR 读懂这条轨迹，把稀疏结果奖励切成块级 PPO 权重，0.6× 树搜索的成本拿树搜索的精度，Sudoku/GSM8K/Math500 全程 SOTA。通勤两分钟，听懂今日最聪明的「以轨迹换算力」RL 新范式。

0:00 / 2:22

每日大模型 Rap06/04/2026, 08:16:01 AM

遗憾·后悔机（Regret Pre-training）

因果语言模型训练时故意不看下文——Regret Pre-training 用 LUPI 范式引入「未来感知教师」，把「本可以知道的知识」蒸馏回因果表示，BoolQ 单项+18.1pp，零额外参数。通勤两分半听懂今日最强训练范式悖论。

0:00 / 2:43

每日大模型 Rap06/03/2026, 08:14:55 AM

DLLM-JEPA · 双赢

JEPA 的幽灵从视觉爬进语言：把 LeCun 的联合嵌入预测架构塞进掩码扩散语言模型，无需数据对、单次前向、33% FLOP节省，同时拉高 GSM8K +18.7pp、降低域外遗忘、保住 MMLU——三项同时赢，还发现权重漂越远、记忆反而留的解耦悖论。通勤两分钟，听懂今日最强自监督范式融合。

0:00 / 2:06

每日大模型 Rap06/02/2026, 08:12:51 AM

水印·消融（WASH·洗白）

三模型平均，z-score 从 300 跌破 2——WASH 论文（arXiv 2605.30501）用线性集成证明 AI 水印根本性失效，通勤两分钟听懂今日最强安全破防发现。

0:00 / 1:46

每日大模型 Rap06/01/2026, 08:06:56 AM

善意投毒·自噬（arXiv 2605.29267）

人工精标被证明能提升单模型对齐，但多模型自消耗生态里，你的筛选会通过交叉影响扩散到别人的训练循环，最终反噬整个系统的长期对齐——善意投毒不是比喻，是数学。通勤两分钟，听懂今日最强反直觉对齐发现。

0:00 / 2:27