ACL 2026主会論文が言語学界で半世紀研究されてきたものをLLMに持ち込んだ。
人間の読書研究は早就发现的:常见的词、人读得快。LLM呢?
香港中文大学团队在arXiv:2604.02176给了直接答案——LLM也喜欢高频文本。命名为Adam's Law(文本频率定律TFL)。
核心思路
三步框架:
估频率:用在线资源估算句子级别文本频率。
改写:input paraphraser把输入改写成更高频表达。
课程学习微调:CTFT按句子频率从低到高微调模型。
四组实验:数学推理、机器翻译、常识推理、Agent工具调用,结果一致。
主要来源:arXiv:2604.02176