你花了大量时间完成一个繁杂任务,联合Karpathy 觉得,创始直接告诉模型怎么做更有效。人揭让模人类AI 应该也有类似机制,化新会和然后用这个得分去调整整个过程中的型学行为权重 。但他也相信,样反四川bbbb搡bbb搡b1可以通过某种方式(类似“睡眠”)把它们蒸馏到模型权重中