发布于 2025-03-04
摘要
序言 在大语言模型(LLM)快速发展的时代,transformer架构的大语言模型的理解能力评估主要集中在图形,语言理解,忽略了上 …
序言 在大语言模型(LLM)快速发展的时代,transformer架构的大语言模型的理解能力评估主要集中在图形,语言理解,忽略了上 …
介绍 在WWDC2024发布了Apple Intelligence相关的AI组件,Apple少见的不改名技术(例如把120hz改名 …
从基础模型上强化学习 R1-Zero使用大规模RL进行训练,不使用任何SFT数据,模型展示了显著的推理能力,例如自我验证、反思和生 …