发布日期:2025-02-02 23:27 点击次数:110
低老本考验东谈主工智能推理模子的期间到来了?大小单双网站
近日,加州大学伯克利分校 Sky Computing Lab 的掂量团队 NovaSky 发布了一个名为 Sky-T1-32B-Preview 的开源东谈主工智能推理模子,这一模子在多项关节基准测试中发达出与 OpenAI 早期 o1 版块越过的水平,更令东谈主防护标是,其树立老本仅为 450 好意思元!
相较于不久前动辄数百万好意思元的模子树立用度,Sky-T1-32B-Preview 可谓是一个广漠的跳动。NovaSky 团队在博客著述中默示:
" Sky-T1-32B-Preview 的考验老本不到 450 好意思元,这证明了以低老本、高后果复制高档推理才能是可行的。"
那么,为什么 NovaSky 团队能大幅裁汰考验老本?
把柄 NovaSky 团队的证明,树立老本的大幅裁汰主要收成于合成考验数据的应用—— NovaSky 团队期骗阿里巴巴的 QwQ-32B-Preview 模子,生成了 Sky-T1-32B-Preview 的运转考验数据,随后"整理"数据羼杂,并期骗 OpenAI 的 GPT-4o-mini 将数据重构为更易用的措施,最终造成了可用的考验集。使用 8 个 Nvidia H100 GPU 机架考验 320 亿参数的 Sky-T1-32B-Preview 模子,粗略需要 19 个小时。
证明还提到,Sky-T1-32B-Preview 在 MATH500(一套竞赛级数学挑战题)和 LiveCodeBench(一个编程评估集)的部分贫苦上,发达优于 o1 的早期预览版;在 GPQA-Diamond(包含 PhD 级别的物理、生物和化知识题)测试中,Sky-T1-32B-Preview1 的发达略逊于 o1 预览版。
不外需要注重的是大小单双网站,OpenAI 郑重发布的 o1 版人性能更强,且预测将在将来几周内推出更先进的 o3 模子。
Powered by 大小单双网站-官方网站 @2013-2022 RSS地图 HTML地图