2024-07-23 11:44:17

GPT-3.5功成身退,奥特曼携GPT-4o mini开卷小模型,成本猛跌99%

摘要
在日益激烈的AI模型市场中,小模型以其独特的魅力和实用价值脱颖而出,吸引了众多开发者和企业的关注。它们不仅在资源受限的环境下展现出卓越的性能,还因其高效、便捷及成本低廉

在日益激烈的AI模型市场中,小模型以其独特的魅力和实用价值脱颖而出,吸引了众多开发者和企业的关注。它们不仅在资源受限的环境下展现出卓越的性能,还因其高效、便捷及成本低廉的特点,成为诸多应用场景的理想选择。面对谷歌、Anthropic等竞争对手的小模型布局,OpenAI适时入局,旨在巩固其市场领先地位。技术的不断进步使小模型的性能得到显著提升,能够满足开发者对高性能与低成本的双重需求。GPT-4o Mini的问世,标志着AI模型发展的一个新里程碑,它以远低于GPT-3的成本,实现了超越前者的强大功能,预示着GPT-3.5时代的落幕。这一变革不仅体现了AI技术的迅猛发展,也为未来AI应用开辟了更为广阔的空间。
这段小编建议概括了小模型的兴起原因、OpenAI入局小模型市场的动机,以及GPT-4o Mini作为新一代模型的重要意义,为读者呈现了一个清晰的行业动态概览。

GPT-3.5功成身退,奥特曼携GPT-4o mini开卷小模型,成本猛跌99%

在看这篇文章之前,希望大家先思考两个问题。

为什么人们喜欢用小模型?为什么OpenAI选择现在入局小模型市场?

问题一:为什么人们喜欢用小模型?

与庞大的大模型相比,小模型在许多方面展现出独特的优势。

无论是资源受限的环境,还是对响应速度有严格要求的应用场景,小模型都以其高效、便捷和成本低廉的特性赢得了广泛的青睐。

小模型在特定的领域下具有一定的优势,且它的体积较小,适合部署在各种设备和平台上,且对于个人开发者来说足够友好。

问题二:为什么OpenAI选择现在入局小模型市场?

(1)行业竞争的压力

其他公司如谷歌和Anthropic等已经推出了自己的小模型,OpenAI入局小模型市场也是为了在市场竞争中保持优势,不想再让自己的开发者跑到别家去了~

(2)技术成熟

随着人工智能技术的不断发展和优化,小模型的性能得到了显著提升,能够在许多应用场景中提供足够的准确性和效率。

(3)响应开发者需求

开发者需要在模型性能和成本之间找到平衡。GPT-4o Mini在保持较高性能的同时,显著降低了成本,满足了开发者对高性能和低成本模型的需求。并且在资源有限的情况下,小模型更加容易部署。

在GPT-4o发布之后,奥特曼自己也感叹到在2年前,世界上最好的模型还是GPT-3的text-davinci-003版本。

然而现在仅仅过了两年,比GPT-3便宜100倍,性能反而更强大的模型GPT-4o Mini出现了。

当然GPT-3.5也确实是功成身退了,要知道当时在GPT3.5发布的时候直接轰动了全球,然而现在也终于是能退休了~

不过目前还可以通过API来调用GPT-3.5,但是有这么强的新免费模型,估计也没人在用他了(唏嘘~)。

GPT-4o Mini的价格目前是

每百万输入tokens/15美分(约1.09元人民币)

每百万输出tokens/60美分(约4.36元人民币)

这个价格比GPT3.5-turbo还要低,直接便宜了60%

这就意味着,我们能花更少的钱,体验到更强大的模型。

GPT-4o Mini在性能上显然也超越了GPT-3.5 Turbo,并且在LMSYS“聊天机器人对战”排行榜上表现还超过了GPT-4。在价格方面,GPT-4o Mini

我们来看一下官方发布的基准测试结果

GPT-4o Mini 在多模态推理方面的水平已经超过了 GPT-3.5 Turbo 和其他小型模型。

并且他的多语种支持也没被砍,和GPT-4o一样。

在推理任务上:GPT-4o Mini 在涉及文本和视觉的推理任务方面优于其他小型模型,

在文本智能和推理基准 MMLU 上的得分为 82.0%,

而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。

数学和编码能力:GPT-4o Mini 在数学推理和编码任务方面表现出色,优于市场上以前的小型模型。

在MGSM的测试中GPT-4o Mini 得分为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。

GPT-4o Mini 在多模态推理评估 MMMU 上也表现出强劲的表现,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。

就目前来看,GPT-4o Mini的拥有头部模型的强度,但是价格却仅次于Llama 3 8B。

1m tokens/15美分的价格真的是太香了。

有的同学可能不知道1m tokens是什么概念,举个例子

1m大约包含了200万个英文字符

一本标准的小说可能包含大约10万到20万个单词,1m tokens足以处理5到10本这样的书籍。

就目前来看,GPT-4o MIini毫无疑问是当前最具性价比的模型,有着和GPT-4o相媲美的能力,但是价格却仅为GPT-4o的3%。

更吊的是它的推理效率方面,183 token/s的生成让GPT-4o Mini成为了大模型中的绝对王者。

当然最重要的还是,它免费!免费!免费!开放给所有用户~

什么Claude3.5 什么Gemini1.5,统统走开!

真的是太香了!

声明:文章不代表本站观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
回顶部