在日益激烈的AI模型市场中,小模型以其独特的魅力和实用价值脱颖而出,吸引了众多开发者和企业的关注。它们不仅在资源受限的环境下展现出卓越的性能,还因其高效、便捷及成本低廉的特点,成为诸多应用场景的理想选择。面对谷歌、Anthropic等竞争对手的小模型布局,OpenAI适时入局,旨在巩固其市场领先地位。技术的不断进步使小模型的性能得到显著提升,能够满足开发者对高性能与低成本的双重需求。GPT-4o Mini的问世,标志着AI模型发展的一个新里程碑,它以远低于GPT-3的成本,实现了超越前者的强大功能,预示着GPT-3.5时代的落幕。这一变革不仅体现了AI技术的迅猛发展,也为未来AI应用开辟了更为广阔的空间。
这段小编建议概括了小模型的兴起原因、OpenAI入局小模型市场的动机,以及GPT-4o Mini作为新一代模型的重要意义,为读者呈现了一个清晰的行业动态概览。
在看这篇文章之前,希望大家先思考两个问题。
为什么人们喜欢用小模型?为什么OpenAI选择现在入局小模型市场?
问题一:为什么人们喜欢用小模型?
与庞大的大模型相比,小模型在许多方面展现出独特的优势。
无论是资源受限的环境,还是对响应速度有严格要求的应用场景,小模型都以其高效、便捷和成本低廉的特性赢得了广泛的青睐。
小模型在特定的领域下具有一定的优势,且它的体积较小,适合部署在各种设备和平台上,且对于个人开发者来说足够友好。
问题二:为什么OpenAI选择现在入局小模型市场?
(1)行业竞争的压力
其他公司如谷歌和Anthropic等已经推出了自己的小模型,OpenAI入局小模型市场也是为了在市场竞争中保持优势,不想再让自己的开发者跑到别家去了~
(2)技术成熟
随着人工智能技术的不断发展和优化,小模型的性能得到了显著提升,能够在许多应用场景中提供足够的准确性和效率。
(3)响应开发者需求
开发者需要在模型性能和成本之间找到平衡。GPT-4o Mini在保持较高性能的同时,显著降低了成本,满足了开发者对高性能和低成本模型的需求。并且在资源有限的情况下,小模型更加容易部署。
在GPT-4o发布之后,奥特曼自己也感叹到在2年前,世界上最好的模型还是GPT-3的text-davinci-003版本。
然而现在仅仅过了两年,比GPT-3便宜100倍,性能反而更强大的模型GPT-4o Mini出现了。
当然GPT-3.5也确实是功成身退了,要知道当时在GPT3.5发布的时候直接轰动了全球,然而现在也终于是能退休了~
不过目前还可以通过API来调用GPT-3.5,但是有这么强的新免费模型,估计也没人在用他了(唏嘘~)。
GPT-4o Mini的价格目前是
每百万输入tokens/15美分(约1.09元人民币)
每百万输出tokens/60美分(约4.36元人民币)
这个价格比GPT3.5-turbo还要低,直接便宜了60%
这就意味着,我们能花更少的钱,体验到更强大的模型。
GPT-4o Mini在性能上显然也超越了GPT-3.5 Turbo,并且在LMSYS“聊天机器人对战”排行榜上表现还超过了GPT-4。在价格方面,GPT-4o Mini
我们来看一下官方发布的基准测试结果
GPT-4o Mini 在多模态推理方面的水平已经超过了 GPT-3.5 Turbo 和其他小型模型。
并且他的多语种支持也没被砍,和GPT-4o一样。
在推理任务上:GPT-4o Mini 在涉及文本和视觉的推理任务方面优于其他小型模型,
在文本智能和推理基准 MMLU 上的得分为 82.0%,
而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
数学和编码能力:GPT-4o Mini 在数学推理和编码任务方面表现出色,优于市场上以前的小型模型。
在MGSM的测试中GPT-4o Mini 得分为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。
GPT-4o Mini 在多模态推理评估 MMMU 上也表现出强劲的表现,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
就目前来看,GPT-4o Mini的拥有头部模型的强度,但是价格却仅次于Llama 3 8B。
1m tokens/15美分的价格真的是太香了。
有的同学可能不知道1m tokens是什么概念,举个例子
1m大约包含了200万个英文字符
一本标准的小说可能包含大约10万到20万个单词,1m tokens足以处理5到10本这样的书籍。
就目前来看,GPT-4o MIini毫无疑问是当前最具性价比的模型,有着和GPT-4o相媲美的能力,但是价格却仅为GPT-4o的3%。
更吊的是它的推理效率方面,183 token/s的生成让GPT-4o Mini成为了大模型中的绝对王者。
当然最重要的还是,它免费!免费!免费!开放给所有用户~
什么Claude3.5 什么Gemini1.5,统统走开!
真的是太香了!