深夜重磅!曝神秘模型「草莓」秋季推出,或迎来今年最重大升级
OpenAI传说中的「Strawberry(草莓)」模型终于要来了。
据外媒TheInformation报道,随着OpenAI不断筹集更多资金,其研究人员正在尝试推出一款新的AI产品,预计这款产品在解决复杂问题的能力上将超越现有的AI。
据两名参与该项目的知情人士透露,研究人员计划在今年秋季推出这款内部代号为「草莓」的新AI(此前称为Q*,发音为QStar),它可能会作为ChatGPT的一部分功能推出。
「草莓」可以解决此前从未见过的数学问题
,这是目前的聊天机器人无法做到的,并且还经过训练能够解决与编程相关的问题。
但这款AI的功能并不仅限于技术问题的解答,如果给「草莓」模型更多的「思考」时间,它还能回答客户关于更主观话题的问题,例如产品营销策略。
据悉,为了展示「草莓」在语言任务方面的强大能力,OpenAI员工还曾展示过它如何解出《纽约时报》「Connections」这一复杂文字谜题。
报道称,这项技术对未来AI产品,特别是旨在解决多步骤任务的智能体,具有重要意义。其中OpenAI及其竞争对手目前正在希望通过这些智能体来开辟更多的收入机会。
目前OpenAI的业务正在迅猛增长。
尽管其每月支出可能比这一数字还要高,但OpenAI向企业销售的大语言模型和ChatGPT订阅服务的月收入已较去年增长了近三倍,达到了2.83亿美元。
目前,OpenAI的估值已经达到860亿美元。然而报道指出,OpenAI的未来在一定程度上取决于其正在开发代号为Orion的新旗舰大语言模型。
据悉,这个模型旨在改进其去年早些时候推出的现有旗舰大语言模型GPT-4。到目前为止,其他竞争对手已经推出了在性能上与GPT-4相当的大语言模型。
不过,报道也指出,尚不确定OpenAI是否能在今年推出「草莓」聊天机器人版本,这个版本是原始「草莓」模型的简化版,称为蒸馏版。它旨在在保持高性能的同时,操作更为简便且成本更低。
知情人士表示,OpenAI还在利用「草莓」的更大版本生成用于训练Orion的数据。这种AI生成的数据被称为「合成数据」。
这意味着「草莓」可能帮助OpenAI缓解从互联网获取高质量训练数据的挑战。
此外,这位知情人士还表示,「草莓」可能有助于即将推出的OpenAI智能体减少幻觉。
MinionAI的CEO兼GitHubCopilot前首席架构师AlexGraveley表示,使用「草莓」生成更高质量的训练数据可能有助于OpenAI减少其模型产生的AI幻觉。
Graveley进一步解释道:「想象一下『没有幻觉的模型』,你问它一个逻辑难题,它第一次就答对了。」之所以能够做到这一点,是因为「训练数据中的模糊性更少,因此它的猜测更少。」
本月早些时候,OpenAICEOSamAltman在X平台上发布了一张草莓的图片,但没有作出详细说明,引发了全网大猜测。
而知情人士表示,今年夏天,OpenAI还向美国国家安全官员展示了「草莓」模型。
「我们认为这次模型所需的数据已经足够,」Altman在五月份的一次活动中说,这很可能是指Orion。「我们进行了各种实验,包括生成合成数据。」
目前,他还在努力为公司筹集更多资金并寻找减少亏损的方法。据知情人士透露,自2019年以来,OpenAI已从微软筹集了约130亿美元,作为与这家软件巨头合作的一部分,合同将持续到2030年。
这位知情人士还表示,深夜重磅!曝神秘模型「草莓」秋季推出,或迎来今年最重大升级合作条款可能会发生变化,包括OpenAI如何支付租用云服务器以开发其AI的费用,毕竟云服务器是OpenAI最大的成本来源。
截至发稿前,OpenAI的发言人对此报道未予置评。
路透社此前也曾报道了草莓的名称及其推理能力。业界普遍认为,一个能够解决复杂数学问题的AI可能是一个具有潜在利润的应用领域,因为现有的AI在航空航天和结构工程等数学密集型领域表现不佳。
不少AI研究人员也发现对话式AI,如ChatGPT及其同类产品容易给出错误答案,包括前一段时间爆火9.11和9.8比大小的难题也难倒了不少聊天机器人。
此外,数学推理的改进还可能帮助AI模型在推理对话查询方面表现更佳,例如处理客户服务请求。
据悉,Google和一些AI初创公司也在努力开发推理技术。上个月,GoogleDeepMind表示,其AI将击败国际数学奥林匹克竞赛中的大多数人类参与者。
OpenAI劲敌Anthropic此前表示,得益于其推理能力的提升,其最新的大语言模型能够编写比之前的大语言模型更复杂的软件代码,并回答有关图表和图形的问题。
为了提高模型的推理能力,一些AI初创公司一直在使用一种「讨巧」的方式,即将问题分解为更小的步骤,而代价就是这些解决方法速度慢且成本高。
外媒指出,无论草莓是否作为产品发布,人们对Orion的期望都很高,因为OpenAI希望继续领先于竞争对手,并保持其显著的收入增长。
有意思的是,草莓的诞生还与前OpenAI首席科学家IlyaSutskeve扯上了关系。
据悉,几年前,正是由时任OpenAI首席科学家的IlyaSutskever启动了对「草莓」模型的研究。只不过Ilya最近宣布从OpenAI离职,并创办了新公司「安全超级智能」(SafeSuperIntelligence,SSI)。
在他离开之前,OpenAI的研究人员JakubPachocki和SzymonSidor基于Sutskever的工作开发了一种新的数学求解模型Q*,这引发了一些关注AI安全的研究人员的担忧。
在Q*的开发过程中,OpenAI的研究人员还开发了一种被称为「测试时计算」(test-timecomputation)的概念变体,旨在提升大语言模型的解题能力。
该方法使模型有机会花更多时间考虑用户命令或问题的所有部分。当时,Sutskever还发表了一篇与这项工作相关的博客文章。
接下来,OpenAI将继续全力推动「草莓」的发布,以保持其在AI领域的领先地位,并应对来自其他公司的激烈竞争。
与此同时,Orion作为OpenAI下一个重要的大语言模型,肩负着公司未来发展的重任,其表现将对OpenAI的长期前景产生深远影响。
值得注意的是,随着OpenAI等公司在AI领域的不断突破,业界对AI安全性问题的关注也在日益增加。
特别是在AI技术逐步向更复杂的推理能力迈进的背景下,「草莓」和Q*的开发过程引发了关于AI伦理和安全的广泛讨论。
基于此,OpenAI以及整个AI行业所面临的挑战,不仅在于技术层面的突破,还在于如何平衡创新与安全之间的关系。
未来,随着更多类似「草莓」这样的AI产品的推出,AI的发展方向将更加多样化,也将对社会各方面带来更大的影响。
但不管怎么说,「草莓」的推出将标志着OpenAI在AI推理能力方面的又一次重要进步。无论是对现有的GPT-4进行改进,还是为未来的Orion模型提供支持,「草莓」都将发挥关键作用。