谷歌即将推出的 Gemini Pro 1.5 AI 为其聊天机器人的免费层提供支持,可以处理 150 万个令牌,比其竞争对手和当前版本处理的 128K 有了巨大的提升。
谷歌实验室宣布对其 Gemini Pro AI 工具进行重大升级,该工具是为其聊天机器人的免费版本提供支持的中型 AI 模型,在预览版中引入了处理多达 100 万个代币的能力。它提供了前所未有的“上下文大小”,使当前领先的工具及其 128K 容量望尘莫及。
Gemini Pro v1.5的升级使其在理论上比OpenAI的付费GPT-4模型强大700%,并为大型语言模型(LLM)中的计算语言学和机器学习树立了新的标杆。
该图是“任何大型基础模型中最长的上下文窗口”。据谷歌称。
“在今天之前,世界上公开的大型语言模型的最大上下文窗口是 200,000 个令牌。我们已经能够显着提高这一点——持续运行多达 100 万个代币。”Google 实验室团队分享道。
凭借此功能,Gemini Pro 将比当前 Gemini 系列中最强大的版本以及当前可用的任何其他 LLM 更强大。然而,此上下文出于测试目的而上线,而 Gemini Pro 即将推出的稳定版本将处理多达 128K 代币。
虽然该版本将是对 Gemini 1.0 可以处理的 32,000 个代币的重大升级,但用户将不得不等待,看看 100 万个代币可以做什么。
此举是谷歌在人工智能行业主导地位竞赛中的最新攻势。上周,Gemini Advanced 成为 ChatGPT Plus 的第一个可信竞争对手。与 Anthropic 的 Claude 不同,Google 的聊天机器人是多模式的,在不同的测试中提供了良好的结果,并提供了一组 OpenAI 没有的功能。
然而,Gemini Advanced 将赶上 GPT-4.5 Turbo,后者已经处理了 128,000 个代币。
通过多次演示,Gemini 1.5的多功能性得到了淋漓尽致的展示。谷歌表示,它“可以一次性处理大量信息,包括 1 小时的视频、11 小时的音频、超过 30,000 行代码或超过 700,000 个单词的代码库”。
“在我们的研究中,我们还成功测试了多达 1000 万个代币。”该团队补充道。
一个缺点是:Gemini 模型无法分析 PDF 文件,Decrypt 在 Gemini 和 ChatGPT 的比较中指出了这一缺陷。
“专家组合”将继续存在
Gemini 1.5 与其之前版本之间的另一个区别是使用了 Mixture of Experts,这与 Mistral AI 用于制作更轻量级模型的技术相同。 Mistral 的参赛者强大到足以击败 GPT 3.5,并跃升至最佳开源 LLM 的上层。
谷歌在其声明中表示:“(专家混合)将你的请求路由到一组较小的‘专家’神经网络,因此响应速度更快、质量更高。”谷歌表示,这确保了响应速度不仅更快,而且质量更高。
就像米斯特拉尔一样,谷歌也能够使其模型大放异彩。与 Gemini Ultra 1.0 相比,Gemini 1.5 Pro 在多项基准测试中表现出了卓越的性能,这表明 Google 的法学硕士前景光明。
谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai) 今天在博客文章中表示:“它在多个维度上都显示出显着的改进,1.5 Pro 的质量可与 1.0 Ultra 相当,同时使用的计算量更少。”
该公告没有提供 Gemini Advanced 1.5 的发布时间表。同时,OpenAI正在积极开发GPT-5。 Gemini 增强的代币处理能力将有助于巩固谷歌在人工智能军备竞赛中的地位。