领先的人工智能初创公司 Anthropic 今天发布了 Claude 3 系列人工智能模型,旨在满足企业客户的多样化需求,在智能、速度和成本效率之间取得平衡。
该系列包括三种型号:Opus、Sonnet 和即将推出的 Haiku。
该阵容中的明星是 Opus,Anthropic 声称它比市场上任何其他公开可用的人工智能系统都更强大,甚至超越了竞争对手 OpenAI 和谷歌的领先模型。
Anthropic 联合创始人兼首席执行官 Dario Amodei 在接受 VentureBeat 采访时表示:“Opus 能够执行最广泛的任务,并且执行得非常出色。”
Amodei 解释说,Opus 在多种基准测试中均优于 GPT-4、GPT-3.5 和 Gemini Ultra 等顶级 AI 模型。
这包括在数学推理的 GSM-8k 和专家级知识的 MMLU 等学术基准上名列前茅。
“它似乎比所有人都表现出色,并且在某些任务上取得了我们以前从未见过的分数,”阿莫迪说。
信用:人类
虽然 Anthropic 和 Google 等公司尚未披露其领先模型的完整参数,但两家公司报告的基准测试结果表明 Opus 在核心能力上匹配或超过了 GPT-4 和 Gemini 等主要替代品。
至少在纸面上,这为商用对话人工智能树立了新的高水平。
Opus 专为需要高级推理的复杂任务而设计,以其卓越的性能在 Anthropic 的产品阵容中脱颖而出。
提供中程、快速选项
Sonnet 是中档型号,为企业提供更具成本效益的日常数据分析和知识工作解决方案,保持高性能,而无需旗舰型号的高价标签。
与此同时,Haiku 的设计速度快且经济,适用于面向消费者的聊天机器人等应用,其中响应能力和成本是关键因素。
Amodei 告诉 VentureBeat,他预计 Haiku 将在“几周而不是几个月”内公开发布。
信用:人类
新的视觉功能解锁新的用例
今天推出的每个型号都支持图像输入,这是一项需求量很大的功能,特别是对于图像中的文本识别等应用。
Anthropic 总裁兼联合创始人 Daniela Amodei 告诉 VentureBeat:“我们没有那么关注输出模式,因为企业方面对此的需求较少。”她强调了该公司的战略重点是企业最抢手的功能。
此外,Claude 3 模型还展示了与其他最先进模型相当的复杂计算机视觉能力。
这种新模式开辟了企业需要从图像、文档、图表和图表中提取信息的用例。
“许多[客户]数据要么是高度非结构化的,要么是某种视觉格式的,”丹妮拉解释道。
“仅仅必须手动复制这些信息才能使其与生成式人工智能工具交互的过程就相当麻烦了。”
法律服务、财务分析、物流和质量保证等领域可以受益于理解现实世界视觉和文本的人工智能系统。
走在人工智能偏见的钢丝上
Anthropic 的宣布是在围绕谷歌新聊天机器人 Gemini 引发争议之后发布的,该争议凸显了科技公司在发布避免社会偏见的模型时面临的困难。
上周,人们发现促使双子座生成历史图像会导致描述似乎过度纠正种族描述。
例如,询问维京人或纳粹士兵的照片会产生不同种族群体的图像,这些图像不太可能反映历史现实。
谷歌的回应是禁用 Gemini 的图像生成功能并发表道歉,称其在增加多样性方面“没有达到目标”。
但专家表示,这种情况说明了围绕人工智能偏见的持续平衡行为。
宪法人工智能有帮助,但并不完美
Anthropic 联合创始人 Dario Amodei 在接受 VentureBeat 采访时强调了控制人工智能模型的难度,称其为“不精确的科学”。
他表示,该公司有专门的团队致力于评估和减轻模型带来的各种风险。
达里奥说:“我们的假设是,处于人工智能发展的前沿是引导人工智能发展轨迹为社会带来积极成果的最有效方式。”
然而,Anthropic 联合创始人 Daniela Amodei 承认,用目前的方法可能无法实现完全无偏见的人工智能。
“我认为,创建一个完全中立的生成式人工智能工具几乎是不可能的,不仅在技术上,而且还因为并不是每个人都同意什么是中立,”她说。
Anthropic 战略的一部分是一种称为宪法人工智能的方法,其中模型被调整以遵循“宪法”中定义的原则。
但达里奥·阿莫代承认,即使这项技术也并不完美。
“我们的目标是让模型公平、在意识形态和政治上保持中立,但你知道,我们还没有做到完美,”他说。
“我认为,你知道,没有人能完美地做到这一点。”
尽管如此,达里奥认为,与双子座面临的指控相反,人类的广泛认同的价值观宪法有助于防止模型偏向任何党派议程。
“我们的目标不是宣扬任何特定的政治或意识形态观点,”他说。
“我们希望我们的模型适合所有人。”