文章摘要:3是人工智能初创公司开发的新一代人工智能模型,旨在提供先进的认知能力和智能处理任务。和数据库规划和执行复杂的操作、交互式编码;研发:研究回顾、集思广益和假设生成、药物发现3模型家族中最智能的模型,在多个···
3是什么
3是人工智能初创公司开发的新一代人工智能模型,旨在提供先进的认知能力和智能处理任务。 3模型家族包括三个不同级别的模型,按性能强大升序分别是 3 Haiku(俳句)、 3 (十四行诗)和 3 Opus(著作)。根据 的报告, 3 Opus的性能在多个基准测试中超越了GPT-4/3.5以及 1.0 Ultra/Pro。
目前,Opus 和 现已可在 .ai 聊天机器人和通过 API 使用,Haiku 将在未来几周推出(最新更新:3 月 14 日 Haiku 已可用)。
3的功能改进 3的型号详情 3 Opus:最智能的模型,适用于高度复杂的任务。 3 :在智能和速度之间提供平衡,适合企业工作负载。 3 Haiku:最快的模型,适用于需要即时响应的场景。
3家族系列型号具体对比表格如下:
特性/模型 3 3 3 Haiku
智能水平
最高
高
中等
成本
最高(输入:15美元/100万token,输出:75 美元/100万token)
中(输入:3美元/100万token,输出:15 美元/100万token)
最低(输入:0.25 美元/100万token,输出:1.25 美元/100万token)
上下文窗口
20万
20万
20万
潜在用途
任务自动化:跨 API 和数据库规划和执行复杂的操作、交互式编码;
研发:研究回顾、集思广益和假设生成、药物发现
策略:图表、财务和市场趋势的高级分析、预测
数据处理:RAG 或对大量知识的搜索和检索
销售:产品推荐、预测、定向营销
节省时间的任务:代码生成、质量控制、从图像中解析文本
客户互动:实时互动、翻译中快速、准确的支持
内容审核:捕捉危险行为或客户请求
节省成本的任务:优化物流、库存管理、从非结构化数据中提取知识
速度
与 2和2.1相似,但智能水平更高
比 2和2.1快2倍
最快,成本效益最高
模型可用性
现在可用
现在可用
现在可用
3与其他模型的性能对比
Opus是 3模型家族中最智能的模型,在多个常见的AI系统评估基准上超越了其他模型。这些基准测试包括本科水平的专家知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)等,Opus展现出接近人类的理解和流利度。
所有 3家族模型在分析和预测、内容创作、代码生成以及非英语语言对话(如西班牙语、日语和法语)方面的能力都有所增强。
以下是 3系列模型与 GPT和 模型在多个性能基准上的比较: