GPT-4最强对手出现!Claude-3 AI模型发布

热搜大全 > 新闻热搜 > 科技热搜 > 正文

GPT-4最强对手出现!Claude-3 AI模型发布

热搜大全 2024-03-06

就当我们还在为 OpenAI 的 Sora 实际效果感到震撼,惊叹未来已来的时候。短短一个月,OpenAI 的 " 家 " 就被人偷了,昨晚北京时间凌晨 Anthropic 公司宣布 Claude-3 正式发布,带有三个高性能的模型形态,并宣布在 AI 逻辑基准测试中超过了 ChatGPT-4。

GPT-4最强对手出现!Claude-3 AI模型发布

可能国内的小伙伴很少知道 Claude,这是一个在海外备受关注且用户基数较大的一个 AI 模型,其从诞生以来就一直与 GPT 相爱相杀,在 AI 性能排行榜上紧追不舍。其也是基于 GPT ( Generative Pre-trained Transformer ) 技术的大型语言模型,通过在大规模文本数据上的预训练 , 学会了自然语言理解和生成的能力。

GPT-4最强对手出现!Claude-3 AI模型发布

亚马逊于今日宣布使用 Claude3 来优化其商业逻辑

该系列包含三款各具特色的型号:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,它们在性能与应用功能上各有侧重,旨在满足多样化的应用场景需求。

GPT-4最强对手出现!Claude-3 AI模型发布

Claude 3 Haiku

Haiku 型号凭借其极速处理能力和高性价比脱颖而出。它能够在短短三秒内完成对一篇含有约 10,000 个标记、信息浓缩且数据密集的 arXiv 研究论文的阅读工作,包括对图表和图形的理解。Haiku 尤其适用于那些对处理速度有极高要求但性能负荷相对较轻的平台。

Claude 3 Sonnet

Sonnet 型号在处理大多数工作负载时的速度是 Claude 2 以及 Claude 2.1 的两倍,且模型效果与性能一致,并提供更高层次的智能分析能力。它特别擅长处理那些需要快速反应的任务,例如知识检索和销售流程自动化等。

Claude 3 Opus

Claude 3 Opus 是系列中的高端型号,具备与市场上其他顶尖模型相匹敌的复杂视觉处理能力,能够处理多种视觉格式,包括照片、图表、图形以及技术图解。相较于 Claude 2.1,Opus 在解决开放性问题上的准确度提升了一倍,同时也显著降低了错误答案的比例。

其他亮点

全系列模型均能处理超过 100 万个标记的输入,为那些需要更强大处理能力的客户提供可靠支持。Claude 3 系列在执行复杂多步骤指令方面表现卓越,尤其在遵循品牌语调和响应指南上,能够为用户打造出值得信赖的客户体验。此外,这些模型还擅长生成流行的结构化输出格式,如 JSON。

目前,Opus 和 Sonnet 已经通过 API 对外开放,开发者现可直接注册并开始体验这些尖端模型的强大功能。比如,POE 就已经支持 Claude-3-Opus 模型,购买 POE" 月卡 " 后就可以体验。

GPT-4最强对手出现!Claude-3 AI模型发布

超越 GPT-4;兼顾视觉功能

根据 Anthropic 的说法,Claude 3 Opus 在 10 项人工智能标准测试中超越了 GPT-4,包括 MMLU(本科水平知识)、GSM8K(小学数学)、HumanEval(编程)以及 HellaSwag(常识)。

GPT-4最强对手出现!Claude-3 AI模型发布

其中一些胜利的优势非常微小,例如 Opus 在 MMLU 五次尝试中得到 86.8%的得分,而 GPT-4 得到 86.4%,一些差距则较大,例如在 HumanEval 上 Opus 得到 90.7%的得分,而 GPT-4 得到 67.0%。这可能就意味着 Claude 3 对于新手码农要更加友好。

与前代模型相比,Claude 3 系列在分析、预测、内容创作、代码生成以及多语言对话等方面展现了改进。据报道,这些模型还具备了增强的视觉能力,允许模型处理照片、图表和图解等视觉格式,类似于 GPT-4V 和谷歌的 Gemini

在实际测试中,Claude 3 相比于 GPT-4V 对于 PDF 的解读要更加快速,同时对于中文输出的逻辑与优化也要明显好于前代,也是达到了 GPT-4 平替的水准。

GPT-4最强对手出现!Claude-3 AI模型发布

故宫博物院:禁止穿拖鞋参观!

故宫博物院:禁止穿拖鞋参观!

热点 博物馆 微信公众号 拖鞋 网友 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-07-23

张柏芝穿紧身露背长裙亮相 卷发造型显气质

张柏芝穿紧身露背长裙亮相 卷发造型显气质

娱乐热点 张柏芝 造型 长裙 紧身 气质 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-09-23

北京千万资产家庭数量全国第一:人员平均工资均超20万 半导体等行业最吃香

北京千万资产家庭数量全国第一:人员平均工资均超20万 半导体等行业最吃香

科技热搜 工资 行业 资产 北京 家庭 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-12-07

全长183.663公里!绥大高速公路正式通车运营:共设9处收费站

全长183.663公里!绥大高速公路正式通车运营:共设9处收费站

科技热搜 绥化 大庆 高速公路 卫星 中国铁建 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-06

圣旗H610M-HIH 嘿嘿主板图赏:别出心裁的H610 D5主板

圣旗H610M-HIH 嘿嘿主板图赏:别出心裁的H610 D5主板

科技热搜 ssd type-c 京东 酷睿 intel 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-06

曾被卖出19万美元高价!这台初代iPhone太猛了 曾被卖出19万美元高价!这台初代iPhone太猛了