GPT-4时代终结!Claude 3问世,理解力接近人类

来源:洞见研报 | 发布时间:2024-03-07

摘要:在3月4日的晚上,人工智能领域迎来了一个重要时刻:Anthropic,作为OpenAI的主要竞争者之一,正式发布了其自主研发的大型语言模型Claude的第三代——Claude 3系列。这一新版本的旗舰模型Opus,在本科及研究生层次的知识掌握、数学问题解决以及复杂任务理解等多个方面,均实现了对OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra的超越,标志着AI技术的又一重大飞跃。

在3月4日的晚上,人工智能领域迎来了一个重要时刻:Anthropic,作为OpenAI的主要竞争者之一,正式发布了其自主研发的大型语言模型Claude的第三代——Claude 3系列!

这一新版本的旗舰模型Opus,在本科及研究生层次的知识掌握、数学问题解决以及复杂任务理解等多个方面,均实现了对OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra的超越,标志着AI技术的又一重大飞跃!

最新版的Claude 3系列推出了三款不同配置的模型:Haiku、Sonnet和Opus。

Anthropic官方网站透露,这一系列模型经过特别优化,以增强实时交互体验,包括提升实时聊天、自动补全和数据提取等关键功能。

特别是性价比极高的Claude 3 Haiku,它以惊人的速度在3秒内就能处理包含图表和丰富信息的长篇研究论文,处理量高达约10,000个token!

在MMLU、GPQA、GSM8K等多个标准基准测试中,Claude 3 Opus展现了超越竞争对手的优异成绩。在涉及多模态能力的测试中,Claude 3 Opus同样表现出色,与对手持平甚至更优。

Claude 3系列模型同时具备卓越的图像处理功能,能够识别和分析照片、图表、图形以及技术图纸等多种视觉资料。

与Claude 2.1相比,Opus在开放式问题上的准确性提高了一倍!

上下文理解和记忆能力是衡量模型智能水平的关键指标,Claude 3模型在这方面的表现尤为突出,它支持高达200K(即200,000)个token的上下文窗口,这意味着模型能够处理和记忆极其庞大的信息量。

这种能力在复杂的对话和任务执行中尤为重要,因为它允许模型在长篇对话或文档分析中保持连贯性和准确性。