Google: gemini-2.0-flash-thinking-exp

Gemini 2.0 Flash Thinking Mode是一个实验性模型,旨在生成模型在响应过程中经过的“思维过程”。因此,思维模式在响应中的推理能力比基础的 Gemini 2.0 Flash Mode更强。

Google: gemini-2.0-flash-thinking-exp-1219

Gemini 2.0 Flash Thinking Mode是一个实验性模型,旨在生成模型在响应过程中经过的“思维过程”。因此,思维模式在响应中的推理能力比基础的 Gemini 2.0 Flash Mode更强。

Google: gemini-2.0-flash-exp

Gemini 2.0 Flash 提供了下一代功能和改进的能力,包括卓越的速度、原生工具使用、多模态生成以及 100 万个 token 的上下文窗口。

Deepseek: DeepSeek-V2.5

开源版本模型,与之前版本相比,本次更新通过 Post-Training 全面提升了模型各方面能力表现,包括数学、代码、写作、角色扮演等;同时,新版模型优化了文件上传功能,并且全新支持了联网搜索,展现出更加强大的全方位服务于各类工作生活场景的能力。

Deepseek: deepseek-chat

与之前版本相比,本次更新通过 Post-Training 全面提升了模型各方面能力表现,包括数学、代码、写作、角色扮演等;同时,新版模型优化了文件上传功能,并且全新支持了联网搜索,展现出更加强大的全方位服务于各类工作生活场景的能力。

OpenAI: gpt-4o-2024-11-20

Grok Beta 是 xAI 的实验性语言模型,具有最先进的推理能力,最适合复杂和多步骤的使用场景。 Grok Vision Beta是xAI的具有视觉能力的实验性语言模型。

Meta:llama-3.3-70b

我们的新8B和70B参数Llama 3模型相较于Llama 2有了重大飞跃,在这些规模上为LLM模型建立了新的标杆。

AWS: nova-pro-v1

Amazon Nova Pro 1.0 是亚马逊推出的一个强大的多模态模型,专注于为各种任务提供精确性、速度和成本的组合。截至2024年12月,它在视觉问答(TextVQA)和视频理解(VATEX)等关键基准测试中实现了最先进的性能。

AWS: nova-micro-v1

亚马逊 Nova Micro 1.0 是一款仅限文本的模型,在亚马逊 Nova 系列模型中以极低的成本提供最低延迟的响应。其上下文长度为 128K tokens,并针对速度和成本进行了优化,Amazon Nova Micro 擅长文本摘要、翻译、内容分类、互动聊天和头脑风暴等任务。它具有简单的数学推理和编码能力。

AWS: nova-lite-v1

亚马逊Nova Lite 1.0是亚马逊推出的一种非常低成本的多模态模型,专注于快速处理图像、视频和文本输入以生成文本输出。亚马逊Nova Lite能够以高精度处理实时客户交互、文档分析和视觉问答任务。 在具有30万个标记的输入上下文中,它可以在单次输入中分析多张图像或长达30分钟的视频。

Anthropic: claude-3-5-haiku-20241022

Claude 3.5 Haiku 是我们下一代最快模型。与 Claude 3 Haiku 具有相似速度的情况下,Claude 3.5 Haiku 在各项技能上均有提升,并在许多智力基准测试中超越了上一代最大模型 Claude 3 Opus。

Anthropic: claude-3-5-sonnet-20241022

更新后的 Claude 3.5 Sonnet 在行业基准测试中显示出广泛的改进,特别是在代理编码和工具使用任务方面表现出显著提升。在编码方面,它将 SWE-bench Verified 的性能从33.4%提高到49.0%,得分高于所有公开可用模型,包括像 OpenAI o1-preview 这样的推理模型和专为代理编码设计的专业系统。

X: grok-beta

Grok Beta 是 xAI 的实验性语言模型,具有最先进的推理能力,最适合复杂和多步骤的使用场景。 它是 Grok 2 的后继产品,具有更长的上下文长度。

X: grok-vision-beta

Grok Beta 是 xAI 的实验性语言模型,具有最先进的推理能力,最适合复杂和多步骤的使用场景。 Grok Vision Beta是xAI的具有视觉能力的实验性语言模型。

OpenAI:o1-preview

o1系列大型语言模型通过强化学习进行训练,以执行复杂的推理。o1模型在回答之前会先思考,在回应用户前产生一条长的内部思维链。了解我们的推理指南中的o1模型功能和局限性。

OpenAI:o1-preview-2024-09-12

o1系列大型语言模型通过强化学习进行训练,以执行复杂的推理。o1模型在回答之前会先思考,在回应用户前产生一条长的内部思维链。了解我们的推理指南中的o1模型功能和局限性。

OpenAI:o1-mini

o1系列大型语言模型通过强化学习进行训练,以执行复杂的推理。o1模型在回答之前会先思考,在回应用户前产生一条长的内部思维链。了解我们的推理指南中的o1模型功能和局限性。

OpenAI:o1-mini-2024-09-12

o1系列大型语言模型通过强化学习进行训练,以执行复杂的推理。o1模型在回答之前会先思考,在回应用户前产生一条长的内部思维链。了解我们的推理指南中的o1模型功能和局限性。

OpenAI:chatgpt-4o-latest

chatgpt-4o-latest 模型版本持续指向 ChatGPT 中使用的 GPT-4o 版本,并在有重大变化时频繁更新。

OpenAI:gpt-4o

GPT-4o(“o”代表“全能”)是OpenAI最先进的GPT模型之一。它是多模态的(接受文本或图像输入并输出文本),并且具有与GPT-4 Turbo相同的高智能,但效率更高——生成文本的速度是其两倍,成本便宜50%。此外,GPT-4o在所有模型中,在视觉和非英语语言的表现方面是最好的。
滚动至顶部
申请收录
请填写您的推荐网站,我们将尽快收录