比肩GPT4，没有显卡也能用Llama-3.1-405B

2024-09-05 AIGC 0

（题图由SiliconCloud平台的Flux.1模型生成）

近日，Meta发布了备受瞩目的Llama-3.1系列模型，包括405B “超大杯”模型傲视群雄，成为首个比肩最强大模型的开源模型。

Llama-3.1系列包括8B、70B、405B参数三个版本模型，上下文长度扩展至128k，支持八种语言，具有良好的代码生成能力、复杂推理能力以及工具使用能力。更长的上下文让模型能够处理更复杂和深入的对话场景，以及更自然的交互体验。

其中，Llama-3.1-405B模型是目前最大规模的开源大模型，根据官方提供的各项测评数据，多项评测指标超越了最强闭源大模型GPT-4o和Claude 3.5 Sonnet，并在这些指标中全面超越了GPT-4。

Llama-3.1-405B的面世不仅将开源LLM带到了新高度，也鼓舞了开源社区，更重要的是，它为开源社区的开发者提供了更智能、高效的服务。

不过，与其他各类开源大模型一样，由于Llama-3.1系列模型尺寸极大，开发者在本地开发部署的难度极高，阻碍了开发者使用先进模型，以及生成式AI应用的创新。

SiliconCloud上线Llama-3.1，8B版本免费用

为此，硅基流动推出的大模型API服务平台SiliconCloud已上线Llama-3.1全系列模型，免去了开发者自己开发部署的门槛，可以轻松调用相应的API服务到自己的实际应用中。用户在实名认证后可用，值得一提的是，Llama-3.1-8B可免费使用。

API调用文档：

https://docs.siliconflow.cn/reference/chat-completions-1

SiliconCloud平台对Llama-3.1模型做了推理加速，输出速度极快、价格极其亲民（Llama-3.1-405B也只需￥21.00/1M tokens），支持开发者自由对比体验更类大模型，从而为自己的生成式AI应用选择最佳实践。

Token工厂SiliconCloud

Llama-3.1（8B）、Qwen2（7B）等免费用

除了Llama-3.1，SiliconCloud已上架包括FLUX.1、BAAI/bge-large、DeepSeek-V2-Chat、DeepSeek-Coder-V2、SD3 Medium、Qwen2、GLM-4-9B-Chat、SDXL、InstantID在内的多种开源大语言模型、图片生成模型与代码生成模型。

其中，Llama-3.1（8B）、GLM4（9B）等多个大模型API免费使用，让开发者与产品经理无需担心研发阶段和大规模推广所带来的算力成本，实现“Token 自由”。