AI资讯解读

OpenAI GPT-5.6系列预览版持续内测,自研推理芯片年底量产

最新AI日报 14 阅读

OpenAI 正式推进 GPT-5.6 三档模型限量内测,同步官宣与博通联合打造 Jalapeño 专用推理 ASIC 芯片,9 个月完成流片,2026 年底规模化部署,推理成本直降 50%,正式完成模型 + 芯片垂直一体化布局。

近期,AI行业迎来关键性双重升级,OpenAI GPT...

近期,AI行业迎来关键性双重升级,OpenAI GPT-5.6系列预览版正在持续灰度内测,同时官方确认,搭载全新自研架构的Jalapeño专用推理芯片将于2026年底正式量产落地。此举标志着OpenAI正式迈入“模型+自研芯片”的垂直一体化时代,彻底摆脱对第三方通用算力的依赖,有望大幅降低大模型推理成本、提升全球AI服务效率。

据最新内测信息披露,GPT-5.6系列不再采用单一版本更新模式,而是推出Sol旗舰版、Terra商用均衡版、Luna轻量高吞吐版三档分层模型,全面覆盖科研攻坚、企业商用、高并发轻量化场景,实现全场景AI能力全覆盖。目前全系模型均处于持续迭代内测阶段,仅对合规企业与机构开放权限,后续将根据实测反馈逐步开放全量API调用。

其中GPT-5.6 Sol作为顶级旗舰版本,主打高精度...

其中GPT-5.6 Sol作为顶级旗舰版本,主打高精度科研推理、全场景工程代码开发、复杂数据分析与智能体协同作业,在专业基准测试中刷新多项GPT系列历史最优成绩,长文本理解、多任务自主拆解、复杂逻辑推演能力实现跨越式升级,主要面向高端科研机构、头部科技企业开放。

GPT-5.6 Terra为通用商用主力版本,完整继承前代旗舰核心能力,同时大幅下调调用成本,适配绝大多数企业办公、内容创作、智能运营、常规程序开发等主流商用场景,是本次内测覆盖面最广、落地性最强的版本,将成为中小企业AI规模化落地的核心选型。

GPT-5.6 Luna定位轻量化高吞吐模型,主打极速...

GPT-5.6 Luna定位轻量化高吞吐模型,主打极速响应、超低功耗、超高并发,专为批量内容生成、智能客服、自动化流水线、海量数据摘要等高频轻量化场景打造,以极致性价比降低企业大规模部署AI的门槛。

支撑GPT-5.6全系高性能、低成本运行的核心底气,来自OpenAI与博通联合研发的Jalapeño自研推理芯片。该芯片为大模型推理场景量身定制,摒弃通用GPU的冗余架构,针对性优化大模型文本生成、数据调度、显存读写逻辑,极大减少算力损耗与延迟问题。

这款芯片创造了行业极速研发纪录,从立项到完成流片仅耗时...

这款芯片创造了行业极速研发纪录,从立项到完成流片仅耗时9个月,远快于传统AI芯片18至24个月的研发周期。硬件层面深度适配GPT-5.6全系模型架构,原生软硬件协同优化,相比现有主流算力方案,推理吞吐量大幅提升,综合运营成本直接下降超50%,有效解决当前全球AI行业普遍面临的算力紧缺、调用成本高、响应延迟不稳定等痛点。

按照OpenAI最新规划,Jalapeño芯片将于2026年底实现规模化量产与部署,逐步接入全球OpenAI算力集群,全面为GPT-5.6及后续迭代模型提供底层算力支撑。随着自研芯片落地,OpenAI将彻底完成从上层大模型算法到底层算力硬件的全栈闭环布局,彻底改变长期依赖外部算力的行业格局。

业内分析表示,GPT-5.6模型迭代叠加自研芯片量产,...

业内分析表示,GPT-5.6模型迭代叠加自研芯片量产,将进一步拉大头部AI技术壁垒,推动全球大模型进入高智能、低成本、高稳定、可规模化的全新发展阶段,也将为各行各业AI深度落地普及提供核心动力