Gemini 3.5 Flash模型发布 性能飞跃成本骤降
Gemini 3.5 Flash模型发布 性能飞跃成本骤降!2026年5月中旬,AI行业迎来一波密集动态。Google I/O大会即将召开,中美芯片博弈升级,OpenAI继续保持月更节奏,这些事件都值得认真关注。
关于Google I/O的最大悬念是Gemini 3.5 Flash的发布。原本预期Google会在5月19日的I/O大会上推出Gemini 3.2 Flash,但最新消息显示Google直接跳过了3.2版本,准备发布3.5 Flash。根据泄露的测试数据,Gemini 3.5 Flash的性能接近GPT-5.5和Claude Opus 4.7的水平,但推理成本仅为它们的1/15到1/20,延迟控制在200毫秒以内。Google采用了更激进的蒸馏和稀疏化技术,将大模型的能力压缩到小模型中。如果属实,这意味着开发者可以用极低成本获得接近旗舰模型的智能,大大降低AI应用的门槛。定价传闻为每百万token输入$0.25、输出$2,相比GPT-5.5几乎可以说是“免费”。
在芯片领域,美国批准了约10家中国公司(包括阿里、腾讯、字节跳动)购买Nvidia H200芯片,每家公司最多可买7.5万片,总价值超过200亿美元。然而结果是零交付。北京没有禁止购买,但通过各种方式让国内企业暂缓采购。特朗普确认:“中国选择了不买,因为他们在发展自己的技术。”华为昇腾芯片已经能支撑DeepSeek训练出前沿模型,虽然性能还有差距,但“够用”加上“自主可控”的权重让中国宁愿吃短期的苦。Nvidia在中国AI芯片市场的份额从95%跌至接近零,尽管Jensen Huang亲自飞往北京与中方官员会面,芯片仍然卖不出去。
OpenAI方面,GPT-5.5发布不到一个月,GPT-5.6已经在测试中。内部消息称,GPT-5.6将比5.5更具自主性,能够更好地完成任务而不仅仅是回答问题。OpenAI调整了训练策略,新基础模型“Spud”使后续更新可以通过后训练快速迭代,无需每次都从头训练,加快了模型迭代速度。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com