首页 > 智慧科技 > 智慧科技 > 谷歌推最强Gemini推理模型:月费1800,已拿奥赛金牌,性能超OpenAI o3和Grok 4

谷歌推最强Gemini推理模型:月费1800,已拿奥赛金牌,性能超OpenAI o3和Grok 4

发布时间:2025-08-04 17:13:20 来源: 18638159832

8月2日报道,昨夜,谷歌推出其迄今最强推理模型Gemini 2.5 Deep Think。

这是最近在今年国际数学奥林匹克(IMO)上“拿金牌”的模型的变体。近期高级版Gemini Deep Think完美解答了IMO 6道题目中的5道,总分35分(满分42分),达到金牌水平。

该模型需要几个小时才能推理出复杂的数学问题。新发布的版本在日常使用中速度更快、更易用,根据内部评估,在2025年IMO基准测试中仍达到铜牌水平。

谷歌在今年5月的I/O开发者大会上首次预览了Gemini 2.5 Deep Think。新版本进行了“重大改进”。在具有挑战性的编程、科学、知识、推理基准测试中,与OpenAI o3、Grok 4等其他不使用工具的模型相比,Gemini 2.5 Deep Think在LiveCodeBench V6和Humanity’s Last Exam均取得最佳性能。

苹果华人AI大牛被挖走,为同济校友!硅谷抢人大战升级,薪酬开到10亿刀

Gemini app中的Deep Think模型,使用思考技巧来提供更详细、更有创意和更周到的回答,甚至可以帮助数学家来测试数学猜想,还能提高Web开发任务的美观性。

苹果华人AI大牛被挖走,为同济校友!硅谷抢人大战升级,薪酬开到10亿刀

Deep Think支持文本、图像、音频、视频等输入和1M tokens上下文窗口,输出长度为192K tokens。

其工作原理是利用谷歌的并行思维技术,能同时生成多个想法,并同时进行思考,甚至随着时间的推移不断修改或整合不同的想法,最终得出最佳答案。

此外,通过延长推理时间或“思考时间”,谷歌给了Gemini更多的时间来探索不同的假设,并为复杂问题找到创造性的解决方案。

谷歌还开发了新颖的强化学习技术,鼓励模型利用这些扩展的推理路径,从而使Deep Think随时间推移成为更好、更直观的问题解决者。

Deep Think可以帮助人们解决需要创造力、战略规划和逐步改进的问题,例如:

迭代开发和设计:在需要逐块构建复杂事物的任务上的表现出色,比如可以提高网络开发任务的美学和功能。

科学和数学发现:可推理出高度复杂的问题,通过复杂的科学文献帮助制定和探索数学猜想或推理,可能加速发现之路。

算法开发和代码:在棘手的编码问题上特别出色,其中问题制定和仔细考虑权衡和时间复杂性是最重要的。

目前仅有最高级别的Google AI Ultra订阅者可选用“Deep Think”,每月订阅费为249.99美元(约合人民币1803元)。

Deep Think自动与代码执行和谷歌搜索等工具配合使用,并能产生更长的响应。

同时,达到IMO金牌水平的Deep Think模型将进一步测试,并向一小部分数学家和学者分享,用于辅助研究。谷歌计划利用这些反馈来完善该模型的未来版本。

谷歌还正在努力在未来几周内通过Gemini API向一组受信任的测试人员发布带和不带工具的Deep Think,以更好地了解其对开发者和企业用例的可用性。

智慧科技更多>>

2月销量被吉利和上汽反超,比亚迪,让子弹先飞一会儿? 奔驰部分EQA/EQB车型高压电池安全隐患召回详解 吉利|2月销量稳进,极氪逆势双增 堆满的智能配置,反倒让汽车更危险了? 半隐藏式门把手+悬浮车顶 奇瑞瑞虎7L官图发布 预售补贴价11.28万起,全新阿尔法S5升级配置,硬刚深蓝SL03? 车企3月购车权益深度解析,谁才是真优惠? 鸿蒙智行、理想、蔚来、小鹏及零跑等公布2月销量 马自达跻身俄罗斯新车市场周销量前十 特斯拉痛失欧洲纯电动车品牌销冠,大众登顶;欧洲插混市场大众亦超越奔驰 尚元智行获嘉兴桐乡无人驾驶车辆道路测试牌照 奇瑞首款纯电皮卡威麟R08 EV即将上市 路特斯Eletre在加拿大或降价近半 混动版车型也在开发中 福特因发动机舱加热器存起火风险 在美加召回超45万辆汽车 2026 款斯巴鲁 WRX 入门版车型重磅回归 Waymo扩大奥斯汀全无人驾驶服务范围 特斯拉Robotaxi车队规模达200辆 3.1亿人的养老需求,能靠机器人来解决吗? 现代汽车聘请英伟达、特斯拉前高管领导自动驾驶业务 蛰伏四年首笔投资,字节终于落子机器人这盘棋 小鹏启动1000座”移动充电站“计划:春运途中为其它车主紧急充电 AI太记仇!做完心理治疗后仍记得“被工程师虐待” 百川智能发布开源医疗模型Baichuan-M3,性能超越OpenAI GPT-5.2 2027款奔驰EQS路测图曝光:800V架构,自研eATS 2.0电机 字节再次上调期权价格:较去年8月涨近13%,较2019年涨幅超4倍 雷军:小米YU7女车主很多,专为女车主做了全车况、全席位安全气囊保护设计 小米回应“绿化带战神”标签:有人刻意收集视频恶意剪辑带节奏 俄罗斯街头惊现山寨版特斯拉Cybertruck,原型是中国魏桥新能源货车 雷军回应小米YU7轮胎曾被黑成“面条胎”,称“是很均衡的胎” 小米YU7为何采用长车头?雷军称好看且更安全,现场搬起前机盖 百度AI芯片公司冲刺IPO:出货量国产第二