首页 KU体育 >新闻资讯 校园风采 KU体育app
告别“艾味”!双子座3初体验:没有健康,没有阿谀奉承,但价格却感染了我的手
2025-11-19

谷歌Gemini 3终于在凌晨正式发布。在“早起晚走”犹豫了整整一年之后,谷歌于周二正式发布了年度重磅机型Gemini 3。与之前迭代的小修复不同,这次更新被认为是谷歌对 OpenAi 和人类学最激进的反击。据知情人士透露,Gemini 3的发布甚至在OpenAi和anthropic内部引起了很大的“焦虑”。竞争对手的员工私下猜测,如果谷歌在自动编程和图像生成方面实现超越,他们可能会失去先发优势。投资机构Jonestrading首席市场策略师Mike O'Rourke指出:“凭借谷歌在搜索领域的庞大规模和先发优势,Openai和微软的市场份额和力量很可能会在被动中恢复到其身后。”当谷歌指示Gemini 3直接在海中时rch box拥有数十亿用户,这种分发能力具有毁灭性的打击。另一方面,OpenAi虽然仍是流量领先者,但面临甲骨文和微软开出的高额算力账单,其商业模式犯错的空间也较小。 1.硬核亮点:还能生成“Generative UI”。 Gemini 3的主要技术亮点几乎可以说是到了一个点。 —— 生成式UI:这是本次更新的最大亮点。过去,当你向人工智能询问旅行指南时,只会给你一条文字;现在Gemini 3可以直接生成交互界面。它可以混合图形和文本,甚至在您查询历史或艺术问题时实时生成微应用程序。它不仅回答问题,还“积累经验”。 ——反重力编程工具:这是Google为开发者推出的重磅产品。 “代理优先”的编码环境让AI自动完成软件编写、测试和部署t。 ——告别“阿谀奉承”:谷歌特别强调Gemini 3减少“阿谀奉承”。现在的原则是“告诉你真相,而不是你想听的”。这意味着Gemini 3在面对错误的地方时将会有更强的批判性思维,而不是没有芋头迎合用户。 ——增强准确性和智能:谷歌称Gemini 3为最智能的模型,这将帮助用户成为现实。在标准基准测试中,Gemini 3的信息准确率达到了72%。虽然从绝对数量上看这个数字并不高,但在生成式AI领域无疑是领先的。 2、大V亲自试用:双子座“博士级”智力已经三年了。沃顿商学院教授、AI领域意见领袖Ethan Mollick刚刚测试了Gemini 3并进行了深入分析。这一次,他没有堆砌基准测试成绩,而是用跨越三年的对比测试来展示其惊人的速度。f AI进化:曾经设法只让你成为可以独立工作的“数字同事”的AI。 ——从“描述”到“创造”三年前,在 ChatGPT 发布前夕,莫里克在早期的 GPT-3 上输入了一个令人难以置信的快速单词:“写一个关于一艘糖果驱动的超轻型飞船从水獭手中逃脱的故事。”那时,人工智能几乎无法写出一个连贯的段落或一首糟糕的诗。如今,面对同样的提示语,莫里克对Gemini 3提出了更高的要求:“用实际行动展示AI进步了多少”。于是,Gemini 3直接编写开发了一款互动、可试玩的网页游戏。在游戏中,你必须实际驾驶糖果船来躲避水獭的追击。 Molik感叹道:“2022年的AI只能被描述;2025年,AI可以编写引擎代码、设计界面,让你自己驾驶飞船。” - 与 Gemini 3 一起发布的全能反重力助手是 antigra开发工具。很多人认为它只适用于程序员,但在莫里克看来,它就像一个通用的“工作台代理”。他的主要理念是,在计算机上完成的一切都是重要的代码。由于人工智能可以处理代码,因此它可以处理一切 - 无论是处理 Excel、创建 PPT 还是分析本地文件。莫里克给了反重力自己电脑上存放之前所有文章的文件夹的权限,并下达了命令:“帮我把所有关于AI的猜测整理在一个好的页面上,然后上网搜索来证明我说的哪一个是对的,哪一个是错的。”双子座3表现得像一个可靠的员工:它会阅读文件并制定计划;计划形成后也停在关键节点,等待莫里克的批准;获得批准后,它可以独立地搜索互联网、编写代码、生成网页,甚至控制浏览器进行测试。 Molik 发现他与 AI 交互的方式发生了重大变化:他没有使用复杂的提示来“引导”对话,而是使用自然语言来“指导”队友工作。控制感和理解感是迈向智能代理时代的重要一步。 ——撰写“博士论文”测试双子座3号的智力极限,莫里克还展示了终极书:一套十年前的旧科研档案,格式混乱,甚至包含损坏的数据。他给出的指示很模糊,类似于导师对博士生的要求:“澄清这些数据结构”和“写一篇具有深入理论讨论的原创论文,就像向期刊投稿一样”。结果,Gemini 3不仅整理了数据,还提出了原创的研究假设,还编写了一套自然语言处理(NLP)算法来衡量众筹项目的“独特”指标并完成统计分析。最终给出了一篇长达14页的论文。当然,双子座3a也有其缺点。作为一名新博士生,ilan的统计方法不得不进行修改,而且它的一些理论推导有些激进。但莫利克给出修改建议后,很快就有意义了,并得到了显着改善。莫里克总结道:“如果我们将‘博士级智力’定义为像合格研究生一样工作的能力,那么它就是。” 3.检查炸弹:双子座3“真香”? ——数据派:智商高得离谱,但人工评测机构评测机构给出的结论褒贬不一,但总体乐观: · 超强智能:在智能指数测试中,Gemini 3 Pro Preview 获得了 73 分的高分,而同类机型的平均分仅为 42 分。这不仅是领先,更是毁灭性的打击。 · 响应速度快:每秒128个代币的生成速度让Gemini 3在处理复杂任务时“步履如飞”,高于行业平均水平(56个代币/秒)第二)。 · 钱包警告:坚强的代价是昂贵的。虽然投入价格适中,但产出价格高达 12/100 万美元代币(平均 8.40 美元)。此外,它是一个喋喋不休的模型:它在测试中生成了 9200 万个代币,是平均值(2700 万)的三倍多。一句话简介:双子座3很聪明,反应灵敏,但废话很多,字字都贵。 @aniruddhadak 表示,“基准测试结果”令人惊叹......“它可以称为代理智能编码流程的新基础。” @Deredleritt3r也谈到了数据,认为Gemini 3是由计算机运算中的ganap碾压速度形成的:“这就是全能计算机特工的节奏。” ——体验者:AI没味道,碾压性优势 随着双子座3号和反重力访问权逐渐开放,大批科技博主开始亲自尝试并发表评论。早期测试者 @Aditabrm 检查 Gemini 3 的优点和局限性ns,称其“太棒了”,并在发布当天分享了他的详细评论。行业观察家@aagarwal1012认为,Google Gemini 3显着提升了同类产品的标准。科技播客@scitechera甚至用一张图片来强调Google Gemini 3在推出后相对于其他竞争对手的绝对优势。对于每天与AI互动的铁杆游戏玩家@matt Shumer来说,Gemini 3直接成为了他的“日常司机”。他的评论更加情绪化,更注重生产力: ·写作的进化:创意写作终于变得“像人一样”,这透出了乍一看很假的“AI味道”。 《双子座3》的文笔逻辑连贯,节奏自然,人物也变得更加干练直接,没有礼貌性的开场白来弥补字数。 · 前端杀手:这是最大的惊喜。 @matt Shumer 表示其前端能力“极其出色”,设计细节,微交互、响应式布局往往可以一次性完成。设计能力的跨度发生了巨大的飞跃。 — Calm Man:并非所有用户都买账。回到产品本身,谷歌自豪地宣称katGemini 3的信息加载率达到了72%。对于大型模型来说,这是一个令人印象深刻的数字。但在一些用户看来,这可能还不够。初创公司 Oumi 联合创始人马诺斯·库库米迪斯 (Manos Koukoumidis) 直言:“如果人们期望谷歌将他们从‘蓝色链接’的海洋中拯救出来,并为他们完成工作,那么目前的水平还远远不够。”与搜索引擎深度融合后,Gemini 3可以检索信息并验证事实,但“假象”仍然存在。用户期望 100% 的可靠性,而 72% 意味着仍有大约 30% 的机会出现“严重胡言乱语”。 Gemini 3正式上线后不久,就有用户在社交平台发帖表示,部分用户在体验预览版时感觉Gemini 3,有时候还不如2.5 Pro。例如,比较两者产生“鹈鹕骑自行车”的画面,前者没有明显的优势。 @matt Shumer 还提到了反重力的二元性:Google 的新 IDE 虽然功能强大,但仍然要求人们“照顾好 narnes”以捕获模型错过的错误。 4.情境观察:Openai很少沉默,朋友和商人立即“加入”来评估模型的实力。不要看它说什么,而要看它的对手在做什么。硅谷观察家John Coogan用一个更有趣的视角来解读Gemini 3。——Anthropic正在寻找支持者。在谷歌加大动作的同时,Anthropic迅速转战微软,达成300亿美元的算力合作,并获得NVIDIA和微软的巨额投资。 “抱在一起取暖”的防御姿态,更印证了Goog带来的压迫感勒。 —— Openai异常安静。原本想在谷歌发布会前“切入”的OpenAI,这次似乎悄无声息,只发布了一些与群聊功能和广告业务相关的动作。该公司首席执行官萨姆·奥尔特曼(Sam Altman)不忘对谷歌X平台表示祝贺。谷歌首席执行官桑达尔·皮查伊也做出了回应。 ——赛萨朗的焦点。肌肉之下的Xai选择了一种简单粗暴的做法。它在电话会议前后疯狂地在 X 平台上投放 Grok 广告,让人怀疑它是否试图窃取 Goog 的注意力。事实并非如此。 5、结论:科技狂欢的背后,依然需要沉默。麦肯锡数据显示,到2030年,整个AI行业预计将在数据中心和超级计算机上花费近7万亿美元。这是一个天文数字。对于Gemini 3的发布,研究机构创意策略首席分析师Ben Bajarin非常平静:“我们需要真正有能力、高素质的人才通过使用案例可以看到巨大的收入来源。目前,AI 主要用于传统搜索查询和辅助编程。投资者开始问:Antropic、OpenAi 甚至谷歌能否拿出这一万亿美元的基础设施投资?对此,谷歌 DeepMind 首席执行官 Demis Hassabis 显得平静。他在 Gemini 3 推出前接受采访时表示,虽然私募股权市场可能存在泡沫,但谷歌拥有真正的收入引擎。该公司云业务的季度销售额增长了第三个是 150 亿美元,他将 Google 的地位描述为“锁定”,并对其最终的成功充满信心(Chenchen)。

Copyright © 2024-2026 蘑菇吃瓜料每日爆料-蘑菇吃瓜官网黑料爆料-58爆料网每日精选最新消息 版权所有

网站地图

鄂ICP备36659856号

友情链接: