谷歌于 12 月 6 日推出了 Gemini 项目,实现了人工智能领域的下一次飞跃,这是一种经过训练可以像人类一样行事的人工智能模型,这可能会加剧有关该技术潜在前景和危险的争论。
此次推出将分阶段进行,名为“Nano”和“Pro”的 Gemini 不太复杂的版本将立即纳入谷歌人工智能聊天机器人 Bard 及其 Pixel 8 Pro 智能手机中。
在 Gemini 的帮助下,Google 承诺 Bard 将变得更加直观,并且能够更好地完成涉及规划的任务。 据谷歌称,在 Pixel 8 Pro 上,Gemini 将能够快速总结设备上的录音,并在消息服务上提供自动回复,从 WhatsApp 开始。
2024 年初“吟游诗人进阶”
Gemini 最大的进步要到 2024 年初才会实现,届时其 Ultra 模型将用于推出“Bard Advanced”,这是聊天机器人的精简版本,最初仅向测试受众提供。
该人工智能最初只能在全球范围内以英语运行,尽管谷歌高管在新闻发布会上保证,该技术最终不会有任何问题,可以扩展到其他语言。
根据 Gemini 向一组记者的演示,谷歌的“Bard Advanced”可能能够通过同时识别和理解涉及文本、照片和视频的演示来实现前所未有的人工智能多任务处理。
Gemini 最终也将被纳入谷歌的主导搜索引擎,尽管这一转变的时间尚未明确。
“这是人工智能发展的一个重要里程碑,也是我们谷歌新时代的开始,”Gemini 背后的人工智能部门谷歌 DeepMind 首席执行官达弥斯 表示。 近十年前,谷歌击败了包括 Facebook 母公司 Meta 在内的其他竞购者,收购了总部位于伦敦的 DeepMind,并自此将其与其“大脑”部门合并,专注于 Gemini 的开发。
引发热议
谷歌宣称该技术解决问题的能力特别擅长数学和物理,这让人工智能乐观主义者燃起了希望,认为它可能会带来科学突破,改善人类的生活。
但人工智能辩论的反对方担心该技术最终会超越人类智能,导致数以百万计的工作岗位流失,甚至可能产生更具破坏性的行为,例如放大错误信息或触发核武器的部署。
谷歌首席执行官桑达尔·皮查伊在博客文章中写道:“我们正在大胆而负责任地开展这项工作。” “这意味着我们的研究雄心勃勃,追求为人类和社会带来巨大利益的能力,同时建立保障措施并与政府和专家合作,应对随着人工智能变得更加强大而带来的风险。”
Gemini 的到来可能会加剧过去一年中与旧金山初创公司 OpenAI 和长期行业竞争对手微软的人工智能竞争的赌注。
Gemini 将挑战 OpenAI 的 GPT-4
在微软的财务实力和计算能力的支持下,OpenAI 在去年底发布免费的 ChatGPT 工具时,已经深入开发其最先进的人工智能模型 GPT-4。 这个以人工智能为动力的聊天机器人迅速享誉全球,为生成式人工智能的商业前景带来了热议,并迫使谷歌推出巴德作为回应。
就在巴德到来之际,OpenAI 于 2023 年 3 月发布了 GPT-4,此后一直在构建针对消费者和企业客户的新功能,其中包括 11 月推出的一项使聊天机器人能够分析图像的功能。 它一直在与 Anthropic 等其他人工智能初创公司甚至其合作伙伴微软争夺业务,微软拥有 OpenAI 技术的独家权利,以换取它向这家初创公司投入的数十亿美元。
到目前为止,这一联盟对微软来说是一个福音,到 2023 年,微软的市值已增长了 50% 以上,这主要是因为投资者相信人工智能将成为科技行业的金矿。 谷歌的母公司 Alphabet 也顺应了这一趋势,今年迄今其市值已增长超过 5000 亿美元,即增长约 45%。 尽管近几个月来人们对 Gemini 充满期待,但 Alphabet 的股价在 12 月 6 日的交易中小幅下跌。
微软在过去一年中加深了对 OpenAI 的参与,再加上 OpenAI 更积极地尝试将其产品商业化,这引发了人们的担忧,即随着技术的进步,这个非营利组织已经偏离了保护人类的初衷。
2023 年 11 月,由于围绕未公开的信任问题发生纠纷,OpenAI 董事会突然解雇了首席执行官 Sam Altman,这些担忧被放大了。 在强烈反对威胁到该公司并导致人工智能工程人才大量外流到微软之后,OpenAI 让 Altman 重新担任首席执行官,并改组了董事会。
随着 Gemini 的出现,OpenAI 可能会发现自己试图证明自己的技术仍然比谷歌的技术更聪明。 “我对它的能力感到敬畏,”谷歌 DeepMind 产品副总裁谈到 Gemini 时说道。
在虚拟新闻发布会上,谷歌拒绝透露 Gemini 的参数数量——这是衡量模型复杂性的一个指标,但不是唯一的指标。 12 月 6 日发布的白皮书概述了 Gemini 在多项选择考试、小学数学和其他基准测试中表现优于 GPT-4 的最强大版本,但承认在让 AI 模型实现更高水平的推理技能方面持续存在困难。
一些计算机科学家认为大型语言模型的作用有限,这些模型通过重复预测句子中的下一个单词来工作,并且很容易弥补被称为幻觉的错误。 “我们在 Gemini 的所谓事实性方面取得了很大进展。 所以双子座是我们这方面最好的典范。 但我想说,这仍然是一个未解决的研究问题,”柯林斯说。