谷歌 DeepMind 推出超越 GPT-4 的全新 AI 模型 Gemini,一个午休就能读完 20 万篇论文
研发家 | 2023-12-08 0

当地时间 12 月 6 日,谷歌 DeepMind 宣布推出全新多模态 AI 模型 Gemini,并称其为“最大、最强和最通用”的人工智能系统。在大型语言模型研究和开发中常用的 32 个学术基准中,Gemini 的表现在其中的 30 个上超越了现有最先进的成果——OpenAI 的大模型 GPT-4。

与 ChatGPT的 GPT-4 版本一样,Gemini 支持多种输入类型,可处理文本、代码、图像甚至音频等输入,能够从日常生活到科学研究等多个领域准确解决问题,并提供建议和答案。谷歌表示,Gemini 还具备复杂的推理和规划能力。根据官方发布的一段宣传视频,Gemini 能够根据提示,在一个午休的时间内阅读 20 万篇论文,从中筛选出 250 篇与一个特定生物学数据库有关的论文、提取出更新数据,进而将其绘制成表格或图片提供给使用者。

此外,谷歌还展示了 Gemini 卓越的编程能力,Gemini 具有在理解、解释和生成各种编程语言(包括 Python、Java、C++和 Go)中正确且编写良好代码的熟练度,在首次尝试中就解决了一个包含 200 个 Python 编程功能的基准测试中约 75% 的问题,并在自我修正后解决了超过 90% 的问题。此外,Gemini 的一个特殊版本——AlphaCode2,在竞技编程中成功处理了一项只有不到 0.2% 的参赛者才能解决的高难度问题,将 AI 编程能力推向新的高度。

据悉,Gemini 将推出三种不同大小的版本,包括面向高度复杂任务的 Gemini Ultra、覆盖广泛任务的 Gemini Pro,以及用于消费者设备的 Gemini Nano。这三个版本在参数数量和复杂性上有所区别,以满足不同的计算需求和应用场景。更多的参数意味着更大的神经网络,通常更有能力执行更复杂的任务,但需要更多的计算能力才能运行。这意味着最小的 Nano 被设计为在消费类设备上本地运行,而 Ultra 只能在数据中心硬件上运行。Gemini Pro 的英文版则将作为 Google Bard 聊天机器人的一部分在全球 170 多个国家和地区推出。然而,由于潜在的监管问题,目前在欧盟或英国尚未提供其服务。(谷歌,arstechnica.com,ft.com)

 

延伸阅读:

IBM、Meta 等 50 多家科技公司联手组建 AI 联盟,对抗 OpenAI、谷歌主导地位

来源:IBM

当地时间 12 月 5 日,IBM 和 Meta 宣布成立 AI 联盟(AI Alliance),旨在推动人工智能领域的“开放创新和开放科学”。该联盟包括 50 多个科技、教育、研究实体,包括 AMD、Intel、NASA、CERN 和哈佛大学等,共同促进替代当前由 OpenAI 和谷歌开发的人工智能系统 ChatGPT 和 Duet。

 

在过去一年,AI 科技公司逐渐形成两派。一类公司保留 AI 模型权重和有关模型创建方式的数据,如 OpenAI,另一类如 Meta 则提供给他人运行在其硬件上的 AI 模型权重,并允许基于其研究构建衍生模型。新成立的 AI 联盟强调“开放透明创新对于赋予广泛的 AI 研究人员、开发者和采用者所需的信息和工具至关重要。”

 

除了推动开放的 AI 研究外,联盟还制定了几项倡议,包括制定基准和评估标准、促进 AI 硬件加速器生态系统的发展,以及支持全球探索性 AI 研究。他们还强调多样性,包括创建旨在解决气候和教育等社会挑战的“高性能多语言、多模态和科学模型”。联盟的影响尚未可知,但它似乎是人工智能发展未来方向的一个标志,划定了那些强调开放和合作的人与主张更封闭、专有方法的人之间的界限。有媒体称,未来或将同时存在这两条道路,如同在软件市场中 Windows 和 Linux 等平台并存。(arstechnica.com)

 

 

 

赞一个

分享:
打开微信扫一扫
0
版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
招商合作
请您完善以下信息,我们会尽快与您联系!
论文投稿
参加会议
合作办会
期刊合作
论文辅导
科研绘图
论文翻译润色
论文查重
其他
提交
专家招募
个人信息
联系信息
提交
在线客服
商务合作
专家招募
常见问题
手机端
扫描二维码
与学术大咖共探知识边界
出版无忧
投稿无忧
翻译服务
润色服务
自助查重
排版校对
科研绘图