gemini 是一种多模态 ai,能够整合来自不同来源的信息。谷歌deepmind创始人兼首席执行官demis hassabis表示,这种能力意味着它可以“概括和无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频”。
根据谷歌的说法,gemini 将向所有人开放。第一个版本,谷歌称之为gemini 1.0,将有三个不同的版本:
- gemini ultra – “最有能力”的模型,用于“高度复杂的任务”。
- gemini pro — 跨范围任务扩展的“最佳模型”。
- gemini nano — 用于设备上的任务。
gemini 旨在适用于所有设备类型,从智能手机和 pc 到数据中心。
双子座更胜一筹,谷歌说
谷歌声称 gemini 的性能超过了其主要竞争对手 gpt-4。据该公司称,gemini ultra 在 32 个“广泛使用的学术基准”中的 30 个中成功击败了 gpt-4。
在许多列出的基准中,差异很小。gemini 在 math 基准测试中得分为 53.2%,比 gpt-4 高 0.3%。唯一具有明显领先优势的基准测试是 humaneval python 代码生成。根据谷歌的数据,gemini 在基准测试中得分为 74.4%,gpt-4 仅为 67.0%。
双子座打破了多模态模式的现状。到目前为止,单独的组件被训练,然后合并在一起。谷歌表示,它已经通过从一开始就对 gemini 进行不同模态的预训练,将其训练为原生多模态。
根据hassabis的说法,这提高了ai的理解,“远远优于现有的多模态模型”。
谷歌训练双子座“同时识别和理解文本、图像、音频等”。这使得它更适合理解信息并为问题提供答案,甚至是复杂的问题。
双子座在编码方面也装备精良。据谷歌称,它“可以理解、解释和生成世界上最流行的编程语言的高质量代码”。
谷歌承诺,gemini 是“以责任和安全为核心的”。
该公司计划将gemini pro集成到google产品中。从今天开始,google bard 将使用“gemini pro 的微调版本”。该升级当时仅提供英文版本,但根据谷歌的说法,该升级在 170 多个国家和地区提供。
gemini nano 即将登陆 google pixel 8 pro。它将具有新工具,例如 recorder ap 中的 summarizer、gboard 中的 smart reply 等。
gemini 将集成到其他 google 产品中,包括 chrome 网络浏览器、搜索、广告和 duet ai。
从 12 月 13 日起,开发者和企业客户可以通过 google ai studio 中的 gemini api 访问 gemini pro。
未经允许不得转载:尊龙游戏旗舰厅官网 » 谷歌的目标是用这个人工智能将 chatgpt 抛在后面